作者:jolestar 來源:X,@jolestar
上周倒騰了一下 AI Agent,前天參加了 ai16z 在北京的活動,想看看 AI Agent 現(xiàn)在實際上能干啥,思考一下它未來能干啥。
AI Agent 的現(xiàn)狀讓我想起那個梗圖,自動售貨機里面藏了個人。大家已經(jīng)想象中的 AI Agent 已經(jīng)開始擁有自主意識了,但實際上的 AI Agent 里面其實藏了個開發(fā)者。(這里大家腦補畫面,我嘗試讓 AI 生成這個圖片,發(fā)現(xiàn) AI 不能理解“藏”)
AI Agent 框架當(dāng)前扮演一個粘合劑的作用,把 client(Twitter,Discord,Telegram 等) 和各種插件(各鏈等)粘合起來,然后框架提供一個基礎(chǔ)庫(記憶存儲,會話隔離,上下文生成)等,后面對接各種 AI 平臺接口。
從去年 AI 火爆以來,各種平臺和工具涌現(xiàn),最關(guān)鍵就是要解決一個問題,AI 如何和應(yīng)用結(jié)合。有 AI 平臺嘗試提供插件的方式,有的打造工作流模型,也有傳統(tǒng)應(yīng)用在應(yīng)用內(nèi)嵌入 AI 的方式。但這里面的關(guān)鍵是: 1. 應(yīng)用的交互入口在哪里?2. AI 如何和現(xiàn)有業(yè)務(wù)邏輯結(jié)合。
各 AI 平臺給用戶提供的應(yīng)用的交互入口都是一個類似聊天窗口的對話框,顯然大家都認為和 AI 應(yīng)用的交互方式應(yīng)該是一種“擬人”的方式。而這點上 AI Agent 聰明之處在于它直接接入了所有的開放 IM 以及社交系統(tǒng),顯然比新搞一個更容易接受。
AI 如何和現(xiàn)有業(yè)務(wù)邏輯結(jié)合。AI Agent 提供的方案是讓開發(fā)者把 AI 的決策融入到業(yè)務(wù)場景中。編程語言需要確定性,if 的條件只能是 true 或者 false,無法處理模糊的業(yè)務(wù)邏輯。而通過 AI 可以將復(fù)雜的邏輯轉(zhuǎn)換成精確的條件,然后就可以無縫融入到業(yè)務(wù)場景中去了。
比如群內(nèi)回復(fù)消息這個功能,傳統(tǒng)的 IM Bot 需要通過一些明確的消息指令才能觸發(fā),而通過 AI 可以實現(xiàn)一個方法 shouldReplyMessage,給他上下文,它返回 true or false。
AI 在業(yè)務(wù)邏輯場景中的作用主要是:
1. “意圖”發(fā)現(xiàn):通過提示詞中的說明,讓 AI 根據(jù)上下文發(fā)現(xiàn)用戶文本消息中的“意圖”,把意圖映射到具體的代碼。
2. 協(xié)助決策:通過 AI 將模糊的復(fù)雜條件轉(zhuǎn)換成確定的 true/false 或者枚舉類型,然后結(jié)合到業(yè)務(wù)邏輯中去。
看到這里,很多人可能對 AI Agent 要失望了,很多人以為的 AI Agent 就是教一下 AI 它就啥都會了。實際上因為大模型的上下文限制的難題,沒辦法(至少當(dāng)前)打造一個萬能的 AI,讓它可以干任何事情。但好消息是程序員不用擔(dān)心失業(yè)了,AI 后面還是需要藏著大量的程序員,還需要有人來堆 if else,但關(guān)鍵的區(qū)別是程序可以處理的業(yè)務(wù)邊界在擴展。
在活動上,問了 @shawmakesmagic 一個問題,市場對 AI Agent 有兩種期望,1. AI Agent 自己扮演一個角色,有自己的? ID,品牌,給用戶提供服務(wù)。2. 用戶有個人 AI Agent,相當(dāng)于個人助手,可以協(xié)助用戶處理一些業(yè)務(wù)。這兩種 AI Agent 哪種會更受歡迎?他覺得兩個方向都會不錯,也有可能結(jié)合起來。
現(xiàn)在市面上大家主要探索的還是第一個方向。這個方向類似于服務(wù) AI Agent 化,未來可能沒有 App 界面了,App 都 AI Agent 化了,擬人化了。而第二個方向則是應(yīng)用客戶端的 Agent 化,未來的應(yīng)用客戶端會是助手 Agent 的一個插件,應(yīng)用本地數(shù)據(jù)變成了 Agent 記憶庫的一部分,同時這個插件也負責(zé)和云端的服務(wù) Agent 溝通。而這是一種新的應(yīng)用架構(gòu)模式,會改變整個基礎(chǔ)設(shè)施。
1. 基礎(chǔ)設(shè)施要實現(xiàn)無準(zhǔn)入門檻(Permissionless),不然 AI Agent 會被各種防攻擊策略限制,服務(wù)應(yīng)該用經(jīng)濟成本的方式(Gas)防攻擊。這點上開放程度比較差的平臺會面臨比較大的沖擊,當(dāng)年 Web2 初期的開放平臺熱會重新被點燃。
2. AI Agent 需要能操作資金來付費,用以解決上面的問題。
也就是說,未來的服務(wù),無論是否是基于區(qū)塊鏈的,都需要支持 Crypto 的私鑰模式的身份驗證以及基于 Crypto 的支付。
除了上面提到的兩點,AI Agent 如何和鏈結(jié)合是大家正在探索的一個方向。在活動上,和 @Mikkke_acc 聊它正在搞的 focEliza。前面提到的兩種 AI Agent,至少第一種是需要鏈提供的運行或者驗證環(huán)境。因為一旦一個 AI Agent 對外提供服務(wù),就會有信任問題,它所扮演的角色實際和智能合約一樣。
關(guān)于“智能合約”這個名字當(dāng)年有個爭議,它只是一段代碼,哪里“智能”了,AI 可以讓智能合約名副其實。難題是智能合約環(huán)境中如何調(diào)用 AI 接口。如果說讓大模型運行在一個可驗證的環(huán)境中這條路還比較遠,用類似 Oracle 的方案是更切實可行的路徑。
而圍繞著 AI Agent 會衍生出非常多的需求,AI Agent 的公共知識如何獲?。緼I Agent 如何對事實進行判定?AI Agent 如何識別不同平臺上的同一個用戶?智能合約中的“記憶”如何存儲?如果我有多個設(shè)備,各裝了一個 AI Agent,它們?nèi)绾喂蚕碛洃洠?/p>
你就會發(fā)現(xiàn)原來 Web3 中搞過的“數(shù)據(jù)上鏈”,關(guān)系上鏈,DID,P2P 網(wǎng)絡(luò)等等,都有新的意義和場景。
復(fù)用我 21 年一次關(guān)于 AI 和區(qū)塊鏈分享的結(jié)語,對 AI 更友好的互聯(lián)網(wǎng),也是對人類更友好的互聯(lián)網(wǎng)。那時候還只是個腦洞,但現(xiàn)在未來已來。
登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。