Manus 沒(méi)有 DeepSeek V3/R1 般驚艷,更多是融合 MCP 和 Operator 的技術(shù)炒作。
在 Deepseek 發(fā)布開(kāi)源 5+1 日后,Manus 接上了世界通往 AGI 之路的大旗,嗎?
在仔細(xì)觀摩其產(chǎn)品細(xì)節(jié)后,大家可能是把 Manus 日期記錯(cuò)了,去年 10 月 22 日定義成發(fā)布日剛剛好,那天是 Anthropic Claude 發(fā)布其?computer use?的好日子,換句話說(shuō),LLM 跳出 ChatBot 的日子,成為在網(wǎng)絡(luò)空間游蕩、試探的 Agent 的誕生日,只不過(guò) OpenAI 的 Operator 要到 2025 年 1 月才真正出生。
概念有些多,我們來(lái)逐步拆解,用 CoT(思維鏈)的方式一窺 Manus 究竟是什么。
通往對(duì)話框之外的道路,是由授權(quán)鋪就的。
OpenAI 偉大之處不在于 GPT,Transfomer 范式是谷歌發(fā)明的,真正創(chuàng)新在于將 Chat 作為人機(jī)交互的第一入口,我們可以將其理解為一個(gè)智能的數(shù)據(jù)庫(kù),可以大體上回答你的任意問(wèn)題,但是更多強(qiáng)調(diào)是“解惑”而非“幫你解惑”,比如你可以問(wèn) ChatGPT 如何治療感冒,GPT 可以按照不同情況列出答案,但是無(wú)法具體診斷,也無(wú)法下單買藥。
從這個(gè)意義上而言,DeepSeek 的價(jià)值在于讓模型更聰明(DeepSeek V3),并且加強(qiáng)診斷能力(DeepSeek R1),能判斷出究竟是病毒性感冒,還是天氣轉(zhuǎn)涼凍的。
但是 AI 依然無(wú)法幫你買藥,此時(shí)的 GPT 完全體被封印在對(duì)話框內(nèi),我們希望將其釋放出來(lái)。
Computer Use 便應(yīng)運(yùn)而生,從路徑設(shè)計(jì)上而言,其和最簡(jiǎn)單的鍵鼠精靈、蘋果捷徑和 Apple Script 等外在形式類似,即都是替代人手+鍵盤、鼠標(biāo)(或屏幕點(diǎn)擊)的操作,但內(nèi)在不同,你不需要自定義腳本規(guī)則,只需要通過(guò)對(duì)話方式,命令 Claude 進(jìn)行對(duì)應(yīng)的操作。
此時(shí),AI 可以幫你打開(kāi)瀏覽器,輸入美團(tuán)地址,并進(jìn)行搜尋感冒藥,但新的問(wèn)題也會(huì)出現(xiàn),AI 需要你的美團(tuán)賬號(hào),才能定位離你最近的藥店。
我們需要在底層給予 AI 更多的權(quán)限。
這也是 Anthropic 發(fā)布 MCP(Model Context Protocol),即模型上下文協(xié)議,以及 OpenAI 推出 Operator 的必要之舉,LLM 內(nèi)部的優(yōu)化已經(jīng)達(dá)到局部最優(yōu),現(xiàn)在需要讓 AI/LLM 動(dòng)起來(lái),LLM 和 LLM 需要互相調(diào)用,LLM 和外部 API 需要互相融合,LLM 和人類也需要進(jìn)一步協(xié)作。
先簡(jiǎn)單聊一下 MCP,之后會(huì)出文章詳細(xì)解釋。
MCP 的價(jià)值在于希望構(gòu)建 LLM 時(shí)代的通用 API/SDK 框架,MCP 希望能規(guī)范 AI 模型和其他應(yīng)用之間的溝通格式,比如 Claude/OpenAI/DeepSeek 都用相同的格式調(diào)用代碼補(bǔ)全或者創(chuàng)建美團(tuán)買藥的規(guī)則,如此一來(lái),無(wú)論用戶使用的是什么模型,美團(tuán)都只需配置相同的接口。
這并不意味著 OpenAI/DeepSeek 或者美團(tuán)都必須遵守 Anthropic 的具體規(guī)則,但是可以參考來(lái)設(shè)計(jì),如同 ONNX(開(kāi)放神經(jīng)網(wǎng)絡(luò)交換,Open Neural Network Exchange) 一樣,模型的泛濫自然需要對(duì)應(yīng)協(xié)作標(biāo)準(zhǔn)。
但是不管用誰(shuí),都需要用戶告知其自己的美團(tuán)賬號(hào)密碼,以及給予支付寶授權(quán),并且接管呼叫系統(tǒng),以此完成定位、下單、接打快遞員電話的流程,最終你需要下樓去快遞柜拿藥,暫時(shí) AI 還不能替你跑腿,具身智能機(jī)器人還需要時(shí)間。
DeepSeek 的意義在于極低成本的前提下,LLM 變得更為聰明,并且中文推理能力遠(yuǎn)超同行,這是其在技術(shù)和產(chǎn)品上的偉大意義,更不要說(shuō)開(kāi)源模式讓 AI 更為接地氣。
這里就是 Manus 的取巧之處,Manus 并不是 OpenAI 的 Operator,或者遵循 Anthropic 的 MCP 規(guī)則,相當(dāng)于重新發(fā)明了一次輪子。
當(dāng)然,中國(guó)人也需要在模型標(biāo)準(zhǔn)方面有所建樹(shù),不能再走操作系統(tǒng)和芯片的老路,但是這跟所謂的 AGI 沒(méi)有太多關(guān)系,因?yàn)槠駷橹箾](méi)看到 Manus 的基座大模型是什么,如果是自研的、更智能的大模型,那確實(shí)可喜可賀。
跨鏈橋的對(duì)手不是鏈抽象,而是 CEX;AI Agent 的敵人不是智能體,而是錢包。
在 Manus 靠媒體、內(nèi)測(cè)碼和同名幣刷屏之后,真真假假辟謠中,Web3 AI agent 也躍躍欲試,Virtuals 宣布集成 Enso Shortcuts,方便用戶一鍵交互,目前支持 200 個(gè)協(xié)議。
開(kāi)心的一面是,Web3 AI Agent 開(kāi)始越過(guò)模型之爭(zhēng),老老實(shí)實(shí)向真正的用戶需求邁進(jìn),但是顯然,Web 2 老問(wèn)題依舊會(huì)存在,支持哪一種協(xié)議標(biāo)準(zhǔn)?
以跨鏈橋?yàn)槔?,LayerZero 通過(guò)數(shù)年努力,才基本成為事實(shí)上的行業(yè)標(biāo)準(zhǔn)協(xié)議,但是依然無(wú)法打通全部場(chǎng)景,無(wú)他,CEX 尤其是幣安才是最方便的資產(chǎn)跨鏈橋,而鏈間消息通信并不是當(dāng)前痛點(diǎn)。
而 Web3 AI Agent 的最重要嘗試方向是建立用戶、自身和 Uniswap / Hyperliquid 之間的聯(lián)系,也就是 AI Agnet 要成為事實(shí)上的中間人、私鑰持有人或者托管方,否則,用戶體驗(yàn)無(wú)法和現(xiàn)有基建耦合出的錢包+DEX 體驗(yàn)相媲美,更遑論去跟 CEX 搶市場(chǎng)。
這樣說(shuō),并不是否定 DeFAI 的前景,而是指出其真實(shí)存在的障礙——并不是智能程度,而是如何取得用戶信任的問(wèn)題,Manus 需要和 MCP、Operator 搶標(biāo)準(zhǔn)定義權(quán),那么 DeFAI 項(xiàng)目方也需要有如此覺(jué)悟。
所有的 AI Agent 項(xiàng)目都要堅(jiān)持長(zhǎng)期主義,不斷的迭代和試錯(cuò),才能等到自己的初始用戶,事實(shí)上,DeFAI 的對(duì)手是錢包這一產(chǎn)品形態(tài),而非其他的智能體。
如同行業(yè)存在托管錢包和非托管錢包兩種范式,AI Agent 現(xiàn)在最大的問(wèn)題在于策略乏力和資金安全,資金安全如前所述,而策略在于用戶授權(quán)之后,即使用戶敢于授權(quán)給 Agent,也需要面臨策略設(shè)置的問(wèn)題,一句話,AI 幫用戶理財(cái),究竟可靠與否?
Web3 AI Agent 目前的模型和框架之爭(zhēng)尚未分出勝負(fù),更近一步的策略優(yōu)化,還未有項(xiàng)目真正的投入實(shí)用,馬斯克曾經(jīng)暢想的 Robotaxi 目前還在路上,AI 理財(cái)大師何時(shí)能進(jìn)入每個(gè)幣圈錢包內(nèi)?
必須強(qiáng)調(diào),本文不是對(duì) Manus 的否定,畢竟工作流(Workflow)+ Claude + Cursor 已經(jīng)足夠好用,再多一點(diǎn)也無(wú)妨,AI 大泡沫你不吃,別人也會(huì)吃。
本文也不適對(duì) Web3 AI Agent 的否定,畢竟熬夜看盤+看管私鑰+ Safe 不出錯(cuò)也足夠安全,能讓 DeFAI 替人 PVP 也可以拯救熬夜的青春。
只是有一點(diǎn),都不要造假,造假鼻子會(huì)變長(zhǎng)。
登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。