中國AI的創新正在讓全世界更加關注中國的科技和市場。
智能體(Agent)正在持續推高AI應用的行業熱度。上周,Manus的爆火引發了行業對智能體(Agent)的高度關注,北京時間3月12日,OpenAI舉行了一個19分鐘的線上發布會,發布了一系列專為構建AI Agent設計的新工具與API,幫助開發者更易創建能自動完成任務的AI Agent。
人工智能行業內,Agent并非新鮮事物,但此前Manus及其復現產品的熱度,將Agent概念普及給更廣泛的群體,吸引開發者群體的加入,加上本周OpenAI的工具包更新,既展現了AI智能體在復雜任務處理中的突破性進展,也驗證了頭部機構對Agent作為下一代生產力工具的布局共識,有望推動行業進入規?;瘧锰剿餍码A段。
業內人士怎么看?
在這個時間點更新Agent工具包,OpenAI官方發文稱:團隊在過去一年引入新模型功能,包括高級推理、多模態交互和新安全技術等,這些功能為模型處理構建智能體所需的復雜、多步驟任務奠定了基礎。但同時,有客戶表示,將這些功能轉化為生產就緒的Agent存在挑戰性,通常需要大量的提示迭代和自定義編排邏輯,而沒有足夠的可見性或內置支持。為了應對這些挑戰,OpenAl推出了一組新API和工具,專門用于簡化Agent應用程序的開發。
此次OpenAI發布產品包括新的Responses API:兼具Chat Completions API的簡單性和Assistants API的工具使用能力,用于構建Agent;包括網頁搜索、文件搜索和 Computer-Using Agent等內置工具:用于編排單Agent和多Agent工作流程的新Agents SDK:用于跟蹤和檢查Agent工作流程的執行情況的新Agents SDK。
對于此次OpenAI在Agent方面的更新,此前成功復現Manus的Camel-AI.org核心成員李國豪對記者表示,整體來看,OpenAI此次發布的工具包,核心訴求是希望實現AI框架的統一,但在行業內幾乎不可能,因為不同框架在不同場景有不同意義。但Anthropic發布的MCP協議可以讓框架是否不再重要,協議成為最應該統一的部分,從這個角度來看,李國豪認為OpenAI“輸了”。
所謂MCP,是由Anthropic于2024年11月底推出的一種開放標準協議,旨在統一大型語言模型(LLM)與外部數據源和工具之間的通信。它通過標準化接口,使LLM能夠安全、高效地訪問外部資源,從而擴展其功能。簡單來說,MCP一端連接大模型,一端連接應用,使大模型能力真正能夠落地實現。
但目前MCP在行業內并非普及性技術,不同廠商與平臺有自身的選擇。以Manus為例,此前Manus 聯合創始人季逸超公開披露產品底座與技術細節,稱Manus并未使用MCP協議,理由是“Manus早在MCP推出之前就開始開發了”。
而后期成功復現Manus的兩個團隊——MetaGPT算法研究員梁新兵對記者表示,MCP未來將成為主流;李國豪也看好MCP的前景。此前,李國豪在錦秋基金分享會上表示,過去行業缺乏統一標準,各自為戰。標準化帶來的最大變化是框架間工具調用壁壘逐漸消失,例如LangChain(一款開源AI 框架)過去靠豐富的工具生態占優勢,但MCP成熟后,各個框架都能輕松調用工具,LangChain的優勢將不再突出。李國豪對記者表示,相較AI框架,協議才是應該統一的東西。
中國創新帶動全球應用熱度
近期,以Manus為代表的Agent持續刷屏,成功復現的OpenManus與OWL也持續引發關注,這背后,是AI滿足了當下大眾對于智能落地的真需求。
當參與者足夠多,OpenAI的“神秘面紗”也不復存在。李國豪直接將Manus總結為虛擬機掛載、Todo List、瀏覽器操作、命令行調用四部分。在實現方式上,Manus 有兩個明顯優勢值得借鑒:利用文件系統管理上下文并實現信息持久化,以及充分運用 Ubuntu 虛擬機的命令行工具,通過命令行安裝依賴、執行代碼及管理文件等。
但同時,李國豪也認為一旦未來開始大規模應用,Manus將面臨資源消耗、大模型調用成本高昂、穩定性與擴展性問題等挑戰。此前季逸超披露,Manus目前使用的大模型是Claude與阿里旗下不同的Qwen微調模型。以Claude 3.5為例,該模型性能強且對計算工具調用做過專門優化,但成本昂貴,大規模開放難以有效控制成本,這可能也是Manus采用邀請碼機制的原因之一。
Manus的爆火將Agent概念在行業內普及開來,但實際上,Agent早已不是新鮮事物,OpenAI創始人 Sam Altman (山姆·奧爾特曼)也在2023年5月表示將更加關注如何使用聊天機器人創建自主 AI Agent。2025年1月23日,OpenAI對外發布其首款AI智能體產品Operator。
談及Operator與Manus的區別,李國豪對記者表示,Operator只操控瀏覽器,而 Manus 不僅能操控瀏覽器,還能掌控終端(terminal)。正如官方宣傳所言:Manus 給 Agent 配備了一臺完整的電腦,瀏覽器只是其中一部分,終端命令行同樣可用。另外從產品形態看,李國豪也認為Manus 明顯領先于 Operator,后者僅實現了瀏覽器操作,而 Manus 的產品形態更全面。
對于當下迅速迭代發展的AI格局,天風研究所傳媒互聯網首席分析師孔蓉表示,中國AI的創新正在讓全世界更加關注中國的科技和市場。接下來,中國AI需要“過三關”。第一個階段是DeepSeek的推出帶來的高估值;其次是阿里巴巴財報確認了趨勢;第三階段是AI應用——這也是目前全球AI產業界的課題,在資本花了那么多錢后,AI的應用到底在哪?爆款的應用什么時候會出現?Manus在GAIA評分測試中比OpenAI的最新Deep Research評分結果表現更加優秀??兹卣J為,Manus給市場帶來了信心,也意味著中國AI的第三階段開始,標志著未來更多產品的百花齊放。