中国AI的创新正在让全世界更加关注中国的科技和市场。
智能体(Agent)正在持续推高AI应用的行业热度。上周,Manus的爆火引发了行业对智能体(Agent)的高度关注,北京时间3月12日,OpenAI举行了一个19分钟的线上发布会,发布了一系列专为构建AI Agent设计的新工具与API,帮助开发者更易创建能自动完成任务的AI Agent。
人工智能行业内,Agent并非新鲜事物,但此前Manus及其复现产品的热度,将Agent概念普及给更广泛的群体,吸引开发者群体的加入,加上本周OpenAI的工具包更新,既展现了AI智能体在复杂任务处理中的突破性进展,也验证了头部机构对Agent作为下一代生产力工具的布局共识,有望推动行业进入规模化应用探索新阶段。
业内人士怎么看?
在这个时间点更新Agent工具包,OpenAI官方发文称:团队在过去一年引入新模型功能,包括高级推理、多模态交互和新安全技术等,这些功能为模型处理构建智能体所需的复杂、多步骤任务奠定了基础。但同时,有客户表示,将这些功能转化为生产就绪的Agent存在挑战性,通常需要大量的提示迭代和自定义编排逻辑,而没有足够的可见性或内置支持。为了应对这些挑战,OpenAl推出了一组新API和工具,专门用于简化Agent应用程序的开发。
此次OpenAI发布产品包括新的Responses API:兼具Chat Completions API的简单性和Assistants API的工具使用能力,用于构建Agent;包括网页搜索、文件搜索和 Computer-Using Agent等内置工具:用于编排单Agent和多Agent工作流程的新Agents SDK:用于跟踪和检查Agent工作流程的执行情况的新Agents SDK。
对于此次OpenAI在Agent方面的更新,此前成功复现Manus的Camel-AI.org核心成员李国豪对记者表示,整体来看,OpenAI此次发布的工具包,核心诉求是希望实现AI框架的统一,但在行业内几乎不可能,因为不同框架在不同场景有不同意义。但Anthropic发布的MCP协议可以让框架是否不再重要,协议成为最应该统一的部分,从这个角度来看,李国豪认为OpenAI“输了”。
所谓MCP,是由Anthropic于2024年11月底推出的一种开放标准协议,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信。它通过标准化接口,使LLM能够安全、高效地访问外部资源,从而扩展其功能。简单来说,MCP一端连接大模型,一端连接应用,使大模型能力真正能够落地实现。
但目前MCP在行业内并非普及性技术,不同厂商与平台有自身的选择。以Manus为例,此前Manus 联合创始人季逸超公开披露产品底座与技术细节,称Manus并未使用MCP协议,理由是“Manus早在MCP推出之前就开始开发了”。
而后期成功复现Manus的两个团队——MetaGPT算法研究员梁新兵对记者表示,MCP未来将成为主流;李国豪也看好MCP的前景。此前,李国豪在锦秋基金分享会上表示,过去行业缺乏统一标准,各自为战。标准化带来的最大变化是框架间工具调用壁垒逐渐消失,例如LangChain(一款开源AI 框架)过去靠丰富的工具生态占优势,但MCP成熟后,各个框架都能轻松调用工具,LangChain的优势将不再突出。李国豪对记者表示,相较AI框架,协议才是应该统一的东西。
中国创新带动全球应用热度
近期,以Manus为代表的Agent持续刷屏,成功复现的OpenManus与OWL也持续引发关注,这背后,是AI满足了当下大众对于智能落地的真需求。
当参与者足够多,OpenAI的“神秘面纱”也不复存在。李国豪直接将Manus总结为虚拟机挂载、Todo List、浏览器操作、命令行调用四部分。在实现方式上,Manus 有两个明显优势值得借鉴:利用文件系统管理上下文并实现信息持久化,以及充分运用 Ubuntu 虚拟机的命令行工具,通过命令行安装依赖、执行代码及管理文件等。
但同时,李国豪也认为一旦未来开始大规模应用,Manus将面临资源消耗、大模型调用成本高昂、稳定性与扩展性问题等挑战。此前季逸超披露,Manus目前使用的大模型是Claude与阿里旗下不同的Qwen微调模型。以Claude 3.5为例,该模型性能强且对计算工具调用做过专门优化,但成本昂贵,大规模开放难以有效控制成本,这可能也是Manus采用邀请码机制的原因之一。
Manus的爆火将Agent概念在行业内普及开来,但实际上,Agent早已不是新鲜事物,OpenAI创始人 Sam Altman (山姆·奥尔特曼)也在2023年5月表示将更加关注如何使用聊天机器人创建自主 AI Agent。2025年1月23日,OpenAI对外发布其首款AI智能体产品Operator。
谈及Operator与Manus的区别,李国豪对记者表示,Operator只操控浏览器,而 Manus 不仅能操控浏览器,还能掌控终端(terminal)。正如官方宣传所言:Manus 给 Agent 配备了一台完整的电脑,浏览器只是其中一部分,终端命令行同样可用。另外从产品形态看,李国豪也认为Manus 明显领先于 Operator,后者仅实现了浏览器操作,而 Manus 的产品形态更全面。
对于当下迅速迭代发展的AI格局,天风研究所传媒互联网首席分析师孔蓉表示,中国AI的创新正在让全世界更加关注中国的科技和市场。接下来,中国AI需要“过三关”。第一个阶段是DeepSeek的推出带来的高估值;其次是阿里巴巴财报确认了趋势;第三阶段是AI应用——这也是目前全球AI产业界的课题,在资本花了那么多钱后,AI的应用到底在哪?爆款的应用什么时候会出现?Manus在GAIA评分测试中比OpenAI的最新Deep Research评分结果表现更加优秀。孔蓉认为,Manus给市场带来了信心,也意味着中国AI的第三阶段开始,标志着未来更多产品的百花齐放。
暂无评论内容