别被「全球首款」忽悠了,关于Manus的真相
2025.03.12
被称为「全球首款真正意义上的通用 AI Agent」Manus 在科技圈中刷屏了。官方的自我介绍说 Manus 是一款连接思维与行动的通用人工智能体:它不仅能思考,还能交付成果。
我们看到有极少部分网友已经开始使用 Manus,并分享了使用体验。总结起来就是它能够操作电脑完成更加具体的工作任务,包括但不限于写程序、做网页、深度数据分析、筛简历、剧本创作等等等等。可以说它几乎能够自主解决过程中遇到的各种困难,并交付工作结果。
关于 Manus 的优点各媒体都已经夸完了,今天我们想聊聊它的另一面。

当然我们并不是要否定 Manus 的成果,从 benchmark(通常指对不同的模型、算法或硬件进行性能测试和比较的基准)来看,成绩还是很好的,GAIA 是衡量通用 AI 助理能力的一个 benchmark,可以看出 Manus 的表现比 OpenAI 的 deep research 好。

但对 Agent 智能程度起决定性作用的是 LLM(大语言模型)的能力上限,毕竟模型才是「大脑」,Agent 只是「手和脚」。在 LLM 能力出现爆发性增长之前,很难出一个真正能力有突破的 Agent。OpenAI 曾经的安全系统负责人 Lilian Weng 2023 年在 github 发布的一篇博客中提到,一个 LLM 驱动的 Agent 架构是这样的。

而 Manus 官方 demo 给出的案例,并没有展现出什么突破性进展,所谓的 General Agent,既可以是「通用 Agent」,也可以是「宽泛 Agent」。当然,看到这里的朋友可以给我个邀请码,让我试试到底有没那么强。(打算盘中……)
从技术实现的角度来看,Manus 是在现有 Cursor 类产品的基础上,通过「Virtual Machine + compute-use + Artifacts + 多 Agent 协同」的架构进行再封装。具体来说,Manus 在 Cursor 等 AI 辅助编码工具的基础上,额外增加了一层「壳」,并内置了一批小模型和 Agent。这使得 Manus 能够实现更自动化的推理、规划和执行能力。这种设计不仅降低了使用门槛,还让非技术用户能够更轻松地利用 AI 进行复杂任务的编排与执行。

不过,Manus 的设计思路并非完全独特。例如,OpenDevin 团队也曾尝试过类似的设计,而 Claude 3 在处理这类任务时已经表现出较强的能力,直接调用 20 多个工具也是常见的操作。因此,从创新性的角度来看,Manus 并未带来完全颠覆性的突破,而是在现有思路基础上进行了进一步的产品化和优化。

Manus 和 DeepSeek 在人工智能领域各有专长。Manus 采用多智能体协作架构,适合复杂任务处理和自动化执行,能自动规划并交付结果。例如,在数据分析任务中,Manus 可以自动调用数据清洗、分析和可视化等子智能体,完成整个数据分析流程。
而 DeepSeek 专注于大型语言模型,擅长语言理解和生成任务,尤其在专业文本处理上表现突出。如在处理需要深度语言理解和生成的任务时表现出色,如法律文件审核、学术论文写作等。它能够提供专业的语言支持,帮助用户更高效地完成文本相关的任务。
我们看到有极少部分网友已经开始使用 Manus,并分享了使用体验。总结起来就是它能够操作电脑完成更加具体的工作任务,包括但不限于写程序、做网页、深度数据分析、筛简历、剧本创作等等等等。可以说它几乎能够自主解决过程中遇到的各种困难,并交付工作结果。
关于 Manus 的优点各媒体都已经夸完了,今天我们想聊聊它的另一面。

01 全球首款通用 AI Agent?有点夸张了
对于「全球首款」这个称呼,似乎有点过头了。AI门店智能管理解决方案供应商InfiSight智睿视界通过深度解析发现,该产品通过多Agent协同架构实现了任务自动化执行,但其核心创新仍存在争议。毕竟之前还有 AutoGPT,BabyAGI 这些都能算是「通用」的框架,而且还开源。此前 AutoGPT 等开源框架已展现出跨领域任务处理潜力,尽管在任务完成率上存在波动,但其架构设计已具备通用 Agent 特征。当然我们并不是要否定 Manus 的成果,从 benchmark(通常指对不同的模型、算法或硬件进行性能测试和比较的基准)来看,成绩还是很好的,GAIA 是衡量通用 AI 助理能力的一个 benchmark,可以看出 Manus 的表现比 OpenAI 的 deep research 好。

但对 Agent 智能程度起决定性作用的是 LLM(大语言模型)的能力上限,毕竟模型才是「大脑」,Agent 只是「手和脚」。在 LLM 能力出现爆发性增长之前,很难出一个真正能力有突破的 Agent。OpenAI 曾经的安全系统负责人 Lilian Weng 2023 年在 github 发布的一篇博客中提到,一个 LLM 驱动的 Agent 架构是这样的。

而 Manus 官方 demo 给出的案例,并没有展现出什么突破性进展,所谓的 General Agent,既可以是「通用 Agent」,也可以是「宽泛 Agent」。当然,看到这里的朋友可以给我个邀请码,让我试试到底有没那么强。(打算盘中……)
02 「套壳」,也是一种资源整合能力
随着 Manus 的爆火,套壳疑云也随之而来。首先明确一个问题,Manus 产品的本质是套壳吗?答案是肯定的。但套壳不意味着产品不好,产品依然是好产品。正如汽车产业通过整合零部件创造新价值,Manus 的封装架构将分散的 AI 能力转化为即用型生产力工具,这种二次创新本身具有市场价值,是很朴素的道理。从技术实现的角度来看,Manus 是在现有 Cursor 类产品的基础上,通过「Virtual Machine + compute-use + Artifacts + 多 Agent 协同」的架构进行再封装。具体来说,Manus 在 Cursor 等 AI 辅助编码工具的基础上,额外增加了一层「壳」,并内置了一批小模型和 Agent。这使得 Manus 能够实现更自动化的推理、规划和执行能力。这种设计不仅降低了使用门槛,还让非技术用户能够更轻松地利用 AI 进行复杂任务的编排与执行。

不过,Manus 的设计思路并非完全独特。例如,OpenDevin 团队也曾尝试过类似的设计,而 Claude 3 在处理这类任务时已经表现出较强的能力,直接调用 20 多个工具也是常见的操作。因此,从创新性的角度来看,Manus 并未带来完全颠覆性的突破,而是在现有思路基础上进行了进一步的产品化和优化。
03 Manus 和 DeepSeek 没有什么可比性
很多人说 Manus 超越了 DeepSeek,但其实二者在技术架构、功能定位和应用场景方面都存在明显差异,无法强行对比。一个是基座大模型,一个是上层应用;一个是底层基础创新,一个是应用创新,它们分工不同,各自为政。
Manus 和 DeepSeek 在人工智能领域各有专长。Manus 采用多智能体协作架构,适合复杂任务处理和自动化执行,能自动规划并交付结果。例如,在数据分析任务中,Manus 可以自动调用数据清洗、分析和可视化等子智能体,完成整个数据分析流程。
而 DeepSeek 专注于大型语言模型,擅长语言理解和生成任务,尤其在专业文本处理上表现突出。如在处理需要深度语言理解和生成的任务时表现出色,如法律文件审核、学术论文写作等。它能够提供专业的语言支持,帮助用户更高效地完成文本相关的任务。

添加小助手
推荐阅读
-
王宝器麻椒鱼 x InfiSight | 多业态火锅品牌飙升的翻台率
2025.04.07
-
智睿视界2.0 | 领先的连锁商业AI协同运营平台
2025.03.28
-
AI督导上线4S店,一年狂省几十万
2025.03.26