自OpenAI的ChatGPT问世以来,全球AI市场迎来井喷式的爆发,各类新的AI应用层出不穷,而今年年初又有一枚核弹级的AI应用问世,也就是深度求索公司的DeepSeek。凭借开源、免费、低成本、本地化部署等特性,其短时间内就在100多个国家登上免费应用下载排行榜第一名,一个月下载量破1.1亿,周活跃用户高达9700万,同时,不但众多政府公共部门将其接入系统,企业单位也是迅速跟进,截至2月20日,已有超200家企业宣布接入DeepSeek。
DeepSeek的火热从春节前开始一直持续到今天还未停歇,是各类热搜榜单的常客,就连今年的全国两会其也被重点提及,成为人大代表们讨论的核心之一。而就在3月6日,又一枚AI核弹轰然落地,中国创业公司Monica发布了全球首款通用AI Agent(自主智能体)——Manus,据该团队介绍,Manus在GAIA基准测试(评估通用AI助手解决真实世界问题的能力)中取得了SOTA的成绩,其性能超越了OpenAI的同层次大模型,其中SOTA是“State-of-the-Art”的缩写,指某一领域或技术中当前最高水平的研究成果或技术方案。
Manus测试分数
与传统AI助手不同,Manus不仅能提供建议或答案,还能直接交付完整的任务成果,用一个简单的比喻来说,DeepSeek就像是人类的第二大脑,可以帮助参谋辅助决策,而Manus则像是人类的第二双手脚(Manus在拉丁文里也象征着手),可以直接代替人们做事。
演示视频中,展示了Manus应用的三个实际场景:用户上传包含多个简历的压缩包,根据用户的提示词,Manus可实现自动解压缩,并分析简历再给出建议和排名;用户提出对房产的需求,Manus可自动帮用户做房价和信息的整理;Manus可按用户的要求对英伟达和特斯拉股价生成分析报告,并创建相关的网站。
Manus部分案例
不过很可惜的是目前Manus还在部分内测阶段,只能通过邀请码使用,且一码难求,在二手交易平台上有人甚至开价至5万元以上,所幸DeepSeek已经被接入了各大平台,今天就让我们一起看看它这个大脑是怎么评价Manus这双手的,以下内容来自知乎直达:
问题:请你评价一下Manus
DeepSeek回答:
DeepSeek对Manus的介绍很详细,包括技术原理、优缺点、市场前景等都有所提及,但回答还是比较官方,让我们换一种问法,让它说的直白点。
问题:用简单通俗的语言总结概括一下对Manus的评价
DeepSeek回答:
看起来DeepSeek对于当前阶段的Manus还并不太看好,指出了Manus的诸多问题,从字里行间透露出的意思就是“老弟,你还得练“。其实Manus AI合伙人张涛之前也曾在社交平台发文表示:“大家目前看到的Manus还是一个襁褓中的婴儿,离我们在正式版中想交付给大家的体验还差很远。像模型幻觉、交付物友好度、运行速度等方面都还有很大的提升空间”。
虽然从测试结果和官方案例来看,Manus的成绩是相当不错的,但预计其落地到应用端还有些距离,目前来看它的出现和爆火象征意义更大于实用意义,它的价值不在于技术颠覆,而在于验证了通用“AI Agent”在商业上是可行的。