3月7日也就是上周五,华为离职“天才少年”智元机器人(AgiBot)联合创始人稚晖君(彭志辉)在社交媒体上预告“下周智元机器人有好东西发布”。而到了3月10日,智元机器人也如约发布了重量级新品,全球首个通用具身基座大模型——智元启元大模型GO-1(Genie Operator-1)。
GO-1的核心技术架构Vision-Language-Latent-Action(ViLLA)由多模态大模型(VLM)与混合专家模型(MoE)两大模块协同构成: VLM负责解析多模态数据,借助海量互联网图文资源为机器人建立通用场景感知与语义理解能力;MoE则分为两部分,其中隐式规划器(Latent Planner)通过分析跨本体机器人及人类操作视频,提取动作意图与逻辑关联,形成对复杂任务的动作理解能力,而动作专家(Action Expert)则依托百万级真机数据训练将动作映射到机器人本体上,让机器人获得精细的动作执行能力。两大模块环环相扣,实现从感知到执行的全链路优化,解决了传统机器人泛化性差、扩展新任务成本高、不同本体数据无法共享、缺乏持续进化机制的痛点。
据介绍,GO-1拥有四大突破性优势:
据了解,启元大模型已经被部署到智元公司的多款机器人本体上,未来也可广泛扩展应用于智能制造、智慧城市、医疗影像分析等领域。有专家指出,具身智能驱动的机器人市场未来规模或达数万亿,超越汽车与智能手机行业,该模型的出现或成为机器人行业“iPhone时刻”的催化剂,推动家庭服务、养老护理等场景的普及。随着模型迭代与供应链成本下降,人形机器人规模化落地或早于预期。