上海首家人形机器人量产企业发布通用具身模型基座

上海3月10日电(记者李姝徵)上海首家人形机器人量产企业——智元机器人10日发布通用具身模型基座：智元启元大模型(Genie Operator-1，简称GO-1)。

智元机器人是由“稚晖君”彭志辉创办的人形机器人初创公司，也是上海首家实现人形机器人量产的企业。该企业2024年已下线1000台人形机器人，并将在2025年实现数千台的年产量。

智元具身研究中心常务主任任广辉当日接受记者采访时表示，GO-1大模型借助人类和多种机器人数据，让机器人获得了革命性的学习能力，可泛化应用到各类的环境和物品中，快速适应新任务、学习新技能。同时，它还支持部署到不同的机器人本体，高效地完成落地，并在实际的使用中持续不断地快速进化。

任广辉介绍，GO-1大模型的特点可归纳为4个方面。首先是人类视频学习。GO-1大模型可以结合互联网视频和真实人类示范进行学习，增强模型对人类行为的理解。

第二是小样本快速泛化。GO-1大模型具有强大的泛化能力，能够在极少数据甚至零样本下泛化到新场景、新任务，不仅降低了具身模型的使用门槛，也大大了降低后训练成本。以“倒水”这一动作为例，如果人形机器人没有搭载大模型，完成该动作的训练需要1万至5万条数据采集；搭载大模型后，完成该动作仅需1000条左右数据采集。

第三是“一脑多形”。作为通用机器人策略模型，GO-1大模型能够在不同机器人形态之间迁移，快速适配到不同本体，类似“群体升智”。

第四是持续进化。任广辉介绍，搭配一整套数据回流系统，GO-1大模型可以从实际执行遇到的问题数据中持续进化学习，“越用越聪明”。

如何达成这些？智元机器人合伙人、具身智能事业部总裁姚卯青介绍，这源于GO-1的Vision-Language-Latent-Action(ViLLA，即视觉-语言-隐式-动作)架构，该架构由VLM(多模态大模型)+ MoE(混合专家)组成。

“VLM借助海量互联网图文数据获得通用场景感知和语言理解能力，MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作数据获得通用的动作理解能力，MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。”姚卯青介绍，通过三者环环相扣，让GO-1可利用人类视频学习，完成小样本快速泛化。

“例如，用户给出指令告诉机器人要做的事情，比如‘挂衣服’，模型就可以根据看到的画面，理解这句话对应的任务要求。”任广辉表示，该模型可根据之前训练时看过的挂衣服数据，设想这个过程应该包括哪些操作步骤，最后执行这一连串的步骤，完成整个任务的操作。

距离人形机器人进入家庭“打工”还有多久？“我们目前发布的技术处于从G3到G4的过渡阶段。”任广辉表示，人形机器人走进家庭创造价值，还需5年左右。(完)

“每个人的身上都有毛毛”的季节 “梧桐絮”的烦恼怎么破？

合肥新桥机场境外航空公司境外航班陆续取消

独家视频丨习近平会见汤加国王：坚定站在一起赓续传统友谊加强团结合作

武汉黄陂木兰清凉寨：初冬叶斑斓风景美如画

法国对23个疫情严重省份加强监控并收紧管制措施

充电宝要“持证上岗”！CCC新规明日执行

4月份中国CPI同比上涨0.9% 猪肉价格下降21.4%

人民日报评论员：完善香港选举制度势在必行

湖南新增新冠肺炎确诊病例7例均在张家界市

内蒙古新增新型冠状病毒肺炎确诊病例2例累计13例