智元机器人发布重磅模型
来源:李智衍 发布时间:5 天前 分享至微信

智元机器人正式发布其首个通用具身基座模型 —— 智元启元大模型(Genie Operator-1),并创新性地推出 Vision-Language-Latent-Action (ViLLA) 架构。


这一架构由 VLM(多模态大模型)与 MoE(混合专家)构成。其中,VLM 通过对海量互联网图文数据的学习,具备了通用场景感知和语言理解能力;而 MoE 中的 Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据,获得了通用的动作理解能力,Action Expert(动作专家)则依靠百万真机数据,拥有了精细的动作执行能力。


智元机器人透露,这几个部分紧密协作,使得模型能够借助人类视频进行学习,实现小样本快速泛化,有效降低了具身智能的应用门槛。目前,该模型已成功应用于智元的多款机器人本体,且能持续进化,显著推动了具身智能的发展进程。


[ 新闻来源:李智衍,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!