智元机器人发布重磅模型-icspec

智元机器人发布重磅模型

来源:李智衍发布时间:2025-03-12

分享至微信

智元机器人正式发布其首个通用具身基座模型 —— 智元启元大模型（Genie Operator-1），并创新性地推出 Vision-Language-Latent-Action (ViLLA) 架构。

这一架构由 VLM（多模态大模型）与 MoE（混合专家）构成。其中，VLM 通过对海量互联网图文数据的学习，具备了通用场景感知和语言理解能力；而 MoE 中的 Latent Planner（隐式规划器）借助大量跨本体和人类操作视频数据，获得了通用的动作理解能力，Action Expert（动作专家）则依靠百万真机数据，拥有了精细的动作执行能力。

智元机器人透露，这几个部分紧密协作，使得模型能够借助人类视频进行学习，实现小样本快速泛化，有效降低了具身智能的应用门槛。目前，该模型已成功应用于智元的多款机器人本体，且能持续进化，显著推动了具身智能的发展进程。

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

[ 新闻来源：李智衍，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]