报道称智元机器人正式发布了全球首个通用具身基座大模型——智元启元大模型(Genie Operator-1,简称GO-1)。这一创新成果标志着机器人技术在智能化和通用化方面取得了重大突破。
智元启元大模型基于Vision-Language-Latent-Action(ViLLA)架构,融合了多模态大模型(VLM)和混合专家(MoE)技术。该模型具备采训推一体化、小样本快速泛化、“一脑多形”的跨本体应用、持续进化以及人类视频学习等能力。在实际测试中,GO-1在五种不同复杂度的任务上表现卓越,平均成功率相比已有最优模型提升了32%。
技术优势与性能表现
1.GO-1通过利用互联网大规模纯文本、图文数据以及人类操作视频数据,显著提升了机器人的场景感知和动作理解能力。
2.在五种不同复杂度的任务测试中,GO-1的平均成功率相比已有最优模型提高了32%(从46%提升到78%),其中“倒水”“清理桌面”和“补充饮料”任务表现尤为突出。
3.ViLLA架构中的Latent Planner模块能够提升12%的成功率(从66%提升到78%),进一步验证了其在动作规划方面的优势。
智元机器人联合创始人兼CTO稚晖君表示,智元启元大模型的发布不仅降低了具身智能的应用门槛,还为机器人在复杂动态环境中的应用提供了更广阔的可能性。此外,智元机器人还计划在未来陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练,并发布全套工具链,实现采集、训练和评测的完美闭环。
图:智元机器人发布通用具身基座大模型
未来计划:加速商业化与技术创新
智元机器人在技术创新和市场布局方面有着清晰的未来规划。首先,公司将继续推进具身智能技术的研发,计划在未来两年内达到万台产量,成为全球首个实现这一目标的机器人公司。此外,智元机器人还将推出更多具身智能产品,进一步拓展其在工业、服务、教育等领域的应用。
在产品方面,智元机器人已有多款产品在研和即将发布。例如,远征A2系列机器人将覆盖交互服务、柔性制造等多个场景,而灵犀X1系列则专注于服务和数据采集。智元还计划在2025年推出更多新产品,进一步丰富其产品矩阵。
行业影响:推动具身智能的普及与发展
智元启元大模型的发布不仅为机器人技术带来了革命性的进步,也为整个行业树立了新的标杆。通过开源高质量数据集和工具链,智元机器人将促进具身智能技术的快速普及,推动行业生态的健康发展。
智元机器人还与百度智能云、科大讯飞等知名企业达成战略合作,加速其技术的商业化落地。这种开放合作的模式不仅有助于智元机器人自身的发展,也将为整个行业带来更多的创新机会。
结语
智元启元大模型的发布是机器人技术发展的一个重要里程碑。凭借其强大的学习能力和广泛的应用前景,智元机器人有望在未来引领具身智能技术的普及和商业化进程。随着技术的不断进步和市场的逐步拓展,机器人将在更多领域为人类提供高效、智能的服务。