99.25%成功率!中国大模型拿下“世界第一”,凭什么?
让一台机器人理解“把插头插进插座”,比让它连翻三个跟头,或者跳一段芭蕾舞要难得多!
5月29日,深圳越疆科技发布了空弈DobotWAM具身大模型,该模型在LIBERO基准评测中平均成功率99.25%,超越了谷歌DeepMind、英伟达等团队此前公示的模型成绩,排名第一。其中,LIBERO-Object(物体泛化)单项达到100%的满分。以下是几个已公开模型的评测成功率对比:
这意味着什么?
首先,我们来了解一下IBERO的含金量。
LIBERO(Lifelong Robot Learning Benchmark)由得克萨斯大学奥斯汀分校联合索尼AI等机构于2023年提出,下设四个套件:
空间关系理解(Spatial)
物体泛化(Object)
目标指令理解(Goal)
长时序多步骤执行
LIBERO目前被谷歌、英伟达、Meta、小米等团队视为检验机器人泛化能力与长程任务执行能力的“行业考试”。它不是单纯的“刷榜赛”,而是揭示模型本质能力的X光机。
那么,空弈DobotWAM具身大模型凭什么登顶?
行业主流的视觉-语言-动作(VLA)模型,本质是“模仿”:给什么数据就学什么动作。面对空间扰动、物体变化或长流程任务时,极易出现动作漂移、目标丢失。空弈突破了这一局限,核心在于四项技术耦合:
3D空间表征将三维几何信息引入建模,让模型摒弃对二维图像的依赖;
将关节动态信息与末端执行器几何约束融入训练损失函数,从“模仿轨迹”升级为“理解动作结构”;
高级语义任务拆解,将复杂指令分解为清晰的阶段目标,解决“局部正确、全局失败”的难题;
高质量真机数据飞轮闭环,持续吸收成功、失败及长尾场景的真实经验,提升从仿真环境到产线执行的迁移能力。
搭载空弈大模型的机器人在插充电器、插笔帽两项高精度接触作业测试中表现亮眼。这类任务需要自主完成目标定位、轴线对齐与姿态稳定控制,其难度在行业内被视为高挑战。它让机器人从“模仿者”进化为“理解者”,从“看得见”进化到“看得懂”。
关于越疆
这是一家很少主动讲故事的公司。创始人刘培超2015年在深圳一张办公桌上起步,从轻量级协作机械臂切入,十年间构建起覆盖0.5kg到30kg负载的完整产品矩阵,累计出货超10万台,服务全球100多个国家和地区。2025年协作机器人出货量跃居全球第一,市占率13.2%。
越疆的最深“底牌”,正是这10万台部署在全球产线上的机械臂。它们每天在汽车、3C电子、焊接、检测、装配等15个行业、200多个工艺场景中持续执行任务。这就形成了“采集—训练—部署—反馈”的数据飞轮,源源不断地为空弈大模型训练提供真实数据沃土。
越疆的“一脑多体”具身智能平台,以空弈大模型为“大脑”,以高精度力控系统为“小脑”,可驱动机械臂、人形、多足等多形态机器人。
2025年越疆研发投入达到1.15亿元,同比增长近60%,其中投向具身智能的研发费用超过4500万元。这组数字背后,是越疆从“协作龙头”向“具身领跑”战略转型的决心。
“职业考试”开始
这次登顶对越疆本身而言,意味着它完成了从硬件制造商到系统智能方案商的身份跃迁。具身智能业务收入已在2025年实现数倍增长,占总营收比重从1%升至4.1%。而对整个行业来说,它传递了三个清晰的信号:
1. 行业评价标准正在发生根本性转变。 过去,一场高难度的机器人舞蹈或翻跟头表演就能赢得满堂喝彩,但那些好看却离生产很远的演示终究只是锦上添花。如今,评价具身智能的标尺正从“能否完成单次惊艳表演”转向“能否在动态多变环境中稳定执行长流程任务”。
2. 具身智能的核心竞争壁垒正在从“参数规模”转向“场景深度”。 空弈的成功验证了一条关键路径:真正的泛化能力不是堆出来的,是在真实工业场景中“训练”出来的。拥有扎实的产业纵深和应用积累,而非单纯的算力优势,正成为决胜的长久根基。
3. 具身智能迎来了从炫技走向实用的拐点。 99.25%是一个里程碑,但它也揭露了一个现实:仿真测试与真实产线之间仍有鸿沟,那0.75%的失败可能意味着巨大损失,如何在大规模、开放场景中持续保持高可靠性,仍是所有玩家都需要攻克的难题。
具身智能最精彩的博弈,才刚刚展开。
END
📚 往期精彩
豪砸250亿美元!特斯拉全力押注人形机器人,却面临三大致命难题
成本仅占1%,却是人形机器人的“心病”
小鹏机器人量产冲刺:2027年一季度上岗卖车
帅不过2小时!人形机器人的电耗在哪儿?
6月1日宇树科技上会三大看点
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
行家说机器人 向上滑动看下一个
行家说机器人 写留言 ,选择留言身份