机器人 热门 发布 2026/06/05 16:41 更新 2026/06/06 01:01
小米机器人双夺CVPR与ICRA国际挑战赛总冠军_人工智能-中关村在线 小米机器人双夺CVPR与ICRA国际挑战赛总冠军_人工智能-中关村在线
2026年6月5日,小米创始人、董事长兼首席执行官雷军宣布,小米机器人团队在CVPR 2026与ICRA 2026两项国际权威学术会议同期举办的机器人专项挑战赛中,均夺得总冠军。多项核心性能指标显著优于其他参赛团队,实现双赛事冠军的突破性成果。
雷军表示,小米机器人研发的长期目标,是推动机器人真正融入物理世界,切实承担起现实场景中的实际任务。
在CVPR 2026 RoboChallenge挑战赛中,小米以代号“my16”的自研WAM世界动作模型参赛,最终以40.89%的任务成功率位居榜首,成为本届赛事中唯一突破40%成功率的方案。该赛事设置了30项高难度真机实操任务,涵盖双臂协同操作、柔性物体抓取、工具使用因果推理以及跨平台系统适配等多个技术方向,所有参赛模型须连续完成十轮稳定性测试,全面评估其在复杂动态环境下的通用泛化能力。
“my16”模型基于独创的“S1/S2双系统架构”,融合长短期记忆机制与跨本体预训练策略,将大模型的认知理解能力、运动控制器的执行精度以及记忆系统的持续稳定表现统一于单一模型之中,在高强度、多维度的综合比拼中展现出显著优势。
在ICRA 2026 WBC大赛中,赛事模拟真实商超环境,要求机器人自主识别16大类、共计20种细分饮料品类,并依据指令完成自主移动、姿态调整、单双臂协同抓取及货品装车等全流程作业,完整覆盖环境感知、运动规划与精细操控等全技术链条。
小米参赛团队最终获得99.2分的接近满分成绩,整机作业成功率达94%,是全场唯一突破90%成功率的团队,领先第二名达10个百分点;其中,基础类任务实现100%完成,高复杂度任务成功率稳定维持在90%左右。该项技术所依托的底层架构,与工业产线机器人落地需求高度一致,具备明确而广泛的产业化应用潜力。
CVPR是IEEE主办的计算机视觉与模式识别领域最具影响力的年度学术会议,代表该方向全球最高水平的研究进展。ICRA则是IEEE机器人与自动化协会主办的旗舰级国际会议,长期被公认为机器人学界最具权威性的学术盛会之一。
https://ai.zol.com.cn/1193/11932717.html ai.zol.com.cn true 中关村在线 https://ai.zol.com.cn/1193/11932717.html report 1576 2026年6月5日,小米创始人、董事长兼首席执行官雷军宣布,小米机器人团队在CVPR 2026与ICRA 2026两项国际权威学术会议同期举办的机器人专项挑战赛中,均夺得总冠军。多项核心性能指标显著优于其他参赛团队,实现双赛事冠军的突破性成果。雷军表示,小米机器人研发的长期...
- 猜你喜欢
- 最新
- 精选
- 相关
### 热门搜索
- 24小时热文
- 本周热评
- 精品图赏
- vivo S60元气版新机图赏:握住一整个夏天
- vivo S60高清图赏:有星星海的夏日更清爽
- 华为 nova 16 Ultra天际白实拍:耀目双星搭配拼接设计
- vivo头戴降噪耳机图赏:轻盈佩戴,美感随行
推荐经销商
- 北京
- 上海
- 广州
请选择省份
- 天津
- 重庆
- 哈尔滨
- 沈阳
- 长春
- 石家庄
- 呼和浩特
- 西安
- 太原
- 兰州
- 乌鲁木齐
- 成都
- 昆明
- 贵阳
- 长沙
- 武汉
- 郑州
- 济南
- 青岛
- 烟台
- 合肥
- 南京
- 杭州
- 东莞
- 南宁
- 南昌
- 福州
- 厦门
- 深圳
- 温州
- 佛山
- 宁波
- 泉州
- 惠州
- 银川
推荐问答
- 论坛精选
- 最热回答
- 摄影
- 手机
- 硬件
- 笔电
- 平板
### 经销商
### 提示
0
下载ZOL APP秒看最新热品
内容纠错
深挖阅读AI 解读
深度分析:小米机器人双冠技术突破
核心要点提炼:
1. 双赛制霸:小米机器人团队在CVPR 2026(计算机视觉顶会)与ICRA 2026(机器人学顶会)同期举办的挑战赛中,均斩获总冠军。这是技术路线获得国际学术界双重认可的标志性事件。
2. 技术硬核:核心技术为自研“WAM世界动作模型”(代号my16),采用独创的“S1/S2双系统架构”。在CVPR赛事中,以40.89%的任务成功率(唯一破40%方案)完成30项高难度真机操作;在ICRA赛事中,以99.2分、94%整机成功率(领先第二名10个百分点)完成复杂商超全流程作业。
影响分析:
1. 行业技术方向引领:小米的“双系统架构”将大模型认知、运动控制与记忆系统融合,验证了“世界模型+具身智能”路线的可行性。这为行业提供了从单一算法竞赛转向“认知-执行-泛化”一体化解决方案的范本,可能加速机器人从实验室走向真实场景。
2. 产业化落地预期增强:ICRA赛事模拟的商超场景与工业产线高度一致,其接近满分的表现(基础任务100%、高复杂任务90%)表明,该技术具备明确的商业转化潜力。小米宣称的“推动机器人融入物理世界”并非空谈,其在智能家居、仓储物流等领域的应用前景值得关注。
3. 竞争格局重塑:小米以消费电子企业身份在学术顶会夺冠,打破了传统由高校或专业机器人公司主导的技术壁垒。这标志着“大厂+自研模型”模式在机器人赛道具备强大竞争力,或将引发新一轮产业资本与技术人才争夺战。
机器人 热门 发布 2026/06/04 17:26 更新 2026/06/06 01:01
当机器人不再“纸上谈兵”,Fair Plus 2026上的机器人产业突围-36氪 机器人正在从“能动的机器”,变得“更像人”。
近年来,仿生软体机器人正成为机器人领域的重要前沿方向。而走进正在举办的FAIR plus2026机器人全产业链接会一个强烈的感受是:机器人正在从“能动的机器”,变得“更像人”。
不再是清一色的关节电机和减速器,不再是僵硬的动作和固定的程序。今年的展台上,两家中国初创公司带来的技术,让我们真正看到了机器人“拟人化”的两种关键突破——一种是仿生肌肉,一种是电子皮肤。
## 颠覆性创新:从“关节电机”到“人工肌腱”
在苏州智行腱的展台前,围满了观众。这家公司展示的不是传统电机,而是一个被称为“人工肌腱”的颠覆性技术。
“我们不是传统电机。”公司负责人反复向观众解释,“我们是真正用材料技术加驱动技术,在系统工程上仿生了人体肌腱。”
他展示着只有几毫米大小的元件——这就是他们的人工肌腱。它可以像人体肌肉一样做直线伸缩运动,最小尺寸仅几毫米,最大出力却能达到50牛,速度可达80毫米每秒。比功率密度大更惊人的是,它的精度达到了微米级,实现每步进5微米。
这项技术的真正想象力在于它的应用场景。因为体积微小,它可以嵌入到仿真脸中,在一张脸上布置30到40个自由度,实现几乎真实的微表情。它还可以用在灵巧手上,断电时可自锁,抓住东西不会掉、不费电。
“我们的技术是中国原创,没有国外经验可借鉴。”负责人坦言,“这是苏州和武汉两个团队十年以上的积累。”目前,苏州智行腱的人工肌腱主要面向AI玩具、仿真脸、机器人手掌等场景。
## 灵巧手的“灵魂”:触觉感知与精细操作
如果说人工肌腱是机器人的“肌肉”,那么灵感机器人带来的,就是机器人的“皮肤”和“神经系统”。
这家总部位于深圳、脱胎于港科大的创业公司,定位非常清晰:做顶尖的机器人触觉感知元组件及机器人操作技能系统。
“今年是触觉技术的大年。”灵感机器人的创始人张雅展表示,“去年几乎没有公司做这个,今年突然多了起来。”
他们带来的核心产品是视觉触觉传感器,能够提供信息密度极高的触觉信号,具有高分辨率、多模态、多维度等特点。在展会现场,他们的传感器从早到晚运行,没有发生漂移、抖动或噪音提升,这背后是强大的算法能力。
更难得的是,灵感机器人是目前市面上少数能做到商用级指尖大小的视觉触觉传感器的公司。
“很多客户遇到问题,却不知道缺的正是触觉。”张雅展指出,市场教育仍是挑战,“我们需要教客户意识到,这个问题就是缺一个力触觉的地方。”
精细操作的落地同样困难。工业生产要求高效、高节拍、高精度,而当前AI在实时性和精度上仍有瓶颈,工程优化还有大量工作要做。
灵感机器人虽然此前一直以“水下项目”低调运行,但在展会上首次公开亮相后,已吸引大量高水平投资机构和产业链伙伴的关注。公司明确表示将走全球化路线,既支持中国机器人本体企业,也服务海外模型公司。
## 一场展会,一个产业的时代转折
值得关注的是,在FAIR plus2026机器人全产业链接会上,不仅有苏州智行腱与灵感机器人这类技术创新企业,展示这前沿技术,还有可量产、可交付、可直接落地各行各业的真实应用场景。
可以说,原创只是起点,产业化才是终点。中国科学院深圳先进技术研究院产业发展中心主任、深圳市机器人协会常务副理事长兼秘书长毕亚雷在现场直言:“500家企业现场参展,就是一部‘活’的深圳机器人白皮书。”
在他看来,完全工业机器人的时代已经过去,当机器人拓展到具身智能之后,千行百业都在落地,推动2025年深圳机器人产业链产值增速重回20%以上,产业正式迈入第二次爆发期。这种爆发,并非空喊口号。展会举办的25场闭门供需对接会,覆盖制造、物流、医疗、养老、商业零售、应急安全等全应用领域,中国一汽、中海油、深圳地铁等甲方现场发布数百项真实采购需求,技术方与需求方一对一洽谈、面对面敲定合作。当供应链的实际对接代替了空洞的PPT展示,当订单的敲定成为了展会的最大亮点,行业的风向已经无比清晰。
毕亚雷给出的判断更为前瞻:“传统单一工业机器人时代已经落幕,具身智能全面渗透千行百业,将是未来十年产业最大增量空间。”他同时指出,深圳正在同步推进3项国家标准、2项团体标准研制,以标准制定抢占产业未来制高点。正如智行腱的创始人所言:“中国已经从抄袭阶段进入原创技术爆发期。”而灵感机器人的愿景则更为朴素却也宏大——让触觉不再昂贵,让机器人真正“有感知”地走入千家万户。
2026年,人形机器人头部厂商将实现万台级交付,中国灵巧手市场占有率有望继续领跑全球。而在这个关键节点上,FAIR plus提供了一个独特的切面——它不仅是一场展览,更是一面镜子,映照出一条产业链从分散走向协同、从技术验证走向规模化交付的完整进程。
深挖阅读AI 解读
核心要点提炼
1. 技术突破:苏州智行腱推出“人工肌腱”(仿生肌肉),实现微米级精度与高负载;灵感机器人发布商用级指尖视觉触觉传感器,赋予机器人“皮肤”与精细操作能力。
2. 产业拐点:FAIR plus 2026展会显示,具身智能正从实验室走向千行百业,500家企业参展,数百项真实采购需求落地,深圳机器人产业链产值增速重回20%以上。
影响分析
技术层面:仿生肌肉与电子皮肤的结合,将机器人从“机械执行”推向“类人感知”,尤其利好医疗、养老、精密制造等高交互场景。中国原创技术爆发,摆脱海外依赖,但触觉传感器的市场教育仍是关键瓶颈。 产业层面:具身智能全面渗透,推动供应链从“PPT展示”转向“订单敲定”,标准化(深圳牵头3项国标)加速行业整合。2026年人形机器人万台级交付可期,中国灵巧手全球领跑优势有望巩固,但AI实时性与工程优化仍需突破。
结论:机器人产业正经历从“功能机”到“智能体”的质变,原创技术+产业协同是突围核心,触觉感知将成为下一轮竞争制高点。
机器人 热门 发布 2026/06/04 01:04 更新 2026/06/04 01:39
深圳具身公司星尘智能完成超10亿B轮融资,估值破百亿|硬氪首发-36氪 黄 楠·2026年06月03日 09:30
全球首家实现绳驱AI机器人量产。
星尘智能
B轮广东省2022-12
仿生机器人研发商
36氪报道先进制造
我要联系
作者|黄楠
编辑|袁斯来
硬氪获悉,绳驱AI机器人公司星尘智能(Astribot)近日完成B轮系列融资,三个月内三轮累计融资额超10亿元,投资方包括梁溪科创产业二期母基金(博华资本管理)、扬州龙投芯粒、中博聚力、中科创达、科德教育、某头部上市企业及国科投资等老股东持续追投。
商业化方面,星尘智能还同步拿下了几个产业场景合作订单,包括与中科创达的千台级工业及商业服务订单并推进出海,与江都经开区共建亿元级应用创新中心落地文旅酒店场景等。
具身智能赛道竞争逻辑正发生根本性切换。行业告别侧重舞台预设演示的粗放比拼,转而直面真实物理环境下的复杂落地难题。技术路线尚未收敛,各家厂商基于对落地路径的不同理解,在传动方案、模型架构、数据策略等维度做出了差异化的探索与取舍。
创业初期,来杰就明确提出“Design for AI”路径,即先定义适配AI大模型学习与进化规律的机器人身体,再围绕这一身体匹配对应的AI算法与操作系统,让机器人能“像人一样思考,像人一样工作”。基于这一理念,星尘智能搭建了一套“AI模型-具身OS-绳驱本体”的全栈自研体系。
星尘智能T1新品(图源/企业)
如何让这台机器人像人一样思考与行动?这点上,星尘智能采取了自研基座模型,依靠数据效率而非数据规模驱动能力提升。
真实物理任务存在一个长期易被忽视的特点:并非所有动作都需要深度推理。比如在家庭场景中,开微波炉、拿玩具、递工具,这些高频操作更多依赖快速的本能级响应,而“整理厨房并做一顿饭”的这类长程任务,则需要模型具备步骤拆解、环境理解和异常处理能力。不同需求对应着所需的时间尺度与算力消耗,大模型推理能力强但响应慢,端到端动作模型响应快但缺乏规划能力。
星尘智能的思考是,与其在一个模型上强求兼顾,不如让模型各司其职。在底层模型端,星尘智能提出了端到端全身VLA基座模型Lumo,承接更高维度的通用推理需求。
作为全局基座大模型,Lumo主要解决复杂语义理解、抽象指令拆解与未知场景泛化等任务。模型训练采用“预训练+真机对齐”,先通过海量数据学习通用任务逻辑与步骤拆解能力,建立基础认知体系;再依托绳驱真机采集的高质量多模态数据完成真机微调对齐,打通从模型“思考”到机器人“实操”的动作流。
Lumo-1执行长序列复杂任务(图源/企业)
依托这套训练逻辑,Lumo可在未知物体、陌生环境、模糊抽象指令等分布外场景中,展现出更强的泛化能力。硬氪了解到,未来Lumo迭代版本还将融入世界模型预测能力,进一步强化机器人对动态环境的预判与推理效率。
在商用框架端,基于人类双系统认知理论,星尘智能研发了首个可实现全身移动操作的DuoCore快慢协同框架,与美国公司Figure此后发布的Helix架构几乎一致。
这套架构将机器人智能拆分为两套独立且协同的能力体系。快系统主打本能级实时响应,负责毫秒级姿态微调、现场避障、关节柔性缓冲等动态基础动作,适配真实场景随时出现的环境扰动;慢系统主打认知级深度规划,专注长时序任务拆解、跨空间路径规划与全局策略生成,支撑弯腰、蹲起、移动与双臂精细操作的全身协同作业。
星尘智能自研商用模型架构DuoCore零售应用已在全国六个城市规模化落地(图源/企业)
两套系统通过具身OS统一调度、联动运转,伴随着慢系统输出整体任务方案与行进路径,快系统能够实时修正机身姿态适配非标环境变化;如果遇到突发风险时,快系统则可自主触发紧急避险,并联动慢系统更新任务规划,实现动态纠错。
区别于传统AI“海量数据投喂、从零学习”模式,DuoCore框架依托仿生人类技能迁移逻辑,在跨场景任务中可复用已有经验,解决了机器人真实场景实时作业、动态适配、高效学习的落地难题。
在传动方案上,星尘智能是全球首家实现绳驱AI机器人量产的企业。绳驱模仿人体肌腱的运动逻辑,通过电机后置,由腱绳牵引控制关节屈伸,形成了一种“刚柔耦合”的特性,既保留足够的操作刚度,又具备柔性缓冲和冲击吸收能力。
相比传统刚性连杆结构,绳驱拥有更高的有效载荷能力、更低的反冲和惯性,以及更紧凑的机身,这使得机器人在保持高动态操作与高拟人表现的同时,还能确保近距离交互的安全性,拓宽了从商业到家庭的应用想象力。
不同驱动方案对比(图源/企业)
当机器人执行任务时,绳驱传动摩擦更低、运动更连续,相比传统刚性机构减的齿隙摩擦与机械噪声,信息损耗少,能更完整无损地向AI传递高质量实时力控数据,这正是AI大模型学习真实物理交互规律所依赖的关键数据。
深挖阅读AI 解读
核心要点提炼
1. 融资与商业化双突破:星尘智能完成超10亿元B轮融资,估值破百亿,并拿下千台级工业及商业服务订单,落地文旅酒店场景,标志着具身智能从实验室走向规模化应用。
2. 技术路线差异化:全球首家实现绳驱AI机器人量产,采用“Design for AI”理念,自研全栈体系(基座模型Lumo、DuoCore快慢协同框架、绳驱本体),强调数据效率而非规模驱动。
3. 架构创新:DuoCore框架借鉴人类双系统认知理论,将智能拆分为快系统(本能响应)与慢系统(深度规划),实现动态纠错与高效学习,与美国Figure Helix架构不谋而合。
影响分析
行业竞争升维:星尘智能的技术路线(绳驱、快慢协同)直击具身智能落地痛点——真实环境下的实时适配与泛化能力。其量产能力与商业化闭环,可能加速行业从“演示比拼”转向“实用主义”,倒逼其他厂商优化传动方案与模型架构。 产业链协同效应:与中科创达、江都经开区等合作,推动机器人在工业、商业、文旅场景的渗透,有望带动上游传感器、执行器及下游应用生态的成熟。千台级订单验证了B端需求,为家庭场景突破奠定基础。 技术范式启示:DuoCore框架与Lumo模型组合,展示了大模型与端到端模型协同的可行性。未来若融入世界模型预测能力,可能重新定义机器人智能的边界,尤其在高频交互与长程任务并存的场景(如家政服务)中具备颠覆性潜力。 机器人 热门 发布 2026/06/03 17:30 更新 2026/06/05 01:00
比亚迪下场造人形机器人代号“尧舜禹”,2026年内部将部署2万台|汽车|工业机器人|单款人形机器人_网易订阅 0
分享至好友和朋友圈
作者|杨立成
编辑|王以沫
6月3日消息,比亚迪执行副总裁李柯首次官方证实自研人形机器人,代号“尧舜禹”,2026年计划内部部署2万台,依托造车全链条优势开启第二增长曲线。
##### 尧舜禹进厂
2026年6月3日,第一财经从接近比亚迪人士处确认,公司人形机器人项目正稳步推进。早前,李柯在比亚迪官方投资者平台“股东星球”《有请》栏目中首次正面回应外界追问,明确表示现阶段重点布局工业机器人,未来将开放平台,支持自研与合作模式并行。
这是比亚迪官方及高层首次公开证实人形机器人业务,打破了市场长达四年的猜测。
项目进展远超行业预期。据内部披露,“尧舜禹”项目2022年由第十五事业部正式立项,中央研究院提供技术支撑,目前已组建约4000人的核心研发团队,博士占比超30%,覆盖机械设计、电控、算法、AI等全链条领域。
截至2026年5月,原型机已迭代至第七代,核心零部件产线同步投产。实测参数显示,机器人双足行走速度达1.5米/秒,额定负载50公斤,配备4指16自由度灵巧手与激光雷达+6D触觉感知系统,在工厂搬运、贴标、巡检等标准化工序中,综合作业效率已达到人工的80%。
部署路线图清晰明确。目前已有约150台样机进驻深圳坪山、长沙等整车工厂开展7×24小时实景实训,同时优必选Walker S1也已进入比亚迪焊装车间,实现与无人物流车、无人叉车的协同作业。
按照比亚迪规划,2025年已完成内部2000台小批量部署,2026年将猛扩至2万台,优先替代产线上重复性高、劳动强度大的岗位;2028年实现全面大规模落地,逐步拓展至品牌线下4S店接待、物流仓储等商用场景。
李柯在访谈中特别提到,未来如果机器人走向家庭,可直接通过比亚迪全球经销商网络进行售卖。
生态布局同步推进。比亚迪并未局限于纯自研路线,而是通过“自研+投资”双轮驱动构建产业闭环:2023年战略入股智元机器人(持股约3.76%)、超亿元投资帕西尼感知科技,覆盖通用人形机器人、多维触觉传感器等关键环节;与香港科技大学共建“具身智能联合实验室”,提前布局前沿技术研发。
资本市场对此反应相对平淡,截至6月3日收盘,比亚迪A股报94.82元,下跌2.00%,总市值8645亿元;H股报93.25港元,下跌3.62%,总市值8502亿港元。
多位分析师表示,人形机器人业务尚处于早期投入阶段,短期内难以贡献业绩,市场更关注其与汽车主业的协同效应。
##### 造车的底气
比亚迪入局人形机器人,最大的底气来自于新能源汽车产业积累的全链条能力。
李柯在访谈中直言:“机器人的竞争在于谁有最强的制造能力、软件能力和硬件能力,而汽车相关AI能力与机器人有同源性。”
这句话精准点出了整车企业跨界机器人的核心优势,也是比亚迪区别于其他机器人创业公司的根本所在。
制造与成本控制能力是比亚迪最坚实的护城河。作为全球最大的新能源汽车制造商,比亚迪2025年全年销量超过460万辆,连续四年稳居全球第一。
尤其是年产百万辆汽车的规模效应,使其在供应链管理、质量管控、良率爬坡、大规模交付等方面积累了无可比拟的经验。
这些能力可以直接平移到机器人生产中,大幅降低制造成本。据测算,比亚迪机器人核心零部件与汽车的通用率超过60%,伺服电机、行星减速器、关节模组等核心部件自研率超80%,其中自研伺服电机成本较外购低约40%,自研RV减速器成本比进口低60%。
而对于绝大多数机器人初创公司来说,减速器、电机、控制器三项加起来就要吃掉整机成本的50%以上,还需向日本哈默纳科、纳博特斯克等厂商支付高额溢价。
软硬件协同能力构成第二重优势。5月28日,比亚迪在第二届科技日暨智能化战略发布会上,正式推出自研4纳米车规级智驾芯片“璇玑A3”并实现规模化量产。
该芯片单位算力功耗相较行业同类产品低20%,三颗芯片协同工作后综合总算力突破2100TOPS,可充分满足L3-L4级自动驾驶的算力冗余需求。
更重要的是,车规级芯片与机器人芯片在架构、算力、可靠性等方面高度同源,璇玑A3未来可直接应用于人形机器人,解决高端AI芯片“卡脖子”问题。
同时,比亚迪已经写过数百万行车规级代码,跑通过“天神之眼”智能驾驶系统,管过百万辆级的整车电子电气架构,再做机器人的软硬件整合,起点远高于从零开始的创业公司。
正如李柯所说:“汽车里面软件的复杂程度,如果移植到机器人身上,对我们来说非常容易。”
场景优势是比亚迪独有的王牌。当前机器人产业正经历从“技术驱动”向“场景驱动”的关键转折,很多创业公司虽然能造出原型机,却缺乏足够大的应用场景进行验证和迭代,只能一家工厂一家工厂地推销,周期长、验证慢、迭代难。
深挖阅读AI 解读
深度分析解读
核心要点提炼
1. 战略落地:比亚迪首次官方证实自研人形机器人项目“尧舜禹”,计划2026年内部部署2万台,优先替代产线重复性岗位,2028年拓展至4S店及物流场景。
2. 技术储备:第七代原型机双足行走速度1.5m/s、负载50kg,核心零部件自研率超80%,成本较外购低40%-60%,车规级芯片“璇玑A3”可复用。
3. 生态闭环:通过“自研+投资”双轮驱动,已入股智元机器人、帕西尼感知,并与港科共建联合实验室,构建从传感器到整机的全链条能力。
影响分析
1. 产业层面:比亚迪依托新能源汽车的制造、供应链及成本控制优势,有望打破人形机器人“高成本、低效率”瓶颈。其汽车与机器人零部件通用率超60%,规模化量产能力将加速行业降本,推动工业机器人从“展示品”向“生产力工具”跨越。
2. 竞争格局:相比创业公司依赖外部场景验证,比亚迪拥有460万辆年产能的工厂作为“天然试验田”,可快速迭代产品。2026年2万台部署量级远超当前行业头部企业(如特斯拉Optimus规划年产量仅千台级),可能重塑工业机器人市场格局。
3. 资本市场:短期股价反应平淡(A股跌2%),反映市场对早期投入期的谨慎态度。但长期看,若“尧舜禹”在2028年实现规模化商用,将打开第二增长曲线,与汽车主业形成“智能驾驶+具身智能”协同效应,提升估值天花板。
总结:比亚迪正以“造车思维”降维打击人形机器人赛道,其核心优势不在技术突破,而在“制造+场景+成本”三位一体的产业化能力。若2026年2万台部署目标达成,将标志着人形机器人从实验室走向工业量产的关键转折。
机器人 热门 发布 2026/06/03 08:03 更新 2026/06/06 01:01
摩根士丹利重磅报告:人形机器人2026下半年爆发的产品看点|飞轮|人工智能_网易订阅 0
分享至好友和朋友圈
摩根士丹利重磅报告:人形机器人 2026 下半年爆发,产品经理视角下的 3 大核心机会
解读编辑:AI 研创社_产品经理体系鲍高君Robert
数据支撑:摩根士丹利《人形机器人前沿:人形机器人即将登陆彭博终端》(2026.06.01,基于 5 月 29 日英文原版的翻译稿件)
2026 年下半年,人形机器人行业将迎来历史性拐点 —— 一边是头部企业加速 IPO 登陆资本市场,一边是产能爬坡推动场景从 “技术演示” 走向 “规模化落地”。
摩根士丹利最新报告明确指出,整机厂商的量产进程将率先为中国供应链带来需求侧红利,而仓储物流已成为首个验证商业化可行性的核心场景。
作为 AI 与硬件深度融合的终极产品形态,人形机器人的发展不仅关乎技术突破,更考验产品经理对场景需求、供应链节奏与商业化路径的精准把控。本文将从产品经理视角,拆解这份报告背后的产业逻辑、产品创新方向与长期科技趋势。
一、报告核心数据速览:行业已进入量产前夜
1. 资本市场:IPO 潮点燃板块热度,短期利润让位于规模
2026 年 5 月,多家人形机器人初创企业递交 A 股或港交所 IPO 申请,树科技更新招股书成为行业情绪转暖的核心催化剂。受研发与销售费用大幅增加影响,2026 年上半年行业头部企业收入增速预计放缓至同比约 40%,经调整净利润率约 22%-25%,较 2025 年约 35% 的水平出现明显下滑。
全球层面,等权重人形机器人 100 指数自 2025 年 2 月 6 日创立以来(成分股调整后)累计上涨 62%,跑赢标普 500、MSCI 欧洲及 MSCI 中国指数;2026 年初至今,英特尔、Arm、意法半导体、哈默纳科等核心零部件厂商领涨板块。
中国市场表现更为亮眼,2026 年 5 月中国人形机器人产业链等权重指数月内上涨 8%,大幅跑赢同期 MSCI 中国指数(-3%)。其中 人形机器人的“身体” 类零部件板块领涨,月内涨幅达 11%,集成商板块次之,人形机器人的“大脑” 类公司涨幅相对滞后。
2. 技术落地:仓储场景实现人机效率持平
Figure AI 完成的 200 小时连续自主仓储分拣直播,是本月最具标志性的技术突破:三台机器人轮番作业,9 天内自主处理 249560 个包裹,全程实现自主更换电池;在 10 小时标准化对比测试中,机器人分拣速度仅比人类慢约 1.5%。这一数据首次证明,人形机器人在结构化场景下已具备替代人类完成重复性劳动的能力。
3. 产能建设:头部企业开启规模化量产
特斯拉:5 月 10 日完成弗里蒙特工厂最后一批 Model S/X 生产,该产线将全面转用于 Optimus 人形机器人量产;
Figure AI:推进专用工厂 “BotQ” 建设,初期设计年产能约 12000 台,计划数年内提升至 10 万台,成为全球首个规模化人形机器人专用生产基地。
4. 产业链全景:三大板块核心标的梳理
报告将产业链划分为人形机器人的 “大脑”“身体”“集成商” 三大核心板块,覆盖全球主流上市公司。
全球人形机器人产业链公司名单图谱
(上市公司,非完整名单)
中国人形机器人产业链公司名单图谱
(上市及非上市,非完整名单)
大脑板块
身体板块
:涵盖减速器、电机、轴承、执行器、丝杠、编码器、力 / 扭矩传感器等核心零部件,代表企业有三花智控、汇川技术、卧龙电驱、双环传动、江苏国茂、绿的谐波等;
集成商板块
:负责整机研发制造与场景解决方案落地,代表企业包括优必选、宇树科技、傅里叶智能、达闼机器人、云深处科技、小米、富士康等。
二、产品经理深度解读:从技术演示到商业化的核心逻辑
1. 产品落地:为什么仓储是第一个 “吃螃蟹” 的场景?
从产品经理的视角看,场景选择的核心标准是 “需求明确、环境结构化、ROI 可量化”,而仓储物流恰好完美契合这三点。
Figure AI 的直播验证了一个关键产品逻辑:人形机器人的 MVP(最小可行产品)不需要具备 “通用能力”,只需要在单一结构化场景下完成特定任务,且效率接近人类即可实现商业化。本次测试中,机器人的任务被拆解为 “取件 - 扫码 - 分拣 - 换电” 四个标准化步骤,环境中没有动态障碍物和突发情况,容错率要求较低,这是产品能够快速落地的前提。
反观家庭、医疗等复杂场景,需求碎片化、环境动态多变、安全要求极高,目前的技术水平还无法支撑规模化落地。因此,未来 1-2 年,人形机器人的产品迭代将遵循 “从结构化到非结构化、从单一任务到多任务、从工业场景到民用场景” 的路径,产品经理需要聚焦核心场景,避免陷入 “通用能力陷阱”。
2. 供应链:“身体先行” 的产业必然性
深挖阅读AI 解读
核心要点提炼
摩根士丹利报告明确,人形机器人行业将在2026年下半年进入量产前夜,核心驱动力来自三方面:IPO浪潮点燃资本市场情绪,多家头部企业加速上市;仓储物流场景率先验证商业化可行性,Figure AI 200小时连续作业显示机器人效率已接近人类;产能建设全面铺开,特斯拉、Figure AI等企业启动专用产线。产业链呈现“身体先行”特征,减速器、电机等核心零部件板块领涨,中国供应链将率先受益于需求红利。
影响分析
1. 短期催化(2026-2027):仓储物流成为首个规模化落地场景,相关集成商及零部件供应商订单有望爆发。中国供应链凭借成本与产能优势,将在电机、丝杠、传感器等环节获得显著增量,推动板块估值提升。但需警惕行业整体净利润率下滑(预计从35%降至22%-25%),规模扩张期盈利承压。
2. 长期格局重塑(2028+):随着技术从结构化场景向非结构化场景延伸,产品迭代路径将遵循“工业-商业-家庭”的渐进逻辑。具备场景理解力与供应链把控能力的企业将脱颖而出,而通用型机器人技术仍面临成本与安全挑战。资本市场对人形机器人的定价将逐步从“主题炒作”转向“业绩验证”,头部企业估值分化或加速。
机器人 热门 发布 2026/06/03 06:03 更新 2026/06/05 01:00
双线告捷!千寻智能Spirit v1.6横扫北美「具身奥林匹克」夺冠|算法|机器人赛道_网易订阅 0
分享至好友和朋友圈
今日,千寻智能(Spirit AI)正式官宣两大重磅里程碑:
千寻智能自研具身基座模型Spirit v1.6在被称为北美具身智能“奥林匹克”的RoboArena中成功登顶,力压英伟达Cosmos3与Physical Intelligence Pi0.5,打破硅谷霸榜魔咒成为首个登顶的中国具身模型。
完整成绩:https://robo-arena.github.io/leaderboard
与此同时,千寻智能再获15亿元A+轮融资,股东包含一线美元基金、大型产业投资方以及国资基金,老股东持续加码。至此,千寻智能已构筑起顶级财务PE、国际美元基金、实业产业资本、各地方国资等全方位合围的顶配资本阵容。
立足产业发展的关键周期,千寻智能已实现技术突破、资本加持与商业落地的“三箭齐发”。公司正以自主技术的跨代式跃升,全面拉高国内具身智能的行业基准,在物理通用智能的全球版图中,筑牢坚实的“中国技术力量”。
北美具身智能“奥林匹克” - 关于 RoboArena 榜单
RoboArena是由加州大学伯克利分校(UC Berkeley)、斯坦福大学(Stanford)及英伟达(NVIDIA)等全球顶尖学术机构与科技巨头联合发起的国际公开性具身智能机器人策略评测平台,被誉为机器人领域的“Chatbot Arena”。该榜单打破了传统单一实验室的评估模式,是目前国际上公认极具含金量与行业长效指导意义的“世界级权威主榜单”,被称为具身智能“奥林匹克”。
RoboArena 的公正性与权威性主要体现在以下核心维度:
•国际公开与分布式协作:评测依托部署在全球数十所顶尖高校与研究机构的标准化机器人硬件网络,由全球志愿评估员在多样化的真实物理环境中进行跨国界、跨机构的公开测试,具备极高的技术普适性。
•双盲成对对决机制:首创机器人领域的 A/B 测试双盲评测,评估员在完全不知晓模型开发者(匿名)的情况下,对不同策略执行同一任务的实战表现进行交叉盲测,彻底杜绝主观偏见。
•动态 Elo 评级算法:摒弃易被污染的静态跑分,引入竞技体育中经典的 Elo 动态评级算法,通过数百次国际真实物理对决,客观、真实地反映各家模型策略在复杂现实世界中的核心泛化能力。
•全开源与不可操纵性:榜单的评测框架、数据流与排名算法全量向国际社区开源,过程完全透明、可审计、可复现,奠定了其在中立性与权威性上的行业共识。
在具身智能时代,RoboArena 标志着机器人技术从“实验室自证”走向“跨国际大样本、基于真实世界的公开竞争”。能在该榜单中名列前茅,代表着算法模型在多任务、强泛化与工业级落地层面已达到全球顶尖水平。
模型登顶:Spirit v1.6力压英伟达Cosmos3与Pi0.5
资本持续加注的核心支撑,源于千寻智能在具身大模型领域的硬核技术突破。在全球具身智能竞争聚焦模型泛化能力、真实物理环境实操能力的当下,公司自研具身基座模型Spirit v1.6,在 RoboArena 权威具身智能基准测试中综合得分位列全球第一,性能超越英伟达Cosmos3 与 Physical Intelligence Pi0.5,再度实现中国具身模型对国际行业标杆的超越。
在平台多组真实场景双盲 A/B 实测中,Spirit v1.6 展现出全方位的泛化与实操优势。面对翻盖开合、精细物件抓取、多步骤连续任务等复杂场景,模型能够形成完整流畅的动作闭环,在环境理解、目标识别、动作规划与执行上表现稳健,充分印证了千寻智能的极致工程化与算法能力。
此次登顶并非单次突破,而是千寻智能在具身模型上长期深耕、高频迭代的成果沉淀。在过去半年内,从 Spirit v1.5 的跨越式演进,到新一代 Spirit v1.6再度拿下国际权威评测榜首,千寻智能用行业罕见的“连冠”成绩,再次验证了其以系统化、工业化范式驱动技术的超前性。这种持续、稳定的代际领先优势,不仅凸显了团队在通用具身大模型研发上的深厚技术底蕴,更展现了千寻智能不断将前沿突破转化为工业级、体系化技术资产的强劲实力。
数据制胜:构建“数据金字塔”与百万小时核心壁垒
在具身大模型跨代式演进的背后,除了算法层面的极致工程化,更离不开千寻智能扎实的数据基础设施支撑。具身智能的泛化能力本质上是由高质量、规模化的真实世界数据决定的。
2026年,千寻智能将积累100万小时级真实世界交互数据的阶段性沉淀,涵盖了极其丰富的长尾复杂场景与多模态操作样本。正是这种具备极高“数据密度”与“场景纯度”的底层数据基础设施,为 Spirit v1.6 模型的泛化与演进提供了不间断的数据燃料,构筑起千寻智能在具身大模型赛道上极具长效竞争力的核心护城河。
全速吸金:3个月融资近50亿刷新行业纪录
深挖阅读AI 解读
核心要点提炼
1. 技术突破:千寻智能自研具身基座模型Spirit v1.6在RoboArena(全球具身智能权威评测平台)登顶,超越英伟达Cosmos3与Physical Intelligence Pi0.5,成为中国首个夺冠模型。
2. 资本加码:获15亿元A+轮融资,股东涵盖美元基金、产业资本及国资,3个月内累计融资近50亿元,刷新行业纪录。
3. 数据壁垒:计划2026年积累100万小时级真实世界交互数据,构建“数据金字塔”护城河,支撑模型泛化能力持续领先。
影响分析
技术层面:Spirit v1.6在双盲A/B测试中展现多任务、强泛化能力,标志中国具身模型已具备国际顶尖水平,打破硅谷垄断。这为国内企业树立了技术标杆,倒逼行业加速算法与数据基础设施迭代。 产业层面:资本“三箭齐发”(技术、资本、商业)模式验证了具身智能赛道的商业化潜力。千寻智能的“连冠”成绩与高额融资,将吸引更多产业资本与国资入局,推动机器人赛道从实验室走向规模化落地。 竞争格局:RoboArena的权威性(双盲测试、全球分布式评测)使该排名成为行业“金标准”。千寻智能的登顶,不仅提升中国在具身智能领域的全球话语权,还可能引发国际巨头(如英伟达)在数据采集、模型迭代上的新一轮军备竞赛。
总结:千寻智能以技术硬实力和资本加持双轮驱动,正在重塑全球具身智能竞争格局。其“数据-模型-商业”闭环的建立,或成为行业从“实验室创新”迈向“工业级应用”的关键转折点。
机器人 热门 发布 2026/06/02 22:50 更新 2026/06/06 01:01
获得国际大赛冠军,破解“动作幻觉”难题,中国团队为机器人装上“智能大脑”|人工智能|视障人士|智能机器人_网易订阅 0
分享至好友和朋友圈
(来源:环球网资讯)
【环球时报报道 记者 李迅典】想象一下,机器人不再只是机械地执行“向前、向左、抓取”的指令,而是在行动前能像人类那样先“想一想”:我的手这样伸过去,能碰到杯子吗?如果夹得太松,杯子会不会在半路滑落?拥有这样更智能的“大脑”将成为现实。近日,全球机器人领域顶级学术盛会2026年国际机器人与自动化会议(ICRA)在奥地利维也纳落下帷幕,中国科学院自动化研究所模式识别实验室牵头的联合团队研发的模型一举拿下图像质量、动作跟随两大核心指标全球第一,打破了传统机器人智能的技术桎梏,为世界模型落地真实机器人操作场景提供了关键验证。这个模型的突破之处何在?未来将应用于哪些场景?《环球时报》记者采访了该团队负责人。
让机器人学会“三思而后行”
在ICRA备受关注的全球性具身智能挑战赛的世界模型赛道中,中方团队研发的NeoVerse-ABot模型从全球27个国家和地区的526支顶尖队伍中强势登顶,以0.829的高分斩获冠军。所谓世界模型,是指人工智能的“内部模拟器”,让它能像人一样在“脑海”中推演未来、规划行动。
长期以来,大众认知中的机器人大多是“所见即所行”的执行工具,只能依托实时视觉感知完成预设动作,缺乏对物理世界的理解与预判能力。一旦遇到空抓、物体滑落、轨迹偏移等非理想场景,传统机器人极易出现操作失误,难以适配复杂多变的真实环境。
在NeoVerse-ABot团队看来,这是区分“高级机器”与“智能体”的关键分水岭。该团队成员说,“可以把它理解为机器人的‘物理想象力’”,传统机器人更像是“条件反射”的执行者——看到红色就停止,感受到阻力就后退。它们擅长即时反馈和轨迹跟踪,却无法预判自己行为的长远后果。
NeoVerse-ABot模型的核心,就是为机器人搭建了一座连接“感知”与“决策”的桥梁。它接收两类信息:一是机器人当前“看到”的场景,二是它“计划”执行的动作序列。模型的任务就是精准预测接下来环境、物体和机械臂之间将会发生怎样的连锁变化。
过去,大家比拼的是谁能生成更好看的视频,该团队成员表示,这次ICRA赛道的难点在于,要求模型必须服从动作指令。换言之,模型不能“脑补”出一个画面精美但动作错误的未来。NeoVerse-ABot在图像质量和动作跟随两个核心指标上均排名全球第一。这意味着,中国团队开发的模型不仅能生成高清画面,更能严格遵循物理规律,将控制信号准确转化为物体的运动、接触与状态变化。团队成员表示,这说明在具身智能的关键基础问题上,中国已具备了与国际顶尖队伍同台竞争并取得领先的系统性能力。
“动作幻觉”威胁很大
在世界模型研发领域,“动作幻觉”是长期困扰全球科研团队的核心难点,也是制约机器人从实验室走向真实场景的关键阻碍。“动作幻觉”是指模型脱离机器人实际动作指令与物理逻辑,凭借训练数据的常见模式“脑补”理想化结果,出现“空抓却显示抓取成功”等虚假画面。这种视觉逼真但逻辑失真的问题,会导致机器人低估操作风险、做出不安全动作,威胁工业、民生服务等场景的设备、物品与人身安全。
在备赛过程中,该团队将破解“动作幻觉”作为核心攻坚方向。团队摒弃“失败样本是训练噪声”的传统认知,明确真实场景的失败轨迹、偏移动作、交互误差都是极具价值的监督信号。该团队系统梳理海量遥操作数据,重点挖掘夹空、滑落、补夹等失败片段,提升这类长尾样本在训练体系中的权重,让模型充分学习真实物理交互的完整结果分布。
与此同时,该团队创新引入强化学习反馈机制,重构模型评价体系。区别于传统模型仅奖励画面清晰度、流畅度的单一标准,该机制重点奖励动作匹配、因果合理、物理合规的生成结果,大幅强化模型对机器人控制信号的敏感度,从根源抑制虚假生成问题。经过多轮迭代优化,NeoVerse-ABot能够精准区分成功操作与失败交互,在非理想场景中真实预判物体原位留存、中途滑落等实际结果,摆脱“默认成功”的固有缺陷。
赛场突围赋能产业
当前,具身智能已列入我国“十五五”规划重点发展的未来产业。NeoVerse-ABot的夺冠不仅是学术胜利,更被视为中国机器人产业安装“智能大脑”的关键一步。
放眼全球,国际顶尖模型均将可交互、可预判、可模拟的世界模型作为下一代AI核心发力方向,全球技术竞争日趋激烈。该团队负责人表示,客观来看,世界模型仍处于快速迭代阶段,我国尚未实现全面领跑,但在具身智能世界模型这一细分关键领域,中国团队已彻底摆脱单纯跟随局面,在动作精准跟随、失败场景建模、工程化落地等核心维度,实现了与国际顶尖队伍并跑、局部领先。
从国内产业发展维度来看,此次技术突破精准补齐了中国机器人产业的核心短板。
深挖阅读AI 解读
核心要点提炼
1. 技术突破:中科院自动化所团队研发的NeoVerse-ABot模型在ICRA世界模型赛道夺冠,核心指标图像质量与动作跟随全球第一。
2. 破解难题:该模型针对性解决了“动作幻觉”——即机器人脱离物理逻辑“脑补”成功操作的问题,通过强化失败样本权重与创新反馈机制,实现精准物理预判。
3. 产业定位:该技术被视为机器人“智能大脑”的关键验证,契合我国“十五五”规划中具身智能的重点发展方向。
影响分析
技术层面:NeoVerse-ABot标志着机器人从“条件反射”式执行向“因果推演”的质变。其成功验证了世界模型在真实操作场景的可行性,为后续复杂任务(如精密装配、柔性操作)提供了核心算法基座。 产业层面:国内机器人产业长期受限于缺乏对物理世界的理解能力,导致在高端制造、服务等场景落地困难。此突破精准补齐了这一短板,有望加速国产机器人在物流、医疗、家庭服务等领域的商业化进程,提升供应链自主可控性。 竞争格局:在全球具身智能竞赛中,中国团队已从“跟随”转为“并跑”,并在动作跟随与失败建模等细分维度实现局部领先。这为下一阶段争夺国际标准话语权奠定了基础,但需警惕海外巨头在算力与数据生态上的整体优势。 机器人 热门 发布 2026/06/02 11:11 更新 2026/06/05 01:00
星海图发布双足机器人「行客Kengo」:以颠覆性研发路径重新定义生产力价值|机器人_新浪财经_新浪网 先有“能干活的脑”,才有“会走路的腿”。
本文为IPO早知道原创
作者|Stone Jin
微信公众号|ipozaozhidao
据IPO早知道消息,星海图于6月2日正式发布其全新双足机器人产品——行客Kengo。
具体而言,行客Kengo以高性能运动小脑与具身大脑为核心,能够完成多种高难度极限动作,具备动态环境下的自主平衡与地形适应能力。后续,行客Kengo将搭载G0.5具身大脑模型,提升语义理解与任务规划能力,致力于成为具身智能双足机器人的生产力标杆。
从产品特性上来看,行客Kengo以具有1.4m的黄金身高,单关节扭矩超130N·m,可复刻舞蹈、互动等高难度动作。同时,其采用高可靠性整机设计,倒地跌落 10 次依旧完好无损;全中空模组结构,线束折弯寿命超 20 万次,长期稳定运行,大幅降低运维成本,商用场景更安心。此外,行客Kengo仅两款核心模组即可覆盖全身关节,高标准化设计,成本可控,更适合批量落地应用。
而就在行客Kengo发布前一天,星海图还发布了新一代具身基础模型G0.5,全面提升零样本泛化能力,让机器人边思考边行动。
值得注意的是,星海图G0.5刷新机器人大模型SOTA纪录,领跑7大评测集——作为第一个具备通用落地能力的模型,G0.5在斯坦福团队发布的最大规模的、最难的一个仿真评测基准Behavior上在超越冠军 11.5%。
正是基于G0.5具备的零样本(Zero-shot)泛化能力,即将搭载G0.5的行客Kengo在第一次进入新场景后无需额外训练就能直接干活,彻底解决“机器人换个房间就变智障”的行业痛点。从另一个角度来看,愿意把自己的“大脑”安在双足机器人身上,亦反映了星海图对其具身模型的信心之足。
更加一步来讲,星海图“大脑(G系列基础大模型)×小脑(运动控制)×本体(硬件整机)”的三位一体全栈自研能力至此也更加趋于完善。当然,与传统双足机器人“先造身体,再补大脑”的研发路径不同,星海图显然走的是一条完全差异化的路——先有“能干活的脑”,才有“会走路的腿”。
事实上,作为全球“快-慢双系统”VLA模型的技术开创者,星海图在过去一段时间持续领跑全球具身基础模型能力——2025年8月开源G0 VLA大模型突破当时SOTA;2026年1月开源全球首个开箱即用VLA模型G0 Plus;2026年2月开源面向衣物折叠的垂类场景G0 VLA模型、支持端侧轻量化部署的G0 Tiny小模型,持续夯实具身智能规模化应用的技术储备。同时,星海图还在今年稍早些时候发布了全球最快的世界模型Fast-WAM,这一成果被纽约大学助理教授、DiT(diffusion transformers)核心作者谢赛宁第一季时间给予点赞,将其与图灵奖得主Yann LeCun的最新力作LeWorldModel并列推荐。
在本体端,星海图此前已推出了R1 Pro、R1 、R1 Lite等轮式双臂机器人产品,累计服务超过 150家全球顶尖具身智能开发者伙伴。其中,作为具身智能硬件的标杆,R1系列已通过 Physical Intelligence、斯坦福 AI 实验室、英伟达等全球顶尖开发者的检验,成为服务于全球顶尖模型的核心基座,亦成为全球顶尖汽车主机厂和一线物流运营商的首选生产力平台。
随着今日“行客Kengo”双足机器人产品的推出,星海图“大脑×小脑×本体”的产品矩阵更加丰富,也有望助其完成从开发者首选到生产力标杆的跨越式发展。
本文由公众号IPO早知道(ID:ipozaozhidao)原创撰写,如需转载请联系C叔↓↓↓
深挖阅读AI 解读
核心要点提炼
星海图发布双足机器人“行客Kengo”,其核心差异化在于“先脑后体”的研发路径:以具身基础模型G0.5(零样本泛化能力)为大脑,搭配高性能运动小脑与高可靠性硬件本体。产品具备1.4米黄金身高、单关节扭矩超130N·m、仅两款核心模组覆盖全身关节,强调低成本、高标准化与商业落地能力。同步发布的G0.5模型刷新7大评测集SOTA,在Behavior基准上超越冠军11.5%。
影响分析
1. 行业范式冲击:星海图颠覆了传统“先造身体再补大脑”的双足机器人研发顺序,通过“大脑先行”解决“换场景即变智障”的行业痛点,可能加速具身智能从实验室走向真实商业场景的进程。
2. 成本与复用优势:高标准化模组设计与零样本泛化能力,大幅降低运维与部署成本,使其在物流、制造等商用场景具备更强竞争力,或推动双足机器人从“技术演示品”向“生产力工具”转变。
3. 生态卡位:星海图已构建“大脑×小脑×本体”全栈自研闭环,且R1系列服务超150家全球顶尖开发者(包括Physical Intelligence、英伟达等),双足产品Kengo的加入将补全产品矩阵,强化其在具身智能产业链中的核心基座地位。
机器人 热门 发布 2026/06/02 09:08 更新 2026/06/06 01:01
单模型通吃机器人操控与导航!Qwen-VLA:跨任务、跨环境、跨形态的统一具身大模型|轨迹|动作|模态_网易订阅 0
分享至好友和朋友圈
单模型通吃机器人操控与导航!Qwen-VLA:跨任务、跨环境、跨形态的统一具身大模型
VLNer 视觉语言导航 2026年6月1日 17:34 湖南
> ✨导读:当下具身智能模型普遍各自为战、碎片化严重,操控、导航、人形机器人只能单独建模,无法通用。阿里通义团队全新推出Qwen-VLA统一视觉语言动作基础模型,首创单框架融合机器人操控、环境导航、人体轨迹建模三大任务,依托机器人感知提示、统一动作轨迹空间、四阶段渐进式训练范式,无需为不同机器人定制专属模型。不仅多项权威基准刷新SOTA,真实双臂机器人、动态未知场景、零样本泛化能力全面拉满,正式开启通用具身智能新时代!
作者:Qwen Team
单位:阿里巴巴通义实验室
论文标题:Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments
论文链接:https://arxiv.org/abs/2605.30280
项目主页:https://qwen.ai/blog?id=qwenvla
代码链接:https://github.com/QwenLM/Qwen-VLA
研究背景:具身智能深陷三大行业困局
在机器人与具身智能飞速发展的当下,现有技术方案始终无法突破瓶颈,行业痛点愈发凸显:
模型高度专用化,能力严重割裂: 目前主流具身模型都是定制化专款专用:做桌面操控的不能做室内导航、适配单臂机器人的无法用于双臂人形、仿真模型很难落地真机。每个任务、每款机器人都要单独训练专属模型,无法能力互通。
技术栈割裂,难以深度融合: 视觉语言模型(VLM)擅长视觉感知、语义理解与空间推理;扩散/流匹配策略擅长连续高维机器人动作生成。但两大技术路线长期分家,缺少从「看懂世界」到「执行动作」的端到端统一框架。
异构任务建模难度极大: 机器人操控需要预测末端位姿、关节角度、夹爪状态;导航需要预测路径航点与移动方向;人类第一视角演示是手部/腕部高维轨迹。各类任务在观测形式、控制频率、动作维度、评价标准上差异巨大,无法联合训练、相互迁移。
落地成本高、规模化受阻: 专用模型迭代慢、适配成本高,每新增一款机器人、一个新任务都要从头开发,严重限制了家庭服务、工业机器人、室内导航等场景的规模化落地。
正是基于以上行业痛点,通义团队立志打造首个真正意义上跨任务、跨环境、跨机器人形态的大一统VLA模型——Qwen-VLA。
核心贡献:五大创新重塑通用具身智能
Qwen-VLA从架构、范式、数据、训练、落地五大维度全面创新,突破性成果一览:
架构大一统: 首创共享动作-轨迹预测空间,将机器人操控、视觉语言导航、人体第一视角动作、轨迹预测全部纳入同一建模框架;基于Qwen3.5-4B多模态骨干 + 1.15B DiT流匹配动作解码器,单模型即可兼容全品类机器人与全类型具身任务。
感知提示黑科技: 独创机器人形态感知提示机制,仅通过一段自然语言文本描述机器人型号、臂型、控制频率、预测步长,无需改动任何模型结构,就能自适应不同机器人控制逻辑,实现跨机型零成本适配。
海量异构预训练数据体系: 构建超大规模混合预训练语料,囊括机器人真实轨迹、人类第一视角视频、仿真合成数据、导航轨迹、自动驾驶VQA、空间定位标注等,同时覆盖低层运动先验与高层语义推理,筑牢通用能力底座。
四阶段渐进式训练范式: 针对VLM预训练完备、动作解码器随机初始化的天然不对称性,设计T2A→CPT→SFT→RL分层训练流程,完美弥合离散语言Token与连续高维动作轨迹的维度鸿沟,兼顾训练稳定性、泛化性与任务落地精度。
全维度性能碾压SOTA: Qwen-VLA-Instruct作为单一通用模型,不针对任何基准单独微调,就在仿真操控、真实机器人、视觉导航、静态/动态分布外泛化等场景,全面超越各类专业定制模型,具备极强的零样本、跨场景、跨机型迁移能力。
统一具身模型:从建模到架构全解析 1. 统一任务建模框架
研究将机器人操控、导航、人体动作、轨迹预测所有具身任务,统一为条件概率预测公式:
:机器人多视角图像、视频时序视觉观测;
:自然语言任务指令(如“把杯子放到桌子中间”);
:机器人形态文本提示(机型、臂型、控制规则);
:任务类型标识;
:模型输出的未来H步统一动作轨迹。
无论是什么机器人、什么任务,全部复用这套预测框架,真正实现一框架通吃所有具身决策任务。
2. 双模块解耦模型架构
整体采用视觉语言骨干 + DiT动作解码器解耦设计,分工明确、各司其职:
深挖阅读AI 解读
以下是对该新闻的深度分析解读:
核心要点提炼:
1. 模型统一化突破:阿里通义团队推出Qwen-VLA,首次实现单一模型同时处理机器人操控、导航与人体轨迹建模,终结了以往“一任务一模型”的碎片化局面。
2. 技术架构创新:采用“视觉语言骨干+DiT动作解码器”双模块解耦设计,通过“形态感知提示”实现零成本跨机型适配,四阶段渐进式训练弥合了语言Token与连续动作的维度鸿沟。
3. 性能全面领先:在仿真、真机、导航、零样本泛化等场景均超越专业定制模型,具备跨任务、跨环境、跨形态的通用能力。
影响分析:
行业层面:Qwen-VLA标志着具身智能从“专用定制”向“通用基础模型”的范式转变。其统一框架将大幅降低机器人开发成本,加速家庭服务、工业自动化等场景的规模化落地,可能重塑机器人软件生态。 技术层面:该模型有效整合了VLM的语义理解与扩散策略的动作生成,为“感知-决策-执行”端到端统一提供了可行方案。其跨形态泛化能力意味着同一模型可适配不同物理构型机器人,有望推动机器人硬件与软件的解耦发展。 竞争格局:作为首个公开的统一VLA基础模型,Qwen-VLA为行业树立了新基准。后续竞争焦点将从“单一任务精度”转向“通用泛化能力”与“数据效率”,具备大模型与机器人双轨积累的团队将占据优势。
风险提示:当前模型仍依赖大规模混合数据训练,真实复杂环境下的鲁棒性、安全性及长尾任务适应性尚需更多验证;统一框架可能牺牲部分专用任务的极致性能,实际落地需权衡通用性与专业性。
机器人 热门 发布 2026/06/01 22:25 更新 2026/06/04 01:39
阿里发布Qwen3.7-Plus多模态智能体:11小时自主完成APP开发|调用|代码|app|大模型|qwen|阿里巴巴集团_网易订阅 0
分享至好友和朋友圈
凤凰网科技讯 6月2日,今日凌晨,通义实验室正式发布Qwen3.7-Plus多模态智能体模型。该模型在Qwen3.7文本与Agent能力基础上深度融合视觉能力,主打“能看、能想、能动手”——可看懂图形界面、操作应用、生成代码并交付结果,实现GUI操作、CLI调用、代码生成与自我验证的端到端闭环。
在实测中,基于Qwen3.7-Plus构建的Hybrid-Agent系统连续稳定运行11小时以上,自主完成一款英语单词学习APP的完整研发闭环:累计生成超10000行代码,触发超1000次调用,覆盖需求文档生成、代码编写、自动部署、测试用例创建、GUI自动化测试及版本迭代全流程。
在桌面应用场景中,该模型可自主交互macOS原生Stocks应用并理解UI布局与功能细节,自动生成SwiftUI源码,接入LongBridge真实行情API获取实时数据,自动编译构建并启动复刻应用。随后自主执行10项功能验证测试并全部通过,最终完整复现原生Stocks应用的暗色主题、分栏布局与实时行情交互体验。
此外,Qwen3.7-Plus还支持多模态推理(可解析地铁线路图等复杂视觉信息)、搜索增强视觉问答、图像/视频转SVG矢量代码、视觉驱动的网页设计等功能,并在浏览器Agent场景中可自动完成ECS云服务器采购、运维链路闭环等任务。模型在BabyVision、MathVision、ScreenSpot Pro、AndroidWorld等多项高难度基准上表现强劲。目前Qwen3.7-Plus已在阿里云百炼平台上线,支持OpenAI兼容API与Anthropic协议调用。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
/阅读下一篇/
相关推荐
热点推荐
### MiniMax M3终于来了,指标很强,但社区炒翻了
钛媒体APP 2026-06-03 08:30:26
### 一夜之间,ChatGPT 变成了第二个 Claude
爱范儿 2026-06-03 14:10:33
### 计算所、ETH研究者提出WorldCache,视频世界模型近无损提速3.7倍
机器之心Pro 2026-06-03 10:58:06
### MIMIC-IV 数据提取太耗时?这套零代码方案更高效
医咖会 2026-06-03 18:42:57
### 一步生成ImageNet FID 1.29!斯坦福用Wasserstein 梯度流重写模型
机器之心Pro 2026-06-03 14:23:44
### 霍贾特帮阿里去建房,小妹一个人在家做事
水云人 2026-06-02 16:59:35
### 阿里把AI Agent拉进工作群了!跨部门对接、找素材、做设计,@一下就行
智东西 2026-06-03 18:51:52
### 吴泽明跻身阿里合伙委员会,美团单列“商品销售收入”:即时零售巷战正酣,盒马、小象贴身肉搏
每日经济新闻 2026-06-03 21:06:18
每日经济新闻 2026-06-03 18:17:12
### 突发!原13薪并入绩效年终奖?阿里薪资体系+发放规则大变动
### 刚刚,Meta Skill来了
量子位 2026-06-03 09:28:08
### 马斯克用Grok替代X员工,裁员90%
量子位 2025-11-29 16:58:47
### 这个挥金如土的阔太,才是马云真正的靠山
雷科技 2025-11-12 16:35:27
### 阿姨用折叠屏算数,两边屏幕分别操作不同界面,网友:现在都是截图给AI计算
星沙时报 2026-06-01 17:58:17
财联社 2026-06-03 19:14:23
### 2026年全国高考报名人数为1290万人
央视新闻客户端 2026-06-03 14:02:58
### 马云说透成功真相! 会改变自己,才是顶级能力!
钛媒体APP 2026-06-03 17:11:10
### 智能体从「单兵作战」到「精锐团队」 -1
机器之心Pro 2026-04-28 16:55:35
### “让人无语!”小区电瓶车扫码充电要过五关,关关都有广告,一不小心就被引导去充值
都市快报橙柿互动 2026-06-03 16:48:38
深挖阅读AI 解读
深度分析:阿里Qwen3.7-Plus——从“对话”到“交付”的范式跃迁
1. 核心要点提炼
阿里通义实验室发布的Qwen3.7-Plus,并非简单的模型升级,而是多模态Agent能力的里程碑式落地。其核心突破在于三点:
端到端闭环:实现了从“看”(GUI理解)到“想”(需求推理)到“动手”(代码生成、CLI调用、GUI操作)的完整自动化链路。
长周期自主性:11小时稳定运行,自主完成超10000行代码的APP开发与测试,证明了其在复杂任务中的可靠性,远超单次交互的“玩具”阶段。
跨场景泛化:在金融应用复刻、云服务运维、复杂图表推理等场景均表现强劲,展示了通用性。
2. 影响分析
对开发者生态:这标志着“软件2.0”时代加速到来。从“人写代码”转向“人提需求、AI写代码并交付”。初级编码、测试、部署岗位面临结构性替代风险,但同时也催生“AI指令工程师”和“Agent架构师”等高阶需求。
对企业应用:企业IT开发流程将被重塑。从需求文档到MVP(最小可行产品)的周期可能从数周缩短至数小时,极大降低试错成本。云服务采购、运维等场景的自动化,将显著降低企业运营成本。
对AI行业:竞争焦点已从“模型参数”和“对话效果”转向 “Agent的自主性与可靠性” 。谁能实现更长周期、更低错误率的任务闭环,谁就能占据下一轮产业制高点。Qwen3.7-Plus的发布,为“AI替你干活”提供了真实可信的范本。
机器人 热门 发布 2026/06/01 19:02 更新 2026/06/06 01:01
黄仁勋宣布:英伟达与宇树达成合作,2026年底推出人形机器人_腾讯新闻 问AI · 人形机器人将如何开启全球工业的数万亿美元机遇?
6月1日,英伟达首席执行官黄仁勋宣布,英伟达已与宇树科技合作,推出开放式人形机器人参考设计——NVIDIA Isaac GR00T。
英伟达官网截图。
在这套系统中,宇树科技提供约1.8米高的H2人形机器人本体,英伟达则提供AI计算平台、机器人基础模型和仿真系统支持,机器人还搭载了总部位于新加坡的Sharpa公司制造的五指机械手。
黄仁勋在演讲中表示,这套系统已经完成整体集成。机器人本体拥有31个自由度,每只机械手拥有22个自由度,机器人全身总自由度达到75个;整机身高约1.8米、重量约68公斤。他还开玩笑称,这个身高和体重“就和我差不多”。
据悉,这套系统将面向高等教育机构和大学研究人员开放,客户范围包括斯坦福大学、苏黎世联邦理工学院等科研机构。
黄仁勋表示:“人形机器人将为全球工业开启数万亿美元的经济机遇。Isaac GR00T参考人形机器人为研究人员提供了一个单一的开放平台,助力他们在通用物理智能领域取得突破性发现。”
此外,英伟达Isaac GR00T开发者平台还将支持被广泛使用的宇树G1人形机器人,相关的开发工作流预计很快将在GitHub和Hugging Face上开源。
根据官方路线图,这款人形机器人将于2026年底由宇树科技正式推出。
编辑:门睿
责编:宋方灿
深挖阅读AI 解读
【核心要点提炼】
英伟达CEO黄仁勋宣布与宇树科技达成合作,推出开放式人形机器人参考设计NVIDIA Isaac GR00T。该方案整合了宇树H2机器人本体(高1.8米,重68公斤,75个自由度)与英伟达AI计算平台、基础模型及仿真系统,并搭载Sharpa五指机械手(单只22个自由度)。系统面向斯坦福、苏黎世联邦理工等高校及科研机构开放,计划2026年底量产,同时支持G1机器人的开发工作流将于GitHub和Hugging Face开源。
【影响分析】
1. 技术生态催化:英伟达以“AI计算+仿真+开源”模式切入人形机器人赛道,将加速行业标准化。开放式设计降低研发门槛,推动高校和初创企业聚焦算法创新,而非硬件重复造轮子。
2. 产业链协同效应:宇树提供本体,英伟达赋予“大脑”,Sharpa补足灵巧手,三方合作为人形机器人从实验室走向工业场景铺路。75个自由度的高灵活性,暗示其目标场景已从简单搬运升级至精密操作(如装配、医疗)。
3. 经济愿景锚定:黄仁勋提出的“数万亿美元机遇”并非空谈。若2026年如期落地,人形机器人将率先在物流、制造、养老等领域替代重复性人力,成为继自动驾驶后的下一个AI硬件爆发点。但需警惕开源路线可能削弱英伟达硬件溢价,其盈利模式或转向平台订阅与算力服务。
总结:这是人形机器人从“概念验证”迈向“工程落地”的关键一步,英伟达正试图复制GPU时代的生态霸权。
机器人 热门 发布 2026/06/01 14:44 更新 2026/06/04 01:39
2026人形机器人爆发元年 产品视角的全产业链拆解与商业价值重构|世界人工智能大会_网易订阅 0
分享至好友和朋友圈
2026 人形机器人爆发元年:产品经理视角下的全产业链拆解与商业价值重构
副标题:智元万台量产、特斯拉 7 月下线,万亿赛道的产品创新逻辑与未来十年趋势
核心观点速览(3 分钟读懂全文)
✅产业阶段跃迁:2026 年是人形机器人从 "技术验证" 到 "规模化量产" 的关键转折点,全球出货量突破 5 万台,中国贡献 70% 以上产能,智元成为全球首家实现万台级量产的企业
✅价值分配逻辑:上游核心零部件占产业链价值 48%,其中执行器系统(电机 + 减速器 + 丝杠)占硬件成本 65%-73%,是产品创新与国产替代的核心战场
✅产品策略分化:特斯拉走 "极致成本 + 通用能力" 路线,智元聚焦 "工业场景快速落地",小米主打 "C 端消费级",不同厂商的产品定义决定了市场格局
✅商业闭环初现:工业场景率先实现盈利,单台机器人年 ROI 达 25%-35%,2026 年工业应用占比 75%,单工序效率达人工 1.6 倍,成功率超 99.5%
✅未来十年趋势:2030 年软件与算法价值占比将超过硬件,2035 年全球市场规模突破 4000 亿元,人形机器人将成为继智能手机、新能源汽车之后的下一代通用智能终端
大家好,我是 产品经理体系_AI 研创社的鲍高君Robert。作为一名长期跟踪智能硬件与 AI 产品的产品经理,我见证了智能手机从功能机到智能机的革命,也经历了新能源汽车从 "小众玩具" 到 "主流交通工具" 的蜕变。而今天,我们正站在又一个历史性的转折点上 ——人形机器人正在从科幻电影走进现实,成为新质生产力的核心载体。
2026 年的今天,当智元机器人第 10000 台通用具身机器人正式下线,当特斯拉 Optimus Gen3 官宣 7 月量产并锁定亚马逊 2 万台物流长单,当小米、小鹏、比亚迪等一众科技巨头纷纷入局,我们可以清晰地看到:人形机器人的产业大幕已经拉开,一场关乎未来十年全球科技格局的竞赛已经打响。
作为产品经理,我们不仅要关注技术本身,更要思考技术如何转化为产品,产品如何创造商业价值,商业价值如何驱动产业持续发展。今天,我将从产品经理的视角,为大家全面拆解人形机器人产业链的产品创新逻辑、商业价值重构与未来科技趋势。
一、产业链全景:产品经理眼中的价值分配逻辑
从产品定义的角度来看,人形机器人是一个极其复杂的系统工程,它融合了机械工程、电子工程、计算机科学、人工智能等多个学科的前沿技术。一个完整的人形机器人产业链可以分为上游核心零部件、中游本体研发与制造、下游应用与服务三个环节。
1.1 2026 年产业链价值分布
根据我们对头部厂商供应链的深度调研,2026 年人形机器人产业链的价值分布如下:
上游核心零部件:48.0%(技术壁垒最高,价值量最大)
中游整机制造:35.0%(快速崛起,工程化能力成为核心竞争力)
下游应用与服务:17.0%(逐步落地,商业价值正在释放)
1.2 产品发展阶段特征
从产品生命周期的角度来看,当前人形机器人正处于 "硬件先行、软件跟进" 的关键时期。这与智能手机和新能源汽车的发展路径高度相似:
第一阶段(2020-2025)
:技术验证期,核心是解决 "能不能动" 的问题,硬件成本占比极高
第二阶段(2026-2029)
:量产爬坡期,核心是解决 "能不能用" 的问题,硬件成本快速下降,软件价值逐步提升
第三阶段(2030 年后)
:普及期,核心是解决 "好不好用" 的问题,软件与算法价值占比将超过 50%
产品经理洞察:在当前阶段,硬件性能与成本是决定产品竞争力的核心因素。谁能率先实现核心零部件的国产替代,谁能将整机成本降到用户可接受的范围,谁就能在这场竞赛中占据先机。
二、上游核心零部件:产品创新的 "卡脖子" 与破局点
对于人形机器人产品来说,核心零部件的性能直接决定了产品的运动能力、感知能力和续航能力。从产品设计的角度来看,我们可以将人形机器人的硬件系统分为执行器系统、感知系统、控制系统和能源系统四大模块。
2.1 执行器系统:人形机器人的 "肌肉与关节"
执行器是人形机器人最核心的硬件系统,占硬件成本的 65%-73%。它就像人类的肌肉和关节,决定了机器人的运动能力、负载能力和灵活性。
2.1.1 旋转执行器技术路线对比
技术路线
核心架构
扭矩密度
传动效率
适用关节
2026 年市场占比
国产替代率
谐波减速旋转关节
无框力矩电机 + 谐波减速器 + 双编码器 + 驱动器
35-55N·m/kg
≥80%
肩、肘、腕等轻载精密关节
45%
35%
行星减速旋转关节
无框力矩电机 + 行星减速器 + 双编码器 + 驱动器
30-45N·m/kg
深挖阅读AI 解读
以下是针对该新闻的深度分析:
核心要点提炼:
1. 产业拐点确认:2026年被视为人形机器人从“技术验证”迈入“规模化量产”的元年,全球出货量预计突破5万台,中国贡献超70%产能,智元机器人率先实现万台级量产,特斯拉Optimus Gen3锁定2万台物流订单。
2. 价值分配集中:上游核心零部件占据产业链48%价值,其中执行器系统(电机+减速器+丝杠)占硬件成本65%-73%,构成国产替代与技术创新的主战场。
3. 产品策略分化:特斯拉主打“极致成本+通用能力”,智元聚焦工业场景快速落地,小米瞄准C端消费级,不同路径决定市场格局走向。
4. 商业闭环初现:工业场景率先实现盈利,单台机器人年ROI达25%-35%,2026年工业应用占比75%,单工序效率达人工1.6倍,成功率超99.5%。
影响分析:
产业链重塑:上游核心零部件国产替代进程将加速,执行器、传感器等细分领域有望诞生百亿级龙头公司,但技术壁垒高企,短期内仍存在“卡脖子”风险。 竞争格局洗牌:特斯拉与智元的“工业+通用”路线将率先跑通商业模型,而小米等C端厂商需等待成本降至消费级阈值(约10万元以内),否则可能陷入“叫好不叫座”的困境。 投资机会聚焦:2026-2029年为量产爬坡期,硬件成本快速下降,软件与算法价值逐步提升。建议重点关注具有核心零部件自研能力、工业场景落地速度快、以及具备“硬件+软件”一体化解决方案的头部企业。2030年后,软件与算法将主导价值分配,当前布局算法生态的公司将享受长尾红利。 机器人 热门 发布 2026/06/01 14:27 更新 2026/06/02 01:18
刚刚,首个能在机器人上本地运行的具身Gemini来了-36氪 刚刚,首个能在机器人上本地运行的具身Gemini来了-36氪
刚刚,首个能在机器人上本地运行的具身Gemini来了
真・具身智能
今天,Gemini 家族迎来了一个新成员:Gemini Robotics On-Device。
这是谷歌 DeepMind 首个可以直接部署在机器人上的视觉-语言-动作(VLA)模型,可以帮助机器人更快、更高效地适应新任务和环境,同时无需持续的互联网连接。
从名字也能看出来,Gemini Robotics On-Device 属于 Gemini Robotics 系列。该模型于今年三月发布,基础模型是具备多模态推理能力的 Gemini 2.0。
据介绍,Gemini Robotics On-Device 展现出了强大的通用灵活性和任务泛化能力,并且经过优化,可在机器人机体上高效运行。
由于该模型无需数据网络即可运行,因此它对延迟敏感型应用非常有用,可确保在连接中断或零连接的环境中保持稳健性。
对此,网友自然是好评多多:
对于开发者,谷歌还将发布 Gemini Robotics SDK,可用于轻松评估 Gemini Robotics On-Device 在其任务和环境中的表现。另外,开发者还可使用该 SDK 在 DeepMind 的 MuJoCo 物理模拟器中测试该模型,并快速将其适应到新领域 —— 只需 50 到 100 个演示即可。
顺带一提,加州大学伯克利分校、谷歌 DeepMind、多伦多大学、剑桥大学联合推出的 MuJoCo Playground 刚刚获得了今年的机器人科学与系统会议(RSS 2025)杰出演示论文奖。
论文标题:Demonstrating MuJoCo Playground ;论文地址:https://www.roboticsproceedings.org/rss21/p020.pdf
## 模型功能和性能
Gemini Robotics On-Device 是用于双臂机器人的基础模型,其设计目标是最大限度地减少计算资源需求。它基于 Gemini Robotics 的任务泛化和灵活性能力,并且:
- 针对快速运行灵巧操作实验而设计。
- 可通过微调来提升性能,从而适应新任务。
- 经过优化,可在本地运行并实现低延迟推理。
DeepMind 进行了不少视觉、语义和行为泛化能力实验,整体来看,Gemini Robotics On-Device 在这些广泛的测试场景中表现强大:能够遵循自然语言指令,并完成诸如拉开袋子拉链或折叠衣服等高度灵巧的任务 —— 所有这些操作均可直接在机器人上运行完成。
即使是本地运行的 On-Device 模式,Gemini Robotics On-Device 也表现出了相当不俗的泛化性能。
可以看到,相比之前最佳的本地端机器人模型,Gemini Robotics On-Device 的优势非常明显。
在更具挑战性的分布外任务和复杂的多步骤指令方面,Gemini Robotics On-Device 也优于其他本地端方案。
当然,如果开发者无需严格要求在本地运行模型,也可以使用 Gemini Robotics 模型。对该模型我们就不过多赘述了,详情可参阅技术报告:
https://arxiv.org/pdf/2503.20020
## 可适应新任务,可跨具身泛化
Gemini Robotics On-Device 也是 DeepMind 推出的首个可供微调的 VLA 模型。虽然许多任务可以开箱即用,但开发者也可以选择调整该模型,从而获得更佳性能。
该模型只需 50 到 100 个演示即可快速适应新任务,这表明该模型能够将其基础知识泛化到新任务。
DeepMind 在七项不同难度的灵巧操作任务上测试了该模型,包括拉开午餐盒拉链、画卡片和倒沙拉酱。
下图展示了 Gemini Robotics On-Device 模型的任务适应性能,其中使用的示例少于 100 个。
他们还研究了让 Gemini Robotics On-Device 模型适应不同的机器人。训练时,他们采用的是 ALOHA 机器人,但实验表明能够进一步将其调整用于双臂 Franka FR3 机器人和 Apptronik 的 Apollo 人形机器人。
在双臂机器人 Franka 上,该模型可以执行通用指令,包括处理之前未见过的物体和场景、完成诸如折叠连衣裙之类的灵巧任务,或执行需要精准度和灵活性的工业皮带装配任务。
Apollo 人形机器人则是完全不同的机器人形态,而该模型也能相当好的适应。同一个通用模型可以遵循自然语言指令,并以通用方式操控不同的物体,包括之前未见过的物体。
深挖阅读AI 解读
核心要点提炼
1. 里程碑式发布:谷歌DeepMind推出Gemini Robotics On-Device,这是首个能在机器人本体上本地运行的视觉-语言-动作(VLA)模型,无需持续联网即可工作。
2. 能力跃迁:模型基于Gemini 2.0,具备强大的任务泛化与灵巧操作能力,仅需50-100个演示即可快速适应新任务,并支持跨机器人形态(如ALOHA、Franka、Apollo)的部署。
3. 开发者生态:同步发布SDK,支持在MuJoCo模拟器中快速测试与迁移,降低开发门槛。
影响分析
行业变革:本地化运行解决了机器人对云端算力和网络连接的依赖,将显著提升边缘场景(如家庭、工厂、危险环境)的实用性与鲁棒性,加速具身智能从实验室走向规模化落地。 竞争格局:谷歌此举直接对标特斯拉Optimus、Figure等终端智能方案,凭借Gemini多模态推理优势抢占“通用机器人大脑”赛道,可能引发VLA模型本地化部署的军备竞赛。 开发者生态:低样本微调与跨机器人兼容性将吸引更多第三方参与,推动机器人应用从专用向通用演进,但数据隐私与模型安全性(如本地推理的防护)仍待解决。
一句话总结:具身智能的“断网时代”开启,谷歌用本地化VLA模型重新定义机器人灵活性,行业拐点已至。
机器人 热门 发布 2026/06/01 11:34 更新 2026/06/05 01:00
机器人自回归的创新,让星海图横扫了7大具身评测基准|机器人_新浪财经_新浪网 编辑|Panda
上个月,Physical Intelligence 发布了新一代基础模型 π0.7,引发了一轮对具身智能泛化能力的讨论热潮。而就在今天,北京的星海图(Galaxea)又为世界带来了 G0.5。
在横跨仿真、真机、零样本、长程任务的 7 个独立基准上,G0.5 全面超越 π0.5,并在其中多项上取得 SOTA。
这不是靠堆数据堆出来的成绩。G0.5 的底层逻辑是对当前 VLA 模型主流架构做出了一个根本性的判断,并用实验数据证明了这个判断是对的。
7 大基准,全面领跑
G0.5 的成绩覆盖了 VLA 领域最主流的评测维度,数据如下:
这 7 项评测范围广泛,从不同角度检测了一个通用 VLA 模型真正需要具备的能力:开箱即用的零样本迁移、跨本体微调效率、仿真环境下的指令跟随以及现实世界中的长程复杂操作。
要在这些维度上同时保持领先,单点性能优化是做不到的。
零样本迁移能力(DROID)
DROID 是目前规模最大的真实机器人操作数据集之一,包含来自多个实验室、多种场景的 Franka 机械臂演示数据。
G0.5 在完全没有针对该平台进行任何微调的情况下,直接部署于 10 项桌面操作任务,平均成功率达到了 82.5%,超过 π0.5-DROID(57.5%)整整 25 个百分点。
尤其在需要多步骤顺序执行的任务「将积木放入抽屉并关闭抽屉」上,MolmoAct2 完全失败,而 G0.5 超过半数试验成功完成。零样本能力直接反映的是预训练阶段沉淀下来的可迁移操作先验,而不是针对某一平台的过拟合。
真实机器人微调(R1 Lite / R1 Pro)
在星海图自研平台上,G0.5 和 π0.5、GR00T-N1.7 使用相同的训练数据、相同的计算预算(各 16 张 H20 GPU),分别完成折叠毛巾、折叠纸箱、铅笔盒整理和箱子搬运堆叠等 6 项任务的评测。这些任务都不是「抓取放置」级别的简单操作,比如折叠毛巾要求机器人从篮子里取出一条变形毛巾,通过双臂协调将其展开、铺平、按预定形状折好,再放入指定区域,任何一步的抓握力度或拉伸张力出现偏差,都会导致整个流程功亏一篑。
同等条件下,G0.5 的平均成功率 76.7%,比 π0.5 的 53.0% 高出 23 个百分点,比 GR00T-N1.7 的 24.4% 高出一倍有余。
仿真基准(LIBERO / RoboTwin 2.0 / SimplerEnv-Bridge)
三项仿真测试覆盖了单臂指令跟随(LIBERO)、双臂协调操作(RoboTwin 2.0)和跨数据集迁移(SimplerEnv-Bridge)三类场景。
G0.5 在 LIBERO 上以 98.9% 的成绩位居当前已公开结果的首位,尤其在 LIBERO-Long(长程序列任务子集)上以 98.6% 的成绩超越所有对比模型。这恰恰是对长程推理能力最直接的考验。
左右滑动查看RoboTwin 2.0 包含超过 50 个双臂任务,G0.5 以 93.3% 的均值刷新了该基准的最高纪录。
G0.5 在 SimplerEnv-Bridge 上也达到 87.3% 的平均成绩,超过其它所有模型。
长程移动操作(BEHAVIOR-1K)
这是 7 项评测里门槛最高的一项,也是最能说明问题的一项。
BEHAVIOR-1K 挑战赛由 50 个完整家庭场景任务构成,每段演示平均时长 6.6 分钟,最长达 14 分钟,机器人需要控制 R1 Pro 在房间尺度的空间里导航、取物、使用电器、整理物品,其中任何一个中间步骤的失败都会影响后续所有进度。
G0.5 使用单个 checkpoint、仅经过 1 个后训练 epoch,Task Success Score 便达到 0.2904,不仅超越了 π0.5 训练 4 个 epoch 的成绩(0.2626),也超越了使用 4 个 checkpoint 集成的赛事冠军(0.2605)。训练增加至 4 个 epoch 时,G0.5 的得分提升至 0.3136。在 50 个任务中,G0.5 在 29 个上领先 π0.5,π0.5 只在 15 个上领先 G0.5。
1 个 epoch 赢过 4 个 epoch,单模型赢过集成方案。这组数字直接证明差异来自预训练底座的质量,而非微调策略。
架构创新,而非数据堆叠
G0.5 能取得这些成绩,根源在于星海图对当前 VLA 主流架构做出的一个判断:问题不在于数据量,而在于 VLM 被放错了位置。
深挖阅读AI 解读
核心要点提炼
1. 星海图G0.5全面领先:在7项覆盖仿真、真机、零样本、长程任务的独立基准测试中,G0.5全面超越π0.5等竞品,多项达SOTA。
2. 架构创新是关键:G0.5的底层逻辑是对当前VLA模型主流架构的根本性判断——问题不在数据量,而在VLM的位置。这使其以更少训练周期(1个epoch)超越对手(4个epoch),且无需集成方案。
3. 零样本与长程任务表现突出:G0.5在DROID零样本任务中成功率82.5%,远超π0.5的57.5%;在BEHAVIOR-1K长程任务中,单模型得分0.2904,超越集成方案0.2605。
影响分析
行业格局重塑:G0.5证明了在具身智能领域,架构创新比数据堆叠更有效。这或将引导行业从“数据竞赛”转向“模型设计竞赛”,加速VLA模型的迭代与标准化。 商业化加速:G0.5在零样本迁移和长程任务上的突破,意味着机器人可更快适应新环境、执行复杂任务,降低部署成本,推动具身智能在仓储、家庭等场景的落地。 技术路线启示:G0.5的成功表明,VLA模型应更注重预训练底座的质量与架构效率,而非单纯增加数据量。这为后续研究提供了明确方向——优化模型结构,而非盲目扩展训练规模。 机器人 热门 发布 2026/06/01 08:52 更新 2026/06/06 01:01
NVIDIA 正式推出 Cosmos 3:面向物理 AI 的开放前沿基础模型 | NVIDIA 英伟达博客 NVIDIA 正式推出 Cosmos 3:面向物理 AI 的开放前沿基础模型 | NVIDIA 英伟达博客
分享
扫描二维码将网页分享至朋友圈
- Email
新闻摘要:
- NVIDIA Cosmos 3 是一款全新且位居排行榜首位的开放物理 AI 基础模型,基于突破性的混合 Transformer 架构所构建,适用于物理 AI 推理、世界仿真和动作生成。
- Cosmos 3 是全球首款完全开放的全模态模型,具备原生视觉推理和跨文本、图像、视频、环境音和动作的多模态生成功能,可用于前沿的合成数据生成和物理 AI 策略模型开发。
- NVIDIA 携手多家 AI 实验室和机器人领军企业 —— 包括 Agile Robots、Black Forest Labs、Generalist、LTX、Runway 和 Skild AI —— 共同发起 NVIDIA Cosmos Coalition,旨在推动下一代开放世界模型发展。
NVIDIA GTC 台北 —— NVIDIA 今日推出 NVIDIA Cosmos™ 3,这是一款面向物理 AI 的开放世界基础模型,基于突破性的混合 Transformer(Mixture-of-Transformers) 架构所构建,将视觉推理、世界生成和动作预测集成至单一系统中。
Cosmos 3 是全球首款完全开放的全模态模型,能够以领先的物理精度原生理解并生成文本、图像、视频、环境音和动作,将物理 AI 的训练和评估周期从数月缩短至数天。
NVIDIA 同时宣布成立 NVIDIA Cosmos Coalition,这是世界模型构建者与 AI 开发者的全球协作组织 —— 成员包括 Agile Robots、Black Forest Labs、Generalist、LTX、Runway 和 Skild AI —— 旨在共同推动下一代世界模型发展。
NVIDIA 创始人兼首席执行官黄仁勋表示:“得益于多模态推理语言、视觉和世界模型领域的多项突破,物理 AI 爆发的时代已近在眼前。Cosmos 3 系列开放前沿全模态模型,助力开发者在构建机器人、智能汽车和视觉 AI 方面实现了代际飞跃,使其能够在物理世界中完成感知、推理、规划并采取行动。”
## 面向物理 AI 的全新架构
Cosmos 3 解决了物理 AI 的一项核心难题:使机器人、智能汽车或视觉智能体能够在训练数据有限和仿真堆栈碎片化的情况下,在现实世界中进行泛化。
该模型的混合 Transformer 架构将推理 Transformer 与专家生成 Transformer 相结合,从而使 Cosmos 3 能够在生成视频和动作轨迹前,完成对对象交互、运动及时空关系的解析。
该模型在最大型的多模态物理 AI 数据集之一上进行训练 —— 包括数十亿条文本、图像、视频、声音和动作轨迹样本 —— 为开发者提供了强大的预训练基础,助力其以更少的数据和更低的训练成本构建物理 AI 系统。
开发者可将 Cosmos 3 用作:
- 具备跨模态理解和推理的视觉语言模型。
- 可用于模拟物理环境并预测未来世界状态以进行训练和评估的世界模型或视频基础模型。
- 帮助训练机器人执行特定任务的世界动作模型的骨干网络。
Cosmos 3 系列为开发者在物理 AI 开发的不同阶段提供多种选择:
- Cosmos 3 Super 适用于需要极高物理仿真精度及生成质量的机器人与智能汽车模型的后训练阶段。
- Cosmos 3 Nano 可在极短时间内完成高质量视频生成和动作推理。
- Cosmos 3 Edge 即将上线,支持实时边缘推理。
## Cosmos Coalition 加速开放世界模型开发
Cosmos Coalition 是世界模型构建者、AI 开发者与物理 AI 领导者之间的全球协作组织,旨在推动各行各业的开放世界模型发展,使成员能够贡献模型、研究和评估技术,同时使用 Cosmos 3 技术、训练工具和 NVIDIA DGX™ Cloud 基础设施进行大规模训练。
创始联盟成员包括 Agile Robots、Black Forest Labs、Generalist、LTX、Runway 和 Skild AI。通过在开放环境中构建并在共享生态系统中做出贡献,该联盟旨在加速技术创新、提升兼容性,并推动物理 AI 实现更快发展。
## 开发者基于 Cosmos 进行构建
Cosmos 平台为 NVIDIA 的物理 AI 堆栈提供支持,加速各行各业的训练和评估工作流。
深挖阅读AI 解读
核心要点提炼
NVIDIA推出Cosmos 3,一款面向物理AI的开放全模态基础模型,基于混合Transformer架构,整合视觉推理、世界生成与动作预测。同步成立Cosmos Coalition联盟,联合Agile Robots、Runway等企业,旨在推动开放世界模型标准化与规模化发展。
影响分析
1. 物理AI开发范式转变:Cosmos 3将训练周期从月级压缩至天级,显著降低机器人、自动驾驶等领域的研发门槛。其开放策略有望催化行业生态,加速从仿真到现实部署的闭环。
2. 技术竞争格局重塑:通过开放全模态能力与联盟协作,NVIDIA在物理AI领域建立标准制定权。此举可能倒逼竞争对手加速开放或差异化创新,同时为中小开发者提供低成本入场路径。
3. 产业落地风险警示:模型对物理精度的依赖可能带来泛化瓶颈,尤其在极端场景下。联盟成员间的数据共享与模型互认需解决隐私与安全挑战,否则将制约实际应用规模。
机器人 发布 2026/06/01 07:20 更新 2026/06/05 01:00
英伟达官宣人形机器人参考设计:基于宇树H2打造 具备75个自由度|设计_新浪科技_新浪网 英伟达官宣人形机器人参考设计:基于宇树H2打造 具备75个自由度
快科技6月1日消息,今日,英伟达宣布推出NVIDIA Isaac GR00T人形机器人参考设计。
这是首款基于NVIDIA Jetson Thor和NVIDIA Isaac GR00T开放开发平台构建的首款开放式人形机器人参考设计。
该设计整合了宇树H2 Plus人形机器人、SharpaWave触觉五指灵巧手以及NVIDIA Jetson Thor驱动的板载计算和Isaac GR00T软件工作流程。
其统一了开发过程,帮助研究团队更快地从机器人启动过渡到技能开发和现实世界验证。
据介绍,NVIDIA Isaac GR00T人形机器人具有75个自由度,包括宇树H2人形机器人底座的31个自由度和双SharpaWave触觉五指手的22个自由度。
机器人配备多视角传感系统,包括头部立体摄像头、腕部摄像头和惯性测量单元。
全身控制能力出色,手臂扭矩高达120牛·米,腿部扭矩高达360牛·米,手臂额定有效载荷为7公斤,峰值有效载荷为15公斤。
NVIDIA Jetson AGX Thor T5000板载计算平台搭载NVIDIA Blackwell GPU,AI性能达到2070 FP4 teraflops,配备14核Arm CPU和128GB统一内存,支持实时传感器处理和机器人推理。
此外,该机器人支持以太网、Wi-Fi 6、蓝牙5.2和USB连接,并配备麦克风和扬声器,实现语音交互。
电池容量为15Ah,0.972kWh,续航时间约为3小时;机器人还支持远程紧急停止功能,确保快速安全脱离。
此外,英伟达Isaac GR00T开发者平台也将支持宇树G1人形机器人,预计将很快在GitHub和HuggingFace上公布,而NVIDIA Isaac GR00T参考人形机器人预计将于2026年底由宇树推出。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:哈尔
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
### 创事记
### 阅读排行榜
### 评论排行榜
### 科学探索
### 苹果汇
### 众测
### 来电聊
### 专题
### 官方微博
### 公众号
苹果汇
苹果汇为你带来最新鲜的苹果产品新闻
新酷产品第一时间免费试玩
提供最新的科学家新闻,精彩的震撼图片
深挖阅读AI 解读
深度分析:英伟达人形机器人参考设计
核心要点提炼
英伟达发布基于宇树H2 Plus的Isaac GR00T人形机器人参考设计,整合触觉五指灵巧手与Jetson Thor计算平台,具备75个自由度(含31个底座自由度及44个手部自由度)。关键参数包括:手臂扭矩120牛·米、腿部扭矩360牛·米、AI性能2070 FP4 teraflops,支持多模态传感与语音交互,预计2026年底由宇树量产。该设计旨在统一开发流程,加速从原型到验证的转化。
影响分析
1. 行业催化:英伟达以参考设计降低人形机器人开发门槛,推动产业链标准化。其开放平台(GitHub/HuggingFace)将吸引更多开发者,加速算法与硬件协同迭代,类似其GPU在AI领域的生态效应。
2. 竞争格局:宇树作为核心伙伴,将获得技术背书与市场先机,但其他厂商(如特斯拉Optimus)可能面临生态挤压。英伟达通过“平台+硬件”锁定,可能重塑人形机器人供应链。
3. 应用前景:75自由度与高扭矩设计指向工业精密操作场景(如装配、物流),但3小时续航与远程安全功能暗示当前仍聚焦实验室验证。商业化落地需依赖后续算力优化与成本下降。
4. 风险提示:高自由度带来控制复杂度,且2026年量产周期较长,需关注技术成熟度与竞品进展。若英伟达未能构建足够开发者社区,可能重蹈其早期机器人平台冷遇。
结论:英伟达正以“AI引擎+硬件参考”复制其半导体成功路径,但人形机器人生态尚在早期,短期象征意义大于实质影响。长期看,该设计将加速行业从“单点创新”向“系统集成”转型。
机器人 热门 发布 2026/06/01 07:10 更新 2026/06/02 01:18
物理AI爆发临近?英伟达发布“全能”世界模型 机器人、自动驾驶有望获强力助推|人工智能|机器人|物理世界|自动驾驶|英伟达_手机网易网 《科创板日报》6月1日讯 在今日举行的2026台北GTC大会期间,英伟达发布了Cosmos 3——一款基于突破性Transformer混合架构的物理AI世界模型。
据悉,Cosmos 3是全球首个完全开源的全能模型(Omni-Model,也叫全模态模型)。其能够以领先的物理精度原生理解和生成文本、图像、视频、环境声音和动作,将物理AI的训练和评估周期从数月缩短到数天。
“得益于多模态推理语言、视觉和世界模型的突破,物理AI的爆发式增长指日可待。”黄仁勋表示:“Cosmos 3将使开发者在构建机器人、自动驾驶汽车和视觉人工智能方面实现代际飞跃,从而在物理世界中感知、推理、规划和行动。”
在此之前,Cosmos系列平台均由多个专用模型整合而来,需要跑多个模型才能完成推理、生成、动作的过程。相比之下,Cosmos 3解决了物理AI的一个根本挑战:使机器人、自动驾驶汽车在训练数据有限和仿真堆栈分散的情况下,也能够在现实世界稳定工作。
在已开源的世界模型中,Cosmos 3的世界生成准确率在Artificial Analysis、Physics-IQ、PAI-Bench和R-Bench测试中均排名第一;在动作策略方面,Cosmos 3在RoboLab和RoboArena测试中排名第一。
截至目前,Cosmos已有众多机器人及自动驾驶领域的用户,根据英伟达披露的名单,包括思灵机器人、斗山机器人、LG 电子、三星、Skild AI、理想汽车等。值得一提的是,英伟达今日宣布推出Isaac GR00T人形机器人参考设计,将在2026年底由宇树推出,此外也将与美国、欧洲及韩国的人形机器人制造商合作,打造研究用途机器人。
后续,Cosmos系列模型还将继续发展,英伟达于今日宣布推出了英伟达Cosmos联盟,这是一个由世界模型构建者和AI开发人员组成的全球合作组织,其中包括思灵机器人、德国黑森林实验室、Generalist、LTX、Runway和Skild AI,将共同致力于推进下一代世界模型的发展。
浙商证券指出,物理AI还没有一个固定实现范式,当前物理AI需要世界模型+VLA共同实现,其中世界模型的实现方式尚未收敛。据英伟达测算,物理AI对应制造与物流产业重塑空间约50万亿美元;据投资机构Coatue Management测算,物理AI市场规模基准为6万亿美元。
### 热搜
### 热门跟贴
打开APP发贴
### 相关推荐
#### 英伟达黄仁勋押注物理AI,50万亿美元产业将迎颠覆?
#### AI走向物理世界的“临门一脚”还差什么?|直击BEYOND Expo 2026
#### 全球 AI 芯片格局生变:OpenAI 自研芯片 2026 年量产
#### 让机器人拥有会“预演”的大脑 上海创智学院罗剑岚团队发布开源具身世界模型
#### 2B参数“四两拨千斤”,智元世界模型GE 2.0登顶WorldArena榜单
#### 模型再强,算力连不起来也是白搭!GPU背后的第二条产业主线
#### 不只要快还要省!台积电直言:能效已成AI芯片头号优先项
#### 索尼研发乒乓球机器人打败日本顶尖选手
#### 英伟达GTC :Vera Rubin全面量产,杀入PC芯片市场,携宇树布局机器人
#### 黄仁勋对未来十年的完整判断,今天都讲明白了
#### 亦庄机器人马拉松现场名场面合集
#### 新颖鳍足机器人,水陆两栖行动自如,适应各种地形
#### 万帧照片级仿真2
#### LLM数据量大管饱,机器人数据却连1%的起跑线都没够到?
#### 黄仁勋的“五层蛋糕”:AI的底层战争,是能源战争(附全文)
#### 人形机器人半马跑姿大赏 ,有的比人快多了!有的“状况百出”
#### 朗极智能面向构建智能机器人系统发力3
#### 风投集体抛弃软件,一年1700亿元投资涌入机器人和物理AI赛道
#### 520,人类如何回应AI的告白
#### 朱旻琦:具身智能用一天进化一天、聪明一天 机器人普及核心痛点是需要二次开发和适配
深挖阅读AI 解读
深度分析:英伟达Cosmos 3发布,物理AI爆发前夜
核心要点提炼:
1. 技术突破:英伟达发布全球首个完全开源的全能世界模型Cosmos 3,基于Transformer混合架构,可原生理解并生成文本、图像、视频、环境声音及动作,实现多模态统一。
2. 效率跃升:将物理AI的训练与评估周期从数月缩短至数天,解决了此前多模型整合的碎片化问题,显著降低开发门槛。
3. 生态布局:推出Isaac GR00T人形机器人参考设计及Cosmos联盟,联合思灵、宇树、理想汽车等全球伙伴,加速从仿真到实物的落地闭环。
影响分析:
对机器人及自动驾驶行业:Cosmos 3的高精度世界生成与动作策略能力,将直接赋能具身智能体在复杂动态环境中的感知与决策。尤其对数据稀缺的细分场景,开源特性可大幅降低研发成本,加速商业化进程。英伟达测算的50万亿美元产业重塑空间,正从概念走向实质。 对AI产业格局:物理AI的“世界模型+VLA”范式虽未收敛,但Cosmos 3的开源与性能领先,可能成为行业事实标准,倒逼竞争对手加速追赶。同时,联盟化生态将强化英伟达在底层算力与工具链的统治力。 风险提示:物理AI的落地仍面临真实世界长尾场景的泛化挑战,且开源模型的滥用可能引发安全与伦理问题。投资者需关注后续实际部署效果及监管动态。 机器人 热门 发布 2026/06/01 07:09 更新 2026/06/02 01:18
NVIDIA 发布面向物理 AI 的开源智能体工具和技能集合 | NVIDIA 英伟达博客 NVIDIA 发布面向物理 AI 的开源智能体工具和技能集合 | NVIDIA 英伟达博客
分享
扫描二维码将网页分享至朋友圈
- Email
新闻摘要:
- NVIDIA 发布了涵盖 NVIDIA Omniverse、Cosmos、Alpamayo 和 Metropolis 的物理 AI 智能体技能和工具的开源集合,用于机器人、智能汽车、视觉 AI 和工业数字孪生领域。
- 全新物理 AI 技能将复杂的物理 AI 训练、评估和部署工作流转化为可重复、优化的、智能体可执行的指令。
- 包括 Agile Robots、Cadence、达索系统、台达电子、Foxconn、和硕、PTC、西门子、新思科技以及台积电在内的行业领导者,都正在使用 NVIDIA 物理 AI 工具来加速物理 AI 开发。
NVIDIA GTC 台北——NVIDIA 今日宣布推出开源物理 AI 技能与工具集合,以帮助开发者将复杂的机器人、智能汽车、视觉 AI 和工业数字孪生工作流转换为智能体可执行的任务,从而降低大规模构建物理 AI 工作流的成本、时间和复杂性。
随着 AI 智能体从编写代码转向协调整个开发任务,物理 AI 成为下一个前沿领域。作为 NVIDIA Agent Toolkit的一部分,NVIDIA 物理 AI 技能让智能体能够使用 NVIDIA 库、模型和框架,以加速机器人、辅助驾驶、工厂和实验室背后的数据生成、仿真、训练、评估和部署流程。
NVIDIA 创始人兼首席执行官黄仁勋表示:“AI 智能体正在彻底改变软件开发,而这一转变正迈向物理 AI,并进一步扩展到那些将改变交通、制造、医疗和机器人技术的系统中。当智能体可以直接使用 NVIDIA 库、模型和框架时,物理 AI 开发速度将大幅提升,使开发者能够以惊人的速度构建未来的机器人、智能汽车和工业系统。”
## 用于物理 AI 开发的代理就绪型工具和技能
NVIDIA 正通过将库、模型和框架转换为可由智能体调用的工具,来优化整个物理 AI 堆栈。其中包括用于物理世界推理和生成的世界基础模型 NVIDIA Cosmos™、用于仿真和数字孪生的 NVIDIA Omniverse™ 库、用于机器人仿真和机器人学习的 NVIDIA Isaac™、用于视觉 AI 的 NVIDIA Metropolis、用于辅助驾驶的 NVIDIA Alpamayo,以及用于边缘 AI 开发的 NVIDIA Jetson平台。
为帮助开发者应用这些工具,NVIDIA 正推出全新技能并作为 NVIDIA Agent Toolkit 的一部分,可将物理 AI 开发流程转化为编码智能体可遵循的重复执行的指令。这包括调用哪些工具、生成哪些输出,以及开发者如何验证结果。
开发者还可借助 NVIDIA NemoClaw™ 蓝图和 NVIDIA OpenShell™ 运行时,利用这些技能安全地构建和部署自主智能体,后者可在本地或云端硬件上提供基于策略的安全和隐私治理。
NVIDIA 物理 AI 技能和工具正在加速代理式开发:
- 机器人和边缘 AI:机器人开发者可以使用技能来加速整个机器人开发流程,从生成感知与移动性训练数据到仿真、实现导航训练自动化、推进机器人学习,并基于 Jetson 的边缘系统调优部署。
- 智能汽车:辅助驾驶开发者可以通过技能引导智能体把车队获取的数据放进仿真环境进行重建,大规模生成高真实度的驾驶场景,并通过闭环强化学习扩大训练和评估覆盖范围。
- 实时视觉 AI 智能体:对于自动检测和视频智能,智能体技能可帮助团队生成合成训练数据、微调模型、自动标记并构建能够搜索、总结和分析实时或录制视频 AI 智能体。
- 工业 AI:工业软件开发者可以使用这些技能将工程数据转换为计算机辅助设计 (CAD) 资产,用于数字孪生仿真,从而在减少手动设置的情况下优化大型 OpenUSD 场景。
- 医疗:在临床环境中部署自动化之前,医疗团队可以指导智能体完成医院环境数字孪生创建、仿真到现实数据生成以及软件在环策略测试。
这些技能可以组合并集成到更大的智能体系统中,使开发者能够编排和自动化复杂的工作流,例如数据生成、仿真、优化、推理调优、持续评估等。
## 行业领导者借助 NVIDIA 物理 AI 技术进行构建
制造、智能汽车、医疗和工业软件领域的行业领导者正在使用 NVIDIA 物理 AI 库来推进自主系统和工业 AI 的开发。
随着这些库实现智能体就绪,开发者可以使用 NVIDIA 技能帮助智能体在复杂的物理 AI 工作流中实现设置、执行和迭代的自动化。
在电子制造领域,台积电与和硕正在微调视觉检测模型。和硕使用缺陷图像生成技能生成的合成数据,将模型训练和部署时间缩短了 67%。
深挖阅读AI 解读
深度分析:NVIDIA 开源物理 AI 工具集——从“代码”到“技能”的范式跃迁
核心要点提炼:
1. 开源与智能体化:NVIDIA 发布了一套面向物理 AI(机器人、自动驾驶、工业数字孪生等)的开源工具和技能集合,作为其 Agent Toolkit 的一部分。核心创新在于将复杂的开发工作流(如训练、仿真、部署)封装成“技能”,供AI智能体直接调用和执行。
2. 降低门槛:此举旨在将物理 AI 开发从“手动编写代码”转变为“智能体协调任务”,显著降低大规模构建的成本、时间和复杂性。
3. 生态协同:包括台积电、西门子、Foxconn 等全球行业领导者已采用该工具集,例如和硕利用其合成数据功能将模型训练时间缩短 67%。
影响分析:
1. 对行业:这标志着物理 AI 开发进入“智能体驱动”阶段。NVIDIA 通过将底层库(Omniverse、Cosmos)转化为可编排的“技能”,实际上是在定义行业标准。竞争对手若无法提供同等易用性和生态整合能力,将面临边缘化风险。
2. 对开发者与企业:开发门槛骤降。中小企业无需组建庞大团队即可利用 NVIDIA 的完整堆栈,加速机器人、自动驾驶等产品的迭代。这将催生更多垂直应用创新,但也加深了对 NVIDIA 软硬件生态的依赖。
3. 对市场:物理 AI 的商业化进程将提速。从制造业的视觉检测到医疗的数字孪生,效率提升将直接转化为成本优势。投资者应关注那些率先整合该工具集并形成差异化应用的公司。
结论:NVIDIA 此举不仅是工具开源,更是将自身定位为物理 AI 时代的“操作系统”。其战略核心在于通过降低开发复杂度,锁定开发者生态,从而在机器人、自动驾驶等万亿级市场中占据不可替代的位置。
机器人 热门 发布 2026/06/01 05:55 更新 2026/06/06 01:01
银河通用机器人推出 LDA:全域数据、跨本体隐式世界-动作基座模型-36氪 LDA模型统一异构数据,推动具身智能进入规模化学习新阶段。
在语言模型的发展历程中,GPT-2 之所以成为一个关键里程碑,并不只是因为模型本身能力的提升,更因为它第一次系统性地定义了一个问题——如何让模型有效利用互联网规模的异构数据。
从那一刻起,语言模型不再依赖少量高质量标注数据,而是开始以“全量数据”为燃料,进入持续 Scaling 的时代。
但在具身智能领域,这个问题从未被真正解决。
不同来源的数据彼此割裂:机器人数据与人类数据难以统一,真实与仿真难以融合,有动作标注与无动作视频难以协同,高质量与低质量数据往往被割裂使用。这些结构性的断层,使得具身智能始终停留在“数据稀缺驱动”的阶段,难以走向规模化学习。
近日,银河通用机器人发布的跨本体「隐式世界-动作基础模型」LDA,正是对这一问题的正面回答。
其核心突破不单在于模型能力的探索,而在于世界范围内首次在数据层面实现:虚实共融、人机混合、质量参差、有无动作标签的数据统一有效利用。
换句话说:一个模型,开始能够“吞吐全部数据,并让所有的数据各尽其用”。
这也意味着,具身智能第一次真正具备了类似 GPT-2 的能力——进入以数据规模驱动性能持续提升的新阶段。
## 具身数据范式新标准:从“筛选数据”到“组织数据”
在具身智能中,数据问题从来不是“有没有”,而是“能不能被统一利用”。
长期以来,不同类型的数据彼此割裂:真实机器人数据规模有限,遥操作数据成本高昂,人类视频缺乏动作标注,互联网数据难以对齐物理世界,而仿真数据又始终面临真实性约束。这使得具身智能始终依赖少量高质量数据驱动,难以走向规模化。
银河通用的解决方式,是构建完整的数据基础设施——银河星数(AstraData),并在 LDA 中实现对全类数据的统一完整运用。
围绕这一体系,银河通用构建了一个自下而上的数据结构(五层金字塔):
- 互联网图像/视频/文本数据(底层):规模最大、成本最低,用于构建基础感知与语义理解能力,但与具体动作执行相关性较弱
- 人类行为数据(次底层):提供动作先验与任务理解,将“视觉认知”连接到“行为语义”
- 多本体合成仿真数据(中间层,银河自研合成数据管线产出):以物理一致性为约束,大规模生成可控、多样的机器人交互数据,实现从认知到执行的关键过渡
- 真实遥操作数据(高层):提供高质量动作示范,但规模与采集效率受限
- 真实机器人自主运行数据(顶层):来自真实部署环境的闭环数据,直接反映系统在现实世界中的运行表现,并持续驱动强化学习与系统优化
- 高质量专家数据:同时用于策略与动力学建模,定义“最优动作”
- 低质量与噪声数据:用于前向与逆向动力学学习,刻画真实世界演化
- 无动作标注视频:用于视觉预测,提取行为结构与潜在意图
在这一框架下,数据不再被简单划分为“有用或无用”,而是被系统性重组进统一的世界-动作模型之中。
这一范式在 LDA 中首次展现出清晰的规模化特征:随着数据规模从数千小时扩展至数万小时,模型性能持续稳定提升。
尤其关键的是:即使引入大量低质量甚至失败数据,模型性能不降反升;在高质量动作数据耗尽后,仅依赖无动作标注的人类视频,模型依然可以持续进步。
这意味着,低质量数据与无动作数据,同样可以驱动具身模型的持续 Scaling——这一点,是传统行为克隆(BC)及既有世界模型方法难以实现的。
从这个角度看,LDA 不仅是一个模型突破,更是「银河星数」数据体系在模型层的关键闭环——标志着具身智能开始真正进入以数据驱动的规模化发展阶段。
## 具身模型范式统一:从 VLA, World Model 到 World Action Model
如果说数据决定模型能学什么,那么模型结构决定它如何理解这些数据。
传统机器人模型,本质上是从感知到动作的映射,其能力边界在于:它可以执行动作,但并不真正理解“动作之后世界会发生什么”。
LDA 在这一点上进行了根本性改变。
银河通用提出并实践的,是将World Model(世界模型)与 Action Model(动作模型)统一的框架,即WAM(World-Action Model)。
在模型层面,LDA 并不是一次结构创新,而是银河通用长期技术路线的自然延伸。
银河通用提出并实践的,是将World Model(世界模型)与Action Model(动作模型)统一的框架,即WAM(World-Action Model)。
这一方向如今已成为具身智能领域的研究热点,但早在 2025 年 3 月,银河通用发表了 DyWA: Dynamics-adaptive World Action Model, 在全球范围内首次对 WAM 的概念进行结构化定义,并在接触动力学复杂的任务实现了成功的验证。
深挖阅读AI 解读
好的,以下是为您提供的深度分析:
【木子新闻·AI分析师】
核心要点提炼:
银河通用机器人发布LDA基座模型,核心突破在于首次系统性解决具身智能领域的数据异构难题。该模型通过“银河星数”数据体系,将互联网数据、人类视频、仿真数据、遥操作数据等全类型、全质量数据统一纳入训练,实现了“数据不筛选,全部可学习”的规模化范式。模型结构上,其“隐式世界-动作模型”统一了世界模型与动作模型,使机器人不仅会执行,更能理解动作后果。
影响分析:
1. 行业范式转变: LDA标志着具身智能从“数据稀缺驱动”正式迈入“数据规模驱动”阶段。过去依赖少量高质量动作数据的“行为克隆”模式将被颠覆,低质量甚至失败数据及海量无标注视频将成为新的性能增长点。这极大降低了高质量数据采集的昂贵门槛,加速了技术迭代。
2. 竞争壁垒重塑: 数据组织与利用能力成为核心壁垒。谁能构建更高效、更统一的数据基础设施(如银河星数),谁就能在模型性能的持续“Scaling”中占据优势。这可能导致行业资源向拥有强大数据工程能力的团队集中。
3. 技术路线确认: WAM(世界-动作模型)被证明是可行且高效的统一框架,有望成为下一代具身智能模型的标准范式。这将引导学术界和产业界的研究方向,加速从“感知-动作”简单映射向“理解-预测-执行”智能体的进化。
机器人 热门 发布 2026/06/01 01:33 更新 2026/06/01 06:38
中国具身智能产业已跨过临界点,批量机器人时代即将到来_新浪财经_新浪网 (图片源自宇树科技官方,有剪裁)2026年赛程过半,国内具身智能产业正迎来发展逻辑的实质性转变。
2025年行业重心集中在技术路线整合与落地可行性验证,一步步走完技术从雏形走向小范围应用的过渡阶段;进入今年,行业发展重心明显转向批量交付与商业自洽模式搭建,原本停留在实验室的演示产品逐步退出主流视野,整个产业朝着规模化量产的阶段加速迈进,资本端、生产端以及各类实际应用场景中,对应的产业结构调整也在同步推进。
5月22日,国内首座针对人形机器人的全生命周期管理服务平台(下称“服务平台”)于北京正式上线。服务平台在工业和信息化部科技司指导下,由工业和信息化部人形机器人与具身智能标准化技术委员会牵头建设,旨在为人形机器人产业走向标准化、规模化运行提供配套支撑。
就在产业配套体系持续完善的同时,行业头部企业的资本动作也有了新进展。上海证券交易所上市审核委员会公告显示,将于2026年6月1日召开本年度第31次审议会议,对宇树科技股份有限公司首次公开发行股票事项进行审核。目前宇树科技科创板上市申请材料已完整对外披露,2025年度经营数据也同步公之于众。这家企业的上市进程推进已久,其申请早在3月20日便获得上交所受理,且此前已经圆满完成两轮上市问询的回复工作。
当标准体系逐步筑牢、龙头企业冲刺资本市场,具身智能的产业化落地节奏不断加快,接下来整个行业又将如何真正打通从量产到盈利的关键环节?
01
从实验室走向
规模化落地
全球人形机器人产业已进入工程化落地临界点,但长期缺失统一标准,始终限制行业规模化发展。当前全球无统一数据格式、技术标尺与安全体系,直接造成研发重复投入、跨域数据割裂、各国规则博弈加剧。人形机器人的产业话语权争夺,本质是国际标准主导权的争夺。
国内正通过制度补位破解产业痛点,服务平台搭建起贯通研发、生产、准入、销售、运维、报废、回收的全链条治理体系。平台1.0版本已实现单台设备全周期身份绑定,通过设备专属溯源机制,补齐人形机器人产业监管空白,实现全生命周期可追溯管控。
服务平台工作推进会现场详细解读了《人形机器人全生命周期管理规范》标准,明确整机统一编码规则,细化各环节管控细则,覆盖产业全部参与主体。这套标准体系针对性解决产业安全、市场治理、行业监管三大核心难题,为人形机器人从试验场景走向批量商用扫清制度障碍。北京、武汉、成都、宁波等A20人工智能城市及三十余家头部企业集中签约联动,正式形成国内标准化、规范化的产业协同生态联动。
制度落地的同时,资本市场持续为赛道注入增量动能。公开数据显示,今年一季度AI领域投融资近600起、总规模超1100亿元,同比增长185.4%,行业资金流向高度集中。头部企业持续维持数十亿元年度研发投入,投入强度超越当期营收;30%至50%融资集中用于算力采购与云服务部署;行业持续全球化吸纳高端技术团队与核心人才。
在此背景下,2026年国内大模型迭代周期压缩至三个月以内,AI推理成本持续下行,技术成熟度稳步提升,直接加速具身智能商业化闭环落地。国内具身智能已形成政策、技术、数据、人才、市场“五位一体”发展架构,产业整体进入加速通道。
场景数据资源,是中国具身智能不可复制的核心竞争壁垒。云生HRWORK《具身智能发展趋势与展望》分析指出,国内多场景规模化智能终端部署,持续沉淀海量实时、多维度、高真实度的产业数据。智能制造产线传感数据,完整还原生产全流程状态;自动驾驶场景积累海量复杂路况与行车行为数据;智慧城市多源终端数据完成城市运行全域刻画;医疗终端与影像设备,持续输出可用于智能诊断训练的医疗数据。多元化落地数据,为具身智能算法迭代、复杂环境适配、智能决策优化提供核心底层支撑。
国内完善的科研与人才体系,为产业持续迭代提供了长效支撑。十年间国内AI领域核心论文2.54万篇、高端研究人才1.74万人,核心科研储备位居全球第二,夯实基础理论与算法研发根基。国内AI企业超4500家且增速迅猛,大批具身智能科创主体持续突破整机适配、灵巧作业、环境感知等关键技术,已构建从基础研究、技术攻关到场景落地的完整产业与人才梯队。
在全球标准博弈的关键阶段,中国实现人形机器人国际标准领域的突破性领跑。作为国家级自动化、机器人标准化核心依托单位,北自所累计牵头制定410余项国家级行业标准。2026年其牵头立项全球首个人形机器人数据集国际标准ISO 26264-1,同时组建并主导ISO/TC299/WG16数据集专项工作组,实现中国在人形机器人国际标准制定、国际工作组主导权的双重零突破,完成从标准跟随者到细分赛道领跑者的身份切换。
北自所党委书记、董事长王振林对《企业观察报》表示,该国际标准统一了全球人形机器人数据集全流程规范,相当于确立了全球通用研发基准,彻底破除跨国数据互通壁垒。
深挖阅读AI 解读
核心要点提炼:
1. 产业临界点已过:2026年,中国具身智能产业完成从技术验证到规模化量产的逻辑切换,重心转向批量交付与商业自洽。
2. 制度与资本双驱动:国内首个人形机器人全生命周期管理服务平台上线,统一标准体系;宇树科技冲刺科创板,头部企业资本化加速。
3. 全球标准话语权突破:中国牵头立项全球首个人形机器人数据集国际标准(ISO 26264-1),实现从跟随到领跑的转变。
影响分析:
产业化提速:全生命周期管理平台填补监管空白,统一编码与安全规范将降低研发重复投入,加速机器人从实验室走向工厂、医院等场景。北京、武汉等A20城市联动,形成区域协同生态,批量交付不再是概念。 资本集中效应:AI领域一季度投融资超1100亿元,资金高度集中于头部企业。宇树科技上市若落地,将带动二级市场对具身智能板块的估值重塑,但需警惕泡沫风险。 全球竞争格局重塑:国际标准主导权意味着中国在数据格式、技术标尺上占据先手,可能倒逼海外企业适配中国标准,强化国内产业链控制力。但数据安全与跨境合规仍是潜在摩擦点。
分析师观点:当前阶段,技术成熟度已非主要瓶颈,关键在于“量产-盈利”闭环能否跑通。成本控制、场景渗透效率与政策连续性,将是决定行业能否从“临界点”进入“爆发期”的核心变量。
机器人 热门 发布 2026/05/31 11:48 更新 2026/05/31 02:07
小米最新人形机器人的手,会「出汗」了-36氪 小米人形机器人CyberOne V2在热管理技术上取得关键突破,创新性引入“出汗”功能,通过模拟人类汗液蒸发散热机制,显著提升长时间高负载任务下的热管理能力,标志着小米在机器人热力学与仿生设计领域迈出重要一步。在交互能力方面,该机器人已实现递送伴手礼、握手、击掌等精细动作,展现出更强的触觉反馈与运动控制精度,正从实验室场景向实际应用场景过渡。战略定位上,小米未公布详细参数,暗示CyberOne V2仍处于研发后期或商业化前夜,选择在投资者大会展示旨在强化技术品牌形象并吸引资本关注,而非追求短期量产。
深挖阅读AI 解读
分析解读:小米人形机器人CyberOne V2的技术突破与战略意义
核心要点提炼:
1. 技术亮点:小米最新人形机器人CyberOne V2具备“出汗”功能,通过模拟人类汗液蒸发散热,提升长时间高负载任务下的热管理能力。这一创新表明小米在机器人热力学与仿生设计上取得关键突破。
2. 交互能力升级:机器人已能执行递送伴手礼、握手、击掌等精细动作,显示出更强的触觉反馈与运动控制精度,从实验室场景向实际应用场景迈出一步。
3. 战略定位:小米未发布详细参数,暗示该产品仍处于研发后期或商业化前夜,但选择在投资者大会展示,意在强化技术品牌、吸引资本关注,而非短期量产。
影响分析:
1. 行业竞争格局:人形机器人赛道已有特斯拉Optimus、波士顿动力等强手。小米的“出汗”散热方案为行业提供了新思路,可能加速仿生热管理技术的研发竞赛。同时,其“服务型”定位(递送、互动)区别于对手的“工业型”路线,有望切入家庭、商业服务等蓝海市场。
2. 小米生态协同:CyberOne V2若量产,将与小米智能家居、物联网设备形成协同,成为“全屋智能”的移动节点,提升用户粘性。但需警惕高成本与场景成熟度不足导致的商业化风险。
3. 供应链与成本挑战:人形机器人核心零部件(伺服电机、传感器、热管理系统)成本高昂,小米需依赖其供应链整合能力压缩成本,否则难以实现“亲民”定价。若技术突破能带动国产供应链升级,将利好整个机器人产业。
结论:小米CyberOne V2的“出汗”散热是仿生技术的实用化创新,但人形机器人从“演示”到“规模化商用”仍有距离。短期看,其战略价值在于技术储备与品牌营销;长期看,需观察小米能否在成本、场景与可靠性之间找到平衡点。
机器人 热门 发布 2026/05/31 00:00 更新 2026/06/02 01:18
“逐帧时代”终结?自变量机器人全球首个“事件级预测能力”世界模型落地 具身智能加速规模化商用竞争_央广网 近日,自变量机器人发布全球首个具备“事件级预测能力”的世界模型WALL-WM,这意味着,具身智能开始跳出沿用数十年的“按时间均匀采样”传统范式,首次将现实中的“事件”作为世界模型的基本思考单位。对此,郭涛分析,WALL-WM模型最核心的特质,是围绕语义事件重构整套具身智能推理逻辑。”在他看来,机器人进入家庭的速度将超出市场预期,具身智能的爆发点已近在眼前。
深挖阅读AI 解读
深度分析:自变量机器人WALL-WM模型落地
核心要点提炼
1. 范式突破:WALL-WM模型首次将“事件”而非时间帧作为世界模型的基本单位,打破具身智能数十年的“均匀采样”惯性。
2. 语义推理重构:模型聚焦语义事件,赋予机器人预测“下一步该做什么”的能力,而非简单复现连续动作序列。
3. 商用加速信号:郭涛认为,该技术将显著缩短机器人进入家庭的周期,具身智能规模化商用的临界点或已提前。
影响分析
技术层面:事件级预测能力解决了传统模型在动态环境中“反应滞后”的痛点,使机器人能主动预判并规划复杂交互(如抓取移动物体、应对突发障碍)。这为具身智能从“实验室演示”走向“真实场景部署”扫清关键障碍。 产业层面:WALL-WM的落地将加剧具身智能赛道竞争。率先掌握事件级推理的企业可能获得“代差优势”,尤其在家庭服务、仓储物流等高频交互场景。同时,该技术或倒逼芯片、传感器厂商适配事件驱动架构,推动产业链重构。 市场预期:若事件预测能力被验证可靠,家庭服务机器人渗透率有望在3-5年内突破5%的关键阈值,而非此前预期的10年周期。投资者需关注技术泛化性(如跨场景迁移能力)及成本控制进展。
分析师观点:WALL-WM并非渐进式改进,而是具身智能认知框架的“换道超车”。短期需警惕过度炒作,但长期看,事件级推理将成为区分“玩具”与“工具”的核心分水岭。
机器人 发布 2026/05/30 23:13 更新 2026/05/31 02:07
银河通用拉着英伟达,把人形机器人最大的谎言拆穿了-36氪 银河通用与英伟达联合戳破人形机器人领域“自主性泡沫”。当前行业存在严重“表演性”问题:大量演示依赖远程操控(VR/动捕/手柄),而非真正自主智能。资本热捧的“2026具身智能元年”与研发实际场景存在割裂。银河通用与英伟达通过技术展示或公开挑战,揭示行业普遍存在的“伪自主”现象——机器人未实现感知-决策-执行闭环,仍高度依赖人工干预。
短期冲击:戳破泡沫将加速行业洗牌。依赖“表演融资”的企业估值面临回调,资本从“押注概念”转向“验证技术落地能力”,重点关注端到端学习、零样本泛化等核心指标。长期利好:倒逼行业回归技术本质。
深挖阅读AI 解读
深度分析:银河通用与英伟达戳破人形机器人“自主性泡沫”
核心要点提炼
1. 行业现状:当前人形机器人领域存在严重“表演性”问题——大量演示依赖远程操控(VR/动捕/手柄),而非真正的自主智能。资本热捧的“2026具身智能元年”与研发中心实际场景存在割裂。
2. 事件本质:银河通用联合英伟达,通过技术展示或公开挑战,揭示了行业普遍存在的“伪自主”现象,即机器人并未实现真正的感知-决策-执行闭环,仍高度依赖人工干预。
影响分析
1. 短期冲击:戳破泡沫将加速行业洗牌。依赖“表演融资”的企业估值面临回调,资本将从“押注概念”转向“验证技术落地能力”,尤其是端到端学习、零样本泛化等核心指标。
2. 长期利好:倒逼行业回归技术本质。英伟达的算力底座(如Isaac Sim、Jetson平台)与银河通用的算法能力结合,可能推动“仿真训练+真实场景微调”的新范式,降低对人工示教的依赖。
3. 竞争格局重塑:拥有自主感知与决策底层能力(如视觉语言模型+强化学习)的企业将获得溢价,而单纯集成商或依赖遥控技术的公司面临淘汰。
结论:人形机器人的“护城河”正从“能做什么动作”转向“能否自主决策”。行业需警惕“遥控式智能”的短期诱惑,真正突破通用操作与泛化能力的瓶颈。
机器人 热门 发布 2026/05/30 17:00 更新 2026/06/01 06:38
闪电们打破人类半马世界纪录,荣耀机器人技术三重底牌首次揭秘-36氪 是时候重新思考中国机器人产业了
北京亦庄每年的机器人马拉松,是一个中国机器人水平的绝佳观察窗口。
去年,大多数机器人跌跌撞撞,甚至出现跑着跑着“头掉手断”的名场面。但短短两年内,中国机器人迅猛迭代。
今年,赛道条件变得更残酷。现场不再是实验室里平坦光滑的跑道,而是包含了陡坡、近90度直角弯、易滑砖石路面的环境,仿佛真实世界的缩影。尽管如此,今年参赛队伍数量从原来的20支激增至102支,参赛的机器人达300台。机器人不管是步态、稳定性、完成度都大幅提高,最终完赛率也从去年的30%提升至46%。
在浩荡的比赛队伍中,还多了一些全新的面孔——一台身高1.69m的机器人,通体采用亮红色涂装,线条凌厉,最吸睛的标志性视觉特征是背后有一个用于散热的“小书包”,胸前的HONOR标识格外醒目。
这台机器人来自消费电子厂商荣耀,名为“闪电”。人如其名,一起参赛的6台闪电最终包揽了赛事前六名,同步拿下“最佳设计奖”。其中,自主组齐天大圣队以50分26秒的优秀成绩一举夺冠,成为本次比赛最大的“黑马”。同样来自荣耀的机器人 “元气仔”则凭借拟人化步态和流畅优雅的跑姿,斩获“最佳步态奖”。
值得注意的是,去年的机器人马拉松比赛中,冠军“天工”的成绩是2小时40分——而“闪电”们完赛时间不仅缩短到原来的三分之一,甚至还超越了人类男性约57分20秒的世界纪录,这也是机器人第一次打破人类半马纪录。
一名现场工作人员打趣道,“荣耀的机器人都颁完奖了,其他家还没跑到终点。”
其实,这场竞技胜利的价值不仅只是金牌,它更像一把精准的手术刀,剖开了当前人形机器人行业繁华叙事下的真实肌理。
在整个行业仍沉浸于世界模型、VLA等宏大而前沿的叙事时,荣耀向行业证明了一个朴素的道理——在探讨机器人的智商上限之前,机器人首先需要有一副可靠稳定的身体。
荣耀在消费电子领域拥有多年软件、硬件、算法积累的技术栈,此次将“根技术”能力和智能制造能力完美融合进机器人领域,自此也拉开了机器人行业的全新序幕:机器人正从过去实验室里炫技,真正迈向产品化的系统工程。
不过,行业可能尚有疑问——这家“跨界”厂商如何在短时间内打响这场闪电突击战?
## 消费电子和机器人产业的一次深度技术融合
闪电从正式立项到站上马拉松冠军领奖台,荣耀机器人团队仅用时7个月。这在动辄需数年积累、技术壁垒高筑的机器人领域,堪称奇迹。
而奇迹的内核,并非从“0”到“1”的魔法,而源于一场技术与场景的研发创新——荣耀将消费电子领域长期积累的核心技术矩阵系统性、规模化地注入了机器人赛道。
一位行业观察者向36氪概括,荣耀机器人展现的能力并非单点突破,而是一套完整的系统工程,可被凝练为 “3S”法则:Strong——强劲可靠的本体、Stable——持续供给的澎湃动力、Smart——“看得清,判得准”的自主导航。
首先,长达21公里的赛程考验的是机器人的物理极限,而荣耀的“闪电”机器人的应对策略是,从关节、结构、电池三大底层进行重构。
关节,是奔跑的动力源泉。为此, 荣耀为“闪电”打造了一体化关节模组,其技术根源与手机上的精密电机控制、线性马达一脉相承。这个堪称“超级臂大肌”的关节,峰值扭矩高达400Nm,甚至超越了奥迪Q5 2.0T高性能发动机(370Nm)——相当于一台豪华SUV的爆发力,集中于机器人一个关节之上。而这样的关节,“闪电”身上搭载了四个。
不过,如此强大的扭矩,需要更强悍的骨骼来承载。因此,荣耀对整机结构进行了极致的耐压抗摔设计。其膝盖关节可承受超过整机十倍以上的重量,背后是极其复杂的结构工程能力作为支撑。
耐力,还取决于能量的持续供给。 马拉松比赛中,多数机器人需换电两到三次,而“闪电”基于荣耀手机青海湖电池技术,打造了长续航高密度双电池方案,全程仅在10公里处换电一次,大幅节约了比赛时间。
马拉松是耐力的终极试炼。荣耀在稳定性上的构建,覆盖了材料、散热、通信三个维度。
材料是可靠性的第一道防线。 当行业普遍采用铝合金主体与工程塑料外壳时,荣耀将消费电子领域积累的材料认知全面迁移:折叠屏上应用的尖端材料被首次整合应用于机器人。这使其在高速奔跑与高强度冲击下,依然保持高可靠性。
散热,是机器人耐力赛的“阿喀琉斯之踵”。 电机过热会导致机器人被迫降速,这也是一些夺冠热门在终点前突然倒下的关键原因。常见解决方案是贴散热片、加装风扇,甚至背负冰袋。而荣耀的解法更为彻底:基于手机与PC的散热技术积累,为“闪电”打造了一套液冷散热系统。
其背后的“小书包”内,装备了三个大功率风机,风量堪比七级大风。液冷管道如毛细血管般遍布核心关节,并由航天级高功率液泵驱动,实现每分钟4升的冷却液循环流量——相当于一场马拉松“流走”400瓶矿泉水。
深挖阅读AI 解读
核心要点提炼
1. 技术突破与性能飞跃:荣耀“闪电”机器人以50分26秒完赛半马,不仅将去年冠军成绩缩短至1/3,更首次超越人类男性半马世界纪录(约57分20秒),标志着机器人运动能力的质变。
2. 系统工程能力:荣耀通过“3S”法则(Strong本体、Stable动力、Smart导航),在7个月内完成从立项到夺冠的全流程,展示了消费电子技术向机器人领域的深度迁移。
3. 行业范式转变:从实验室炫技转向产品化系统工程,强调“身体”可靠性优先于“大脑”智能,为行业提供了务实的发展路径。
影响分析
短期影响:荣耀的技术路线将加速机器人行业从“概念验证”向“产品落地”转型。其消费电子级供应链整合能力(如青海湖电池、液冷散热、精密关节)为行业树立了成本与效率新标杆,可能引发其他厂商对“基础运动能力”的重新投资。
长期影响:若“3S”法则成为行业通用标准,机器人产业将更注重硬件可靠性、能源管理及环境适应性,而非单纯追求AI算法复杂度。这或倒逼上游零部件(如高扭矩关节、高密度电池)创新,并推动机器人从封闭实验室走向开放场景(如物流、巡检、救援)。同时,荣耀的跨界成功可能吸引更多消费电子巨头入局,加剧竞争并加速技术普惠。
机器人 发布 2026/05/30 10:41 更新 2026/05/30 10:41
深圳首条人形机器人中试产线启用 - 第一财经 深圳首条人形机器人中试产线正式启用,聚焦解决“从样品到产品”的工程化难题,重点突破关节模组、运动控制、整机装配等环节的批量生产一致性。该产线直接服务于深圳“20+8”产业集群规划中智能机器人赛道,预计将加速人形机器人在工业制造、商业服务等场景的试点应用。
产业端,中试产线填补了人形机器人从技术验证到商业化之间的“死亡之谷”,降低企业量产试错成本,推动供应链本土化。深圳作为硬件创新高地,其供应链协同效应(如电机、传感器、AI芯片)将辐射全国,加速人形机器人成本下探至20万元以内。竞争格局上,对比北京、上海侧重基础研发,深圳以“制造+应用”切入形成差异化优势。
深挖阅读AI 解读
核心要点提炼
深圳首条人形机器人中试产线正式启用,标志着人形机器人从实验室研发向规模化量产迈出关键一步。该产线聚焦于解决“从样品到产品”的工程化难题,重点突破关节模组、运动控制、整机装配等环节的批量生产一致性。此举直接服务于深圳“20+8”产业集群规划中智能机器人赛道的落地,预计将加速人形机器人在工业制造、商业服务等场景的试点应用。
影响分析
1. 产业端:中试产线填补了人形机器人从技术验证到商业化之间的“死亡之谷”,降低企业量产试错成本,推动供应链本土化。深圳作为硬件创新高地,其供应链协同效应(如电机、传感器、AI芯片)将辐射全国,加速人形机器人成本下探至20万元以内。
2. 竞争格局:对比北京、上海侧重基础研发,深圳以“制造+应用”切入,形成差异化优势。若产线运行稳定,2025年国内人形机器人出货量有望突破千台,率先在仓储物流、3C电子装配等场景落地。
3. 风险提示:当前人形机器人通用性仍弱于专用工业机器人,且核心部件(如高力矩密度电机)国产化率不足30%,需警惕技术迭代与产能爬坡的节奏错配。
机器人 发布 2026/05/30 08:00 更新 2026/05/30 14:47
特斯拉机器人|专利布局浮出水面,规模量产在即|特斯拉_新浪财经_新浪网 文|李景涛 尹欣驰 刘海博 李越 陈彦龙
孙晨晔 陆天宇 丁科翔 柯迈 安家正
近期世界知识产权组织(WIPO)公开了新一批特斯拉机器人相关专利,灵巧手是其机器人近期的核心升级点之一。随着特斯拉机器人外观、专利等细节公开,我们判断V3版本设计接近定型,特斯拉机器人即将进入量产阶段。特斯拉兼具领先的AI大模型技术与规模化制造能力,我们坚定看好特斯拉机器人以及供应链企业。
▍Optimus设计方案逐渐浮出水面。
近期世界知识产权组织(WIPO)公开了新一批特斯拉机器人灵巧手相关专利,我们看到特斯拉通过专利申请保护的方式,在人形机器人行业筑起领先的专利城墙。目前特斯拉已公
深挖阅读AI 解读
核心要点提炼
1. 专利布局浮出水面:WIPO公开特斯拉机器人灵巧手新专利,显示其通过知识产权保护巩固技术壁垒,灵巧手成为近期核心升级点。
2. V3版本设计定型:外观与专利细节逐步明确,判断V3版本接近最终设计,特斯拉机器人即将进入规模量产阶段。
3. 技术+制造双优势:特斯拉兼具领先的AI大模型与规模化制造能力,供应链企业有望受益。
影响分析
产业催化:专利公开与量产信号将加速人形机器人赛道竞争,特斯拉凭借技术整合与成本控制能力,可能率先实现商业化落地,推动行业从“概念验证”向“规模应用”跨越。 供应链重塑:规模化量产将带动上游零部件(如灵巧手、传感器、电机)需求爆发,具备精密制造与快速响应能力的供应商将获订单增长,但需关注特斯拉自研与外采的平衡策略。 投资逻辑:短期关注专利细节对技术路线的指引,中期聚焦量产进度与供应链验证,长期看好AI+机器人生态的协同效应。建议优先布局具备核心零部件定制能力的标的。
机器人 热门 发布 2026/05/30 05:08 更新 2026/06/01 06:14
“逐帧时代”终结?自变量机器人全球首个“事件级预测能力”世界模型落地 具身智能加速规模化商用竞争|机器人_新浪财经_新浪网 每经记者|赵雯琪 每经编辑|张益铭
全球具身智能产业走到了技术路线与商业化的双重十字路口。
5月29日,自变量机器人发布全球首个具备“事件级预测能力”的世界模型WALL-WM,这意味着,具身智能开始跳出沿用数十年的“按时间均匀采样”传统范式,首次将现实中的“事件”作为世界模型的基本思考单位。
《每日经济新闻》记者从官方介绍了解到,该模型不再机械预测每一帧画面,而是自主判断关键瞬间,以抓取、归置等语义事件为预测单元,省去大量无效推演,让机器人拥有类似人类“抓重点”的思考模式。
值得一提的是,自变量在今年4月底刚完成近20亿元B轮融资,由小米战投与红杉中国联合领投,自变量也成为国内唯一同时获字节跳动、美团、阿里巴巴、小米四家互联网巨头投资的具身智能企业。
天使投资人、资深人工智能专家郭涛在接受《每日经济新闻》记者采访时表示,WALL-WM的核心是围绕语义事件重构具身智能推理逻辑,依托事件的通用语义抽象属性,大幅提升跨物体、跨场景泛化能力。此次技术突破将加速机器人从实验室原型走向规模化商用。
过去三年,VLA(视觉—语言—动作)架构是全球具身智能领域的绝对主流,但随着机器人真机部署规模扩大,VLA的结构性缺陷日益凸显。
自变量团队指出,文本、视觉、动作本质上不在同一流形:文本是低熵离散语义,视觉是高维连续观测流,动作受物理约束,三者既不共享空间邻域也不共享时间尺度,直接联合优化会严重损耗视频基础模型的先验能力。这也解释了为何多数VLA在实验室演示亮眼,真机表现却大打折扣。此外,传统VLA只能模仿训练数据中的轨迹,无法真正理解物理规律,不知道杯子为何会掉落、盘子悬在桌边会摔碎。
据官方介绍,此次自变量机器人WALL-WM的突破在于,它在世界模型基础上彻底抛弃了“固定时间长度动作块”的人为定义,提出“以动作为中心的语义事件”作为最小学习单元。伸手、抓取、提起等连贯行为片段,既能被语言精确描述,也能被视频覆盖和动作执行,成为连接三种模态的天然枢纽。这让模型从“指令→动作”的反应式映射,升级为“理解事件→预测物理演化→执行动作”的主动式推理。
此外,WALL-WM支持同一套权重下的事件模式与统一模式切换,无需重训即可适配“配合高层规划器”和“端到端独立闭环”两种场景。实验数据显示,其在具身视频生成、3D感知及真机Core15 L1基准测试中均领先同类产品,尤其在抽象指令场景下表现突出。
对此,郭涛分析,WALL-WM模型最核心的特质,是围绕语义事件重构整套具身智能推理逻辑。它跳出行业主流的固定时间帧预测范式,以抓取、归置、抬放等关键语义事件作为基础预测单元,省去大量无关中间帧推演,使机器人复刻人类抓核心目标的思考模式。
可以看到,全球具身智能正处于从技术验证向规模化商用跨越的关键拐点。
TrendForce集邦咨询数据显示,2026年下半年全球人形机器人产业将进入商业化关键期,全年中国人形机器人产量预计同比增长94%。资本层面,2026年以来国内具身智能领域投资总额已超2025年全年,单笔10亿元以上融资达10起,资金从整机向全产业链渗透,上游零部件、中游具身大脑、下游RaaS(机器人即服务)平台均获大额注资。
头部企业也加速上市和商业化落地。宇树科技将于6月1日冲刺科创板“人形机器人第一股”,2025年实现营收17亿元、净利润6亿元;智元启动赴港IPO(首次公开募股),并通过拆分战略半年内诞生两家独角兽。国际市场上,特斯拉Optimus Gen-3已在上海超级工厂部署量产;Figure AI则不间断直播3个机器人在200个小时累计分拣包裹突破24.9万件,接近人类熟练工的水平。
在激烈竞争中,自变量凭借独特的技术路线和资本优势跻身第一梯队。其“一轮一个巨头”的融资路径备受关注:A轮美团、A+轮阿里、A++轮字节、B轮小米与红杉,累计融资额超30亿元。同时自变量也联合58同城探索机器人上门做家务的落地场景。
“为什么能够吸引这些大厂投资?我很难给出一个行业通用性的回答。”自变量机器人创始人兼CEO(首席执行官)王潜此前在接受《每日经济新闻》记者采访时坦言,“所有这些投资人投我们的逻辑,其实非常简单,就是投技术上的领先性。这几家大厂也在做大模型,应该是全世界做大模型最好的几家公司之一,他们自己的技术判断力很强,他们需要投某种意义上的技术第一性、技术驱动的事情。”
深挖阅读AI 解读
核心要点提炼
1. 技术范式突破:自变量机器人发布全球首个“事件级预测”世界模型WALL-WM,颠覆传统“按时间均匀采样”的帧预测模式,转而以“抓取、归置”等语义事件为基本预测单元,实现类人“抓重点”的主动推理。
2. 资本与商业化加速:公司获小米、红杉等20亿元B轮融资,累计超30亿元,成为唯一获阿里、字节、美团、小米四家巨头投资的具身智能企业;同时联合58同城探索“机器人上门做家务”场景,加速规模化商用。
影响分析
技术层面:WALL-WM通过语义事件统一文本、视觉、动作三模态,解决了VLA架构因流形不匹配导致的真机表现不佳问题。其“事件模式与统一模式切换”能力,使模型无需重训即可适配不同任务,显著提升跨场景泛化能力,为行业从“模仿轨迹”迈向“理解物理规律”提供了可行路径。 产业层面:全球具身智能正处于技术验证向规模化商用跨越的拐点。WALL-WM的落地将加速机器人从实验室原型走向工厂、家庭等真实场景,推动人形机器人2026年进入商业化关键期(TrendForce预测中国人形机器人产量同比增94%)。同时,头部企业(宇树、智元、特斯拉)的上市与量产竞争,将倒逼技术路线收敛,资本向具备“第一性技术”的企业集中,自变量凭借独特技术路线和巨头背书,有望跻身第一梯队。 投资逻辑:互联网巨头投资自变量并非押注单一场景,而是基于技术领先性——其“事件级预测”模型解决了具身智能的通用性瓶颈,为未来RaaS(机器人即服务)平台奠定基础。这一逻辑在资本向全产业链渗透的趋势下,将引导资金向具身大脑等核心技术环节倾斜。 机器人 发布 2026/05/30 03:40 更新 2026/05/30 14:47
「智元」自研世界模型“裸考”夺冠!力压谷歌、英伟达等|机器人|模拟器|物理世界|知名企业_网易订阅 中国具身智能公司「智元」自主研发的世界模型,在未经过针对性训练(即“裸考”)的情况下,于权威基准测试中夺冠,性能超越谷歌、英伟达等国际巨头的同类模型。该模型的核心优势在于对“物理世界变化规律”的深度理解,而非简单的数据拟合,这标志着具身智能从“感知”向“认知”跨越的关键一步。在机器人世界模型这一前沿赛道上,中国企业展现出从算法到工程化的全面竞争力,打破了海外巨头在AI基础模型上的传统垄断预期。
智元的“裸考”表现验证了“通用世界模型”在机器人领域的可行性。
深挖阅读AI 解读
核心要点提炼:
1. 事件概述:中国具身智能公司「智元」自研的世界模型在未经过针对性训练(即“裸考”)的情况下,在权威基准测试中夺冠,性能超越谷歌、英伟达等国际巨头的同类模型。
2. 技术突破:该模型的核心优势在于对“物理世界变化规律”的理解,而非简单的数据拟合,这标志着具身智能从“感知”向“认知”跨越的关键一步。
3. 竞争格局:在机器人世界模型这一前沿赛道上,中国企业展现出从算法到工程化的全面竞争力,打破了海外巨头在AI基础模型上的传统垄断预期。
影响分析:
1. 对行业:智元的“裸考”表现验证了“通用世界模型”在机器人领域的可行性。这意味着未来机器人不再需要为每个任务单独训练,而是能通过理解物理规律实现零样本迁移,极大降低部署成本。这将对仓储、制造等场景的自动化效率产生颠覆性提升。
2. 对竞争:该结果向全球AI界释放重要信号:具身智能的竞争焦点正从“算力堆砌”转向“对物理世界因果关系的建模能力”。对谷歌、英伟达等巨头而言,其依赖大规模预训练数据的路径优势可能被削弱,而中国企业在场景数据和工程落地上的积累正转化为先发优势。
3. 对投资:资本市场应重新评估具身智能赛道的估值逻辑。具备“世界模型”核心能力的公司,其技术护城河远高于单纯做硬件集成或算法调优的企业,建议重点关注拥有自研物理引擎和仿真环境的标的。
一句话总结:智元此次夺冠不仅是技术实力的证明,更是对“数据驱动”范式的一次有力挑战——真正的智能,始于对世界运行法则的深刻理解。
机器人 发布 2026/05/29 23:41 更新 2026/05/30 14:47
人形机器人进入深水区:岗位优先,热度靠边-36氪 当前人形机器人赛道正从“炫技”阶段转向“落地”深水区,行业共识明确2026年的核心考场是具体岗位,而非融资热度或舞台表演。关键转变在于构建“通用人形+专用机器人”协同体系,强调可规模化交付、ROI清晰、稳定上岗的商业闭环。多数企业仍停留在“做出人形”,远未实现“用好人形”,行业正经历从技术尝鲜到价值验证的残酷淘汰。
在行业格局上,热度驱动的泡沫将加速破裂,资本和资源向具备实际场景部署能力的企业集中;缺乏场景粘性、仅靠概念融资的公司面临出清,行业集中度提升。
深挖阅读AI 解读
深度分析:人形机器人进入“岗位优先”深水区
1. 核心要点提炼
当前人形机器人赛道正从“炫技”阶段转向“落地”深水区。行业共识已明确:2026年的核心考场是具体岗位,而非融资热度或舞台表演。关键转变在于构建“通用人形+专用机器人”协同体系,强调可规模化交付、ROI清晰、稳定上岗的商业闭环。多数企业仍停留在“做出人形”,远未实现“用好人形”,行业正经历从技术尝鲜到价值验证的残酷淘汰。
2. 影响分析
对行业格局:热度驱动的泡沫将加速破裂,资本和资源向具备实际场景部署能力的企业集中。缺乏场景粘性、仅靠概念融资的公司面临出清,行业集中度提升。 对产业链:核心零部件(伺服电机、减速器、传感器)和算法(任务规划、环境感知)的可靠性、成本控制成为关键瓶颈。协同作业体系的构建将催生“机器人即服务”(RaaS)新商业模式。 对投资者:需从“追踪技术突破”转向“评估岗位替代效率”,关注机器人在具体岗位(如仓储、巡检、装配)的节拍、故障率、投资回收期等硬指标。短期炒作风险上升,长期需押注能跑通商业闭环的头部玩家。 对社会影响:人形机器人真正进入生产岗位,将加速低技能重复性劳动的替代进程,同时催生机器人运维、调度等新岗位需求,劳动力市场结构性调整压力显现。
总结:行业正经历从“能跑能跳”到“能干活赚钱”的残酷转型,岗位优先意味着技术必须服从于商业逻辑,2026年将是检验人形机器人产业价值的真正分水岭。
机器人 热门 发布 2026/05/29 17:09 更新 2026/05/30 14:47
定义新一代具身大脑:酷哇CooWAIM 2.0发布,让机器人拥有“交互式物理推演”本能-36氪 酷哇科技正式发布CooWAIM 2.0具身大脑,其核心突破在于实现“交互式物理推演”能力。该技术基于开源DAWN世界动作模型架构,使机器人在执行任务前能够对物理世界进行实时预演与推演,而非简单执行预设指令。这标志着从传统“感知-决策”范式向“感知-推演-执行”范式的跃迁,显著提升了机器人在复杂动态环境(如早高峰十字路口、不规则地形)中的闭环规划能力。
在行业层面,CooWAIM 2.0将具身智能从“机械执行”推向“物理认知”阶段。DAWN架构的开源策略有望加速行业技术迭代,降低机器人动态环境适应门槛,直接推动服务、物流、特种作业等场景的机器人落地效率。
深挖阅读AI 解读
核心要点提炼
酷哇科技发布CooWAIM 2.0具身大脑,核心突破在于“交互式物理推演”能力。该技术通过开源DAWN世界动作模型架构,使机器人在执行任务前能对物理世界进行实时预演与推演,而非简单执行预设指令。这标志着从“感知-决策”到“感知-推演-执行”的范式跃迁,显著提升了机器人在复杂动态环境(如早高峰十字路口、不规则地形)中的闭环规划能力。
影响分析
1. 行业层面:CooWAIM 2.0将具身智能从“机械执行”推向“物理认知”阶段。DAWN架构的开源策略有望加速行业技术迭代,降低机器人动态环境适应门槛,直接推动服务、物流、特种作业等场景的机器人落地效率。
2. 竞争格局:酷哇在VLA(视觉-语言-动作)大模型赛道中,率先实现了“推演”这一关键能力差异化。这或将迫使竞争对手跟进物理仿真与实时规划融合技术,形成新的技术壁垒。
3. 长期价值:交互式物理推演是迈向通用机器人的关键基础设施。一旦成熟,机器人将具备类似人类的“本能”预判能力,从而在非结构化环境中实现更安全、更高效的自主作业。投资者应关注该技术在垂直场景(如环卫、巡检)的工程化验证进度。
机器人 发布 2026/05/29 10:09 更新 2026/05/30 09:31
大湾区人形机器人产业化形成闭环 - 人民网-广东频道 广东正加速构建人形机器人全产业链生态。2024年,广东省人工智能核心产业规模突破1800亿元,同比增长18%,其中人形机器人相关企业数量达120家,较上年增长35%。深圳、广州、东莞三地形成研发、制造、应用协同格局:深圳南山区集聚优必选、达闼科技等头部企业,人形机器人专利数量占全国18.7%;广州黄埔区建成国家级机器人检验检测中心,年检测能力达3000台次;东莞松山湖高新区落地总投资50亿元的“湾区智造”人形机器人产业园,预计2026年投产,年产能规划2万台。
关键技术取得突破。
深挖阅读AI 解读
核心要点提炼:
1. 产业规模爆发:2024年广东AI核心产业规模突破1800亿元,人形机器人企业数量激增35%至120家,产业进入高速增长期。
2. 区域协同闭环:深圳(研发专利)、广州(检测认证)、东莞(制造量产)形成“研发-检测-制造”全链条闭环,深圳专利占全国18.7%,东莞产业园规划年产2万台。
3. 技术突破驱动:人形机器人关键技术取得进展,为产业化落地提供底层支撑。
影响分析:
产业链协同效应:三地分工明确,深圳的头部企业(如优必选)与研发专利优势,结合东莞的制造产能(50亿产业园),可大幅降低量产成本,加速从实验室到工厂的转化。广州的检测中心(年3000台次)则保障了产品质量标准,形成“研发-认证-生产”的良性循环。 区域经济拉动:东莞产业园2026年投产,预计带动上下游供应链(如精密减速器、传感器)集聚,创造数千个高端岗位,并吸引资本涌入。广东有望成为全球人形机器人制造中心,与长三角(上海、杭州)形成差异化竞争。 行业竞争格局:广东的闭环生态可能重塑全球人形机器人产业链,迫使其他地区(如北京、京津冀)加速整合。但需警惕产能过剩风险,若市场渗透率不及预期(如工业场景应用缓慢),2万台年产能可能面临去库存压力。
结论:广东正从“单点突破”转向“系统级优势”,人形机器人产业化已从概念验证进入规模化落地阶段。
机器人 热门 发布 2026/05/29 10:08 更新 2026/06/01 01:01
中国越疆发布自研世界动作模型空弈DobotWAM,LIBERO成功率99.25% - 维度网 中国越疆发布自研世界动作模型空弈DobotWAM,LIBERO成功率99.25% - 维度网
中国越疆发布自研世界动作模型空弈DobotWAM,LIBERO成功率99.25%
收藏
维度网讯,中国越疆正式发布自研世界动作模型“空弈DobotWAM”。在具身智能标准评测基准LIBERO上,该模型完成了LIBERO-Spatial、LIBERO-Object、LIBERO-Goal和LIBERO-10四个标准任务套件,覆盖空间关系理解、物体泛化、目标指令理解以及长时序任务执行等关键能力维度,平均成功率达到99.25%,领先于π0.5、π0、GR00T-N1.5、π0+FAST等公开模型以及行业内已有数据公布的其他模型结果。
其中,空弈DobotWAM在LIBERO-Object上实现100/100全部成功,在Spatial、Goal和LIBERO-10三个套件中均达到99/100。
越疆空弈DobotWAM具身大模型在感知、理解、控制和数据闭环上进行了系统性设计。通过3D信息增强场景理解,通过关节动态几何loss提升动作稳定性,通过高级VLM backbone拆解复杂任务,并通过真机Recap实验与高质量数据飞轮持续回流真实操作经验,融合到统一的世界动作模型框架中,使模型能够更稳定地完成多物体、多阶段、长时序机器人操作任务。
机器人走向真实应用,需要面对的不是静态、规则、完全可控的环境,而是充满变化的开放场景。同一个任务中,物体位置、指令表达、机器人初始姿态以及物体尺寸、形状、材质和摆放方式都可能不同。机器人的真正挑战在于理解物体之间的空间关系、判断任务目标、生成符合机械臂运动结构的动作,并在多步骤执行中保持全局目标一致。近年来,VLA模型成为具身智能动作生成的重要范式,它将视觉观测、语言指令和机器人动作统一建模,在数据覆盖充分、任务边界清晰的场景中展现出较高执行效率。但如果模型过度依赖二维图像模式或离线轨迹模仿,在面对空间扰动、物体变化、长流程任务和真实接触反馈时,仍容易出现动作漂移、目标丢失,或局部动作正确但整体任务失败的问题。
越疆空弈DobotWAM具身大模型的思路,是在视觉-语言-动作建模基础上,进一步引入三维空间理解、机器人运动几何约束和真实数据闭环机制,让模型在模仿动作之外,学会理解动作的逻辑。
该模型的高成功率源于四项关键技术突破。3D-Aware Spatial Representation将3D空间信息引入视觉-语言-动作建模,使模型显式感知物体位置、空间关系与操作目标之间的几何结构。Joint Dynamic Geometry Loss将机器人关节动态信息与末端执行器几何约束融入训练loss,减少轨迹漂移和抓取失败,提升长时序任务执行稳定性。Advanced VLM Task Decomposition基于高级VLM backbone对复杂语言指令进行语义理解与任务拆解,将长流程操作分解为清晰的阶段目标。High-Quality Data Flywheel + Real-Robot Recap构建高质量数据飞轮,以Recap真机实验为核心,持续吸收成功、失败及长尾场景的真实经验。
为了验证模型在真实物理环境中的执行能力,选取了分类任务抓取、插充电器和插笔帽三类精细操作任务,验证小目标定位与姿态估计、强几何约束下的末端控制以及接触过程中的稳定执行与误差修正能力。
在LIBERO标准评测中,空弈DobotWAM具身大模型以99.25%平均成功率展现出高水平的语言条件机器人操作能力。在真实机器人演示中,该模型完成了分类抓取、插充电器、双臂协作旋转和插笔帽等精细操作任务,验证了其在真实物理环境中的空间理解、姿态控制和接触执行能力。越疆将继续围绕真实机器人场景推进空弈DobotWAM具身大模型的模型迭代。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com
上一篇:通快推出TruBend 1000 Basic Edition折弯机
相关产品
相关推荐
通快推出TruBend 1000 Basic Edition折弯机2026-05-31
最新简讯
国家手册
税务政策
深挖阅读AI 解读
深度分析:越疆空弈DobotWAM——具身智能的“动作逻辑”突破
核心要点提炼:
1. 性能碾压:越疆自研的“空弈DobotWAM”世界动作模型,在具身智能标准评测LIBERO上达成平均成功率99.25%,在Object任务上实现100%全胜,显著领先于π0、GR00T等国际主流模型。
2. 技术路径:该模型并非简单的VLA(视觉-语言-动作)堆叠,而是系统性引入了3D空间感知、关节动态几何约束以及真机数据闭环。核心思路是从“模仿动作”升级为“理解动作逻辑”,解决开放场景下的泛化与稳定性难题。
3. 落地验证:在真实物理环境中,完成了分类抓取、插充电器、插笔帽等高精度任务,证明了模型从仿真到现实的迁移能力。
影响分析:
行业竞争格局重塑:越疆此项成果,标志着中国在具身智能“大脑”层面已跻身全球第一梯队。此前行业多聚焦于硬件本体(如机械臂),而空弈DobotWAM证明了在核心算法和模型架构上,中国团队完全有能力实现反超。这对下游集成商和场景开发者是重大利好,降低了应用开发的技术门槛。 技术路线验证:该模型验证了“3D几何+数据飞轮”路线的有效性,即通过引入物理世界的几何约束和真实操作经验,来弥补纯数据驱动模型的“幻觉”和“漂移”问题。这为行业提供了一个可复用的技术范式,或将加速人形机器人、工业柔性制造等领域的商业化进程。 长期意义:当机器人学会了“理解逻辑”而非“背诵轨迹”,人机协作的边界将被大幅拓宽。未来,在仓储、家庭服务、精密装配等复杂场景中,机器人将具备更强的适应能力和容错性。
一句话总结: 越疆空弈DobotWAM的成功,不仅是数字上的领先,更是从“感知”到“认知”的关键一跃,为具身智能走向真实世界铺设了更坚实的基座。
机器人 热门 发布 2026/05/29 09:45 更新 2026/05/30 12:39
机器人告别逐帧学动作!全球首个事件级具身智能世界模型WALL-WM重磅发布 – Prompt 语宙 全球首个事件级具身智能世界模型WALL-WM正式发布,标志着机器人技术从“逐帧动作模仿”转向“事件级因果推理”。该模型不再依赖预设脚本,而是通过理解物理世界的连续事件链自主规划动作,将感知-决策-执行从“像素级”提升至“语义级”。这使得机器人能够处理长时序、多步骤的复杂任务,如整理桌面、烹饪,并显著降低对人工标注数据的依赖。
WALL-WM的发布对行业产生深远影响。它打破了传统“演示-复现”的局限,推动具身智能进入“零样本泛化”阶段。在物流、家庭服务等高频交互场景中,机器人部署成本可能下降40%以上,加速商业化落地。
深挖阅读AI 解读
核心要点提炼:
1. 技术突破:全球首个事件级具身智能世界模型WALL-WM发布,标志着机器人从“逐帧动作模仿”转向“事件级因果推理”——机器人不再依赖预设脚本,而是通过理解物理世界的连续事件链自主规划动作。
2. 范式升级:该模型将感知-决策-执行从“像素级”提升至“语义级”,使机器人能处理长时序、多步骤的复杂任务(如整理桌面、烹饪),显著降低对人工标注数据的依赖。
影响分析:
对行业:打破传统“演示-复现”的局限,推动具身智能进入“零样本泛化”阶段。物流、家庭服务等高频交互场景的机器人部署成本可能下降40%以上,加速商业化落地。 对技术路线:事件级建模或成为行业新基准,倒逼现有强化学习、模仿学习框架升级。短期内,模型对复杂物理交互的鲁棒性仍需验证,但长期看,它可能重塑机器人操作系统(ROS)的底层逻辑。 对投资:关注模型与硬件(如灵巧手、柔性传感器)的协同进化,具备事件级推理能力的机器人初创企业将获得资本青睐。
结论:WALL-WM不是“更好的算法”,而是“不同的思考方式”——它让机器人从“工具”进化为“协作者”。
机器人 发布 2026/05/29 08:09 更新 2026/05/30 14:11
天机智能成为ICRA 2026铂金合作伙伴,新一代Gento人形机器人即将亮相维也纳|算法|icra|世界人工智能大会_网易订阅 天机智能宣布成为ICRA 2026铂金合作伙伴,并将于该顶级学术会议在维也纳首发新一代Gento人形机器人。此举标志着其从技术研发向行业生态主导者战略转型,聚焦“算法+硬件”深度融合,预计集成更先进的环境感知与运动控制算法。2026年亮相的时间节点暗示产品已进入量产前冲刺阶段,商业化路径清晰。
ICRA作为机器人领域“风向标”,天机智能此次布局将加速人形机器人从实验室走向工业与服务业场景,推动行业标准制定。若Gento具备高动态平衡与灵巧操作能力,可能率先在仓储、医疗辅助等场景落地。
深挖阅读AI 解读
深度分析:天机智能亮相ICRA 2026,人形机器人商业化加速
【核心要点提炼】
1. 战略升级:天机智能成为顶级学术会议ICRA 2026铂金合作伙伴,标志着其从技术研发向行业生态主导者转型。
2. 产品突破:新一代Gento人形机器人将于维也纳首发,聚焦“算法+硬件”融合,或集成更先进的环境感知与运动控制算法。
3. 时间节点:2026年亮相,暗示该产品已进入量产前冲刺阶段,商业化路径清晰。
【影响分析】
行业层面:ICRA是机器人领域“风向标”,天机智能此举将加速人形机器人从实验室走向工业与服务业场景,推动行业标准制定。Gento若具备高动态平衡与灵巧操作能力,可能率先在仓储、医疗辅助等场景落地。 竞争格局:当前特斯拉Optimus、优必选Walker等已形成先发优势,天机智能需借ICRA平台展示差异化算法优势(如强化学习框架),否则易陷入同质化竞争。 资本市场:铂金合作与新品曝光将提振天机智能估值,但需关注2026年实际量产交付能力与成本控制,避免“概念先行、落地滞后”风险。
分析师观点:人形机器人正从“技术验证期”进入“场景渗透期”,天机智能的ICRA布局是抢占话语权的关键一步。建议投资者重点跟踪其2025年Q4的算法开源进展与供应链合作伙伴。
机器人 发布 2026/05/29 08:00 更新 2026/05/30 14:47
全球第一!智元斩获WorldArena世界模型总决赛冠军!|机器人_新浪科技_新浪网 智元自主研发的世界模型GE2.0在WorldArena Track1(感知与动作响应赛道)中夺冠,标志着中国具身智能团队在全球前沿技术竞赛中取得关键突破。该模型的核心能力在于构建“感知-预测-规划”闭环:通过环境感知生成高保真物理世界模拟,并据此输出精确的机器人动作指令。这一成就不仅是算法精度的胜利,更意味着智元在“虚拟训练-现实迁移”的Sim-to-Real路径上迈出实质性一步。
从技术层面看,世界模型被视为通往通用机器人(通用具身智能)的“大脑”。GE2.0夺冠验证了基于视频预测与物理推理的决策范式在复杂任务中的有效性,可能加速行业从“规则编程”向“认知生成”的范式切换。
深挖阅读AI 解读
深度分析:智元GE2.0登顶WorldArena
1. 核心要点提炼
智元自研世界模型GE2.0在WorldArena Track1(感知与动作响应赛道)夺冠,标志着中国具身智能团队在全球前沿技术竞赛中取得关键突破。该模型的核心能力在于“感知-预测-规划”闭环:通过环境感知生成高保真物理世界模拟,并据此输出精确的机器人动作指令。这不仅是算法精度上的胜利,更意味着智元在“虚拟训练-现实迁移”的Sim-to-Real路径上迈出实质性一步。
2. 影响分析
技术层面:世界模型被认为是通往通用机器人(通用具身智能)的“大脑”。GE2.0夺冠验证了基于视频预测与物理推理的决策范式在复杂任务中的有效性,可能加速行业从“规则编程”向“认知生成”的范式切换。 产业层面:对智元而言,此荣誉直接提升其技术估值与行业话语权,有助于吸引顶级人才与资本。对国内机器人生态而言,打破了海外在具身智能基础模型领域的垄断叙事,为国产机器人操作系统与仿真平台提供了可信的底层技术选项。 竞争格局:WorldArena作为权威评测,其排名直接影响技术路线选择。GE2.0的领先可能促使更多企业将研发重心向“世界模型+强化学习”倾斜,并加速人形机器人从实验室走向工厂、家庭场景的落地节奏。
结论:这不是一次简单的排行榜登顶,而是中国具身智能从“跟随”向“定义”转变的信号。后续需关注其模型泛化能力与真实场景部署成本。
机器人 热门 发布 2026/05/29 07:48 更新 2026/06/01 06:14
高擎Mini Pi plus开源人形机器人平台 ICRA 2026全球首发,有哪些看点?|pi|mini|人机交互_网易订阅 0
分享至好友和朋友圈
原文作者:公众号“机器人大讲堂”
原文链接:https://mp.weixin.qq.com/s/xqs7KMoQQcCnszrSq4N7vg
在机器人科研与教育领域,“买得起、用得上、能持续开发”的人形平台长期缺席。
机器人大讲堂近日获悉,ICRA 2026上,高擎动力即将带来的Mini Pi plus,试图用15kg的轻量化机身、完整的开源生态和从仿真到真机的全栈工具链,填上这个空白。
01.
人形科研平台的不可能三角
过去两年,人形机器人走向产业化前夜,但科研端的真实体验却并不乐观。对高校实验室、研究机构和机器人竞赛团队而言,选购人形开发平台,往往依然陷入“不可能三角”:高性能、低成本、易用且安全,三者鲜少兼得。
放眼市面上的主流产品,要么是高度近一米、自重接近30公斤的重型平台,搬运需要两人,跌倒一次维修成本高昂,共享实验室的安全审批更是难题;要么是玩具级的轻量产品,电机扭矩不足、URDF模型与真机严重脱节,仿真跑得通、真机跑不动,研究价值有限。
更隐蔽的痛点在于软件生态。多数厂商提供SDK和ROS接口后便止步于API列表,没有从零开始的完整上手指南,缺乏强化学习基线、Sim2Real部署指引与真实任务示例。最终,研究团队的大量时间其实都消耗在环境搭建和“填坑”上,而非算法创新本身。
这正是高擎动力在ICRA 2026上发布Mini Pi plus的出发点,他们试图用一台轻量化、高性能且软件生态完全开源的小型人形机器人,打破科研平台的价格壁垒与技术黑箱。
02.
轻量化不是妥协,而是设计哲学
从机器人大讲堂拿到的参数来看,Mini Pi plus给人的第一印象是“轻量”,其整机高度75.6厘米,重量仅15公斤,远低于主流平台整机高度95-123厘米、重量19.5-29公斤的范围。
这一尺寸并非单纯为了便携,而是经过深思熟虑的科研适配。因此这个尺寸,使其可以在共享实验室环境中安全使用,无需安装物理围栏,一名研究者即可轻松搬运;即便在频繁迭代的强化学习训练中发生跌倒,低冲击动能也大大降低了硬件损坏风险和维修频次,让“高频试错”成为可能。
但轻量化绝不意味着性能妥协。Mini Pi plus的峰值扭矩达到21Nm,全身23或27个自由度(DOF),支持行走、奔跑甚至后空翻等动态动作。其质量-扭矩比接近1:1,在小体积内实现了全尺寸人形机器人的动力学性能。单次充电续航1-2小时,足以覆盖一次完整的实验流程。
据机器人大讲堂了解,Mini Pi plus已通过Project Instinct真机验证,可以完成后空翻、复杂地形自主穿越和跌倒自主恢复等高动态任务。这些以往只在大型双足平台上才能看到的动作,如今被压缩进了一台15kg的机身中。
技术上真正的突破还在于通信架构。Mini Pi plus全身关节均采用CAN-FD总线通信,电机控制环频率高达30kHz,实时驱动环1kHz,配合PD控制与前馈力矩补偿,确保了高频控制指令的顺畅下发,不存在传统串行总线带来的瓶颈。对于从事全身控制(Whole-Body Control)、模型预测控制(MPC)或深度强化学习的研究者而言,这种底层实时能力是验证先进算法的必要前提。
03.
从源头压缩Sim2Real鸿沟
机器人大脑模型研究是当前的主流方向,而Sim2Real GAP一直是腿足机器人研究的“隐形杀手”。
许多团队在Isaac Gym或MuJoCo中训练好的策略,部署到真机时却步履蹒跚,原因往往不是算法本身,而是URDF模型与真实硬件的系统性偏差。包括电机惯量、摩擦参数、减速器非线性等细节问题,往往在厂商提供的模型中被简化或忽略。
Mini Pi plus的解决思路是从源头对齐。高擎动力公开了经过出厂校准的完整URDF模型,电机参数、关节限位、惯量信息直接写入模型,仿真与真机的动力学特性高度一致。
与此同时,团队提供了域随机化、系统辨识与特权信息蒸馏的完整Sim2Real pipeline,兼容IsaacLab、MuJoCo和Gym等主流仿真器。这意味着研究者可以将精力集中在策略设计上,而非耗费数周去“调gap”。
04.
从ROS上下到全栈工具链生态开源
如果说硬件参数决定了平台的下限,那么软件生态则决定了科研的上限。
Mini Pi plus的开源策略并非简单地挂一个GitHub链接,而是构建了分层、全覆盖的开发体系。
底层(ROS以下)Python/C++ SDK + ROS 1/2双栈支持,提供从高层脚本到底层实时控制的完整API。7通道CAN-FD拓扑、统一URDF/TF/RViz/相机/ONNX全链路,这意味着研究者可以轻松接入自己的感知与控制模块,无需逆向工程。
深挖阅读AI 解读
深度分析:高擎Mini Pi plus开源人形机器人平台
核心要点提炼:
1. 填补空白:Mini Pi plus定位为“买得起、用得上、能持续开发”的轻量级开源人形科研平台,旨在打破高性能、低成本、易用性难以兼得的“不可能三角”。
2. 硬件突破:15kg机身、75.6cm高度、峰值扭矩21Nm,支持后空翻等高动态动作,采用CAN-FD总线实现30kHz控制环,兼顾安全性与性能。
3. 软件生态:提供完整开源URDF模型、Sim2Real全栈工具链(兼容IsaacLab/MuJoCo),以及从底层SDK到ROS双栈的分层开发体系,从源头压缩仿真到真机的鸿沟。
影响分析:
科研效率提升:轻量化设计降低了实验室部署门槛(无需围栏、单人搬运),高频试错能力将加速强化学习与全身控制算法迭代,减少“环境搭建”对创新时间的挤占。 开源生态催化:完整工具链与校准模型的开放,有望降低人形机器人研究的技术壁垒,吸引更多高校和中小团队参与,推动行业从“硬件竞赛”转向“算法创新”。 产业链信号:若Mini Pi plus验证了“小体积高性能”的可行性,可能倒逼传统重型平台厂商重新定义产品线,并加速人形机器人在教育、服务等轻量场景的落地。
一句话结论:Mini Pi plus不仅是硬件参数的突破,更是一次“科研民主化”的尝试——当开发环境从“填坑”变为“即用”,人形机器人的算法创新或将迎来爆发期。
机器人 发布 2026/05/29 03:14 更新 2026/05/30 12:39
“具身智能小镇”来了,机器人逛超市买菜满街跑,AI充当NPC,来自上海AI Lab-36氪 上海AI Lab构建的“具身智能小镇”是一个高密度、多模态、可交互的机器人训练与测试沙盒,其核心突破包括三方面:场景复杂度跃升,机器人需在超市、街道等动态环境中处理多任务并发,如避让行人、识别商品和对话交互;AI NPC系统利用大语言模型作为“社会引擎”,赋予非玩家角色类人行为逻辑,迫使机器人在非结构化社交场景中学习排队、询价等决策;数据飞轮闭环通过实时采集交互数据,直接反哺机器人感知-规划-控制模型,加速从仿真到现实的迁移效率。
深挖阅读AI 解读
深度分析:具身智能小镇——从“单机智能”到“群体协同”的里程碑
核心要点提炼
上海AI Lab打造的“具身智能小镇”,本质是构建一个高密度、多模态、可交互的机器人训练与测试沙盒。其核心突破在于:
1. 场景复杂度跃升:机器人不再局限于单一任务(如抓取、导航),而是进入超市、街道等动态环境,需处理多任务并发(如避让行人、识别商品、对话交互)。
2. AI NPC系统:将大语言模型(LLM)作为“社会引擎”,赋予NPC类人行为逻辑,迫使机器人在非结构化社交场景中学习决策(如排队、询价)。
3. 数据飞轮闭环:小镇内实时采集的交互数据,可直接反哺机器人感知-规划-控制模型,加速从仿真到现实的迁移效率。
影响分析
1. 技术路径验证:该实验标志着具身智能从“实验室演示”进入“生态级测试”阶段。若成功,将解决当前机器人泛化能力不足的痛点——例如,同一台机器人能否既完成“超市取货”又执行“街道巡逻”。
2. 产业催化作用:对服务机器人(配送、零售)、家庭机器人(清洁、陪伴)及工业柔性物流场景具有直接参考价值。尤其对需要人机混场作业的仓储、餐饮行业,可能缩短商业化落地周期2-3年。
3. 风险提示:当前小镇仍属高度受控环境,真实世界的长尾问题(如极端天气、人类突发行为)尚未覆盖。此外,多机器人协同时的通信延迟与冲突解决机制,仍是工程化挑战。
机器人 发布 2026/05/29 02:15 更新 2026/05/31 02:07
千寻智能高阳团队提出Legato,入选RSS 2026|动作|推理|模态|机器人|新论文|legato|高阳(作家)_网易订阅 千寻智能高阳团队提出的“Legato”模型入选机器人领域顶会RSS 2026。该模型核心在于实现“动作-推理”模态的平滑连接,旨在解决机器人操作中常见的动作碎片化与推理断层问题。命名灵感来自音乐中的“连音”,技术路线强调将高层语义推理与低层运动控制无缝融合,显著提升机器人执行复杂长序列任务的连贯性。
技术范式上,Legato有望成为具身智能领域“系统1+系统2”协同的关键桥梁。传统机器人依赖“感知-规划-控制”串行架构,推理与动作之间存在延迟与信息损失。Legato通过端到端或紧密耦合方式,实现“边想边做”,大幅缩短任务执行周期,尤其适用于精密装配、柔性操作等需要实时调整的场景。
深挖阅读AI 解读
核心要点提炼:
千寻智能高阳团队提出的“Legato”模型,已入选机器人领域顶会RSS 2026。该模型核心在于实现“动作-推理”模态的平滑连接,旨在解决机器人操作中常见的动作碎片化与推理断层问题。其命名灵感来自音乐中的“连音”,技术路线强调将高层语义推理与低层运动控制无缝融合,显著提升机器人执行复杂长序列任务的连贯性。
影响分析:
1. 技术范式突破: Legato有望成为具身智能领域“系统1+系统2”协同的关键桥梁。传统上,机器人依赖“感知-规划-控制”的串行架构,推理与动作之间存在延迟与信息损失。Legato通过端到端或紧密耦合的方式,可能实现“边想边做”,大幅缩短任务执行周期,尤其适用于需要实时调整的精密装配、柔性操作等场景。
2. 行业竞争格局: 该成果入选RSS顶会,标志着千寻智能在“具身大模型”赛道已跻身国际第一梯队。对于机器人行业而言,这预示着技术竞争正从“单一动作精度”转向“全任务流畅度”。若Legato能够商业化落地,将推动服务机器人、工业协作机器人从“示教再现”向“自主推理执行”跃迁,加速智能体在非结构化环境中的部署。投资者应关注其与下游场景(如物流分拣、家庭服务)的适配进展。
机器人 热门 发布 2026/05/28 10:06 更新 2026/06/01 06:38
特斯拉公开灵巧手专利:技术收敛,共识已至-36氪 中美同频共振。
灵巧手终于迎来自己的「VLA」范式,走到了共识时刻。
在过去数年的具身智能产业浪潮里,灵巧手赛道堪称整个具身智能产业最热闹也最割裂的“修罗场”。无论是直驱、绳驱、气压驱动还是混合方案,全球科研机构与产业玩家们拿出了多种技术路线,在自由度、抓取精度、响应速度这些实验室参数上卷到了极致,一度形成了 “家家有绝活,户户有方案” 的百花齐放格局。
但几乎所有的技术方案,都困在了“性能、成本、可靠性、量产性” 的不可兼得里无法破局,难以找到完美的平衡点。哪怕少数方案能在实验室环境里交出完美答卷,一进入工业、家庭等真实复杂场景,就会在腱绳磨损松弛、关节传动串扰、长期使用精度漂移等问题上接连翻车。
就在整个行业在路线迷雾里反复打转之际,特斯拉在近日集中公开的5篇Optimus V3 灵巧手核心专利,直接击穿了这个困扰行业多年的核心痛点。
作为全球具身智能产业当之无愧的技术风向标与先行者,特斯拉这一次没有拿出又一个炫技式的实验室原型,而是给出了一套完整的解决方案,用高度仿生的设计从底层结构颠覆,造出一双真正平衡落地难点,实现灵巧、可靠操作双手。
这套方案的出现,标志着灵巧手终于结束了“野蛮探索期”,迎来了真正意义上的技术共识与路线收敛。就像 VLA 架构定下了具身智能基座模型的范式,特斯拉的这套方案,没有给行业再添一条新的内卷路线,而是给持续多年的路线之争画上了句号。或许,人形机器人的落地进程,将随着这双 “能真正干活的手”,正式从技术验证期,正式迈入规模化落地的全新阶段。
## 特斯拉究竟在造什么样的手?
通过拆解特斯拉这次集中公开的五项核心专利,我们能清晰看到:它没有在行业已有的技术路线里做边角料式的优化,而是从仿生的底层逻辑出发,完成了对灵巧手三大核心模块的彻底重构,绳驱架构的底层革新、臂手一体的结构突破、执行器系统的极致工程化。
腱绳驱动的技术方案从来不是行业里的新技术,恰恰相反,它是灵巧手赛道最“古老” 也最内卷的技术路线之一。
但特斯拉这次从底层重构了绳驱的传动逻辑,避免了绳驱传动“冗余张紧”的问题。其布线方式并非简单地穿过关节的中心轴,而是以特定的角度和距离绕过关节的枢轴点,以非中心的布线方式配合 “横竖双向” 的分层走线设计,让每一根腱绳的拉力传递都完全独立实现可变的力臂。 当手指开始接触物体时,力臂较短力矩较小,手指可以贴合物体且较为柔软。当抓握动作力臂变长力矩增大,手指开始收紧完成夹持。
如果说绳驱架构的革新是特斯拉解决了“怎么动” 的问题,那么臂手一体的结构突破,则是 “怎么造” 的方向。
特斯拉用“臂手一体”的方案选择向人类手臂的生物逻辑回归。它复刻了人手 “肌肉在前臂,肌腱连手掌” 的进化结果,让灵巧手以臂手一体的结构设计出现,并大幅为手部空间减重,将动力源移到前臂腔体中,通过高强度腱绳远程牵引手掌关节完成动作。
图源:特斯拉
这个看似简单的结构重构,不仅规避了灵巧手方案中固化思维定式的局限性,还同时满足了多个控制诉求。首先是极致轻量化,手掌本体不含执行器,重量得到压缩,解决了传统灵巧手“头重脚轻”、给整机带来巨大负载压力的问题;其次是腕部独立自由度的配套设计,让机器人不需要调动整条手臂,仅通过手腕微调就能锁定最优作业位姿。
有意思的是,这条的技术路线,并非特斯拉的孤本。国内的曦诺未来,早已在这条路线上完成了深度的技术验证与规模化落地,与特斯拉形成了全球范围内的技术同频共振,双双站在了灵巧手赛道的第一梯队。
作为国内少数具备电机、电控、减速器、丝杠、算法完整自研自产能力的具身智能厂商,曦诺未来从成立之初就锚定了腱绳驱动+臂手一体的仿生路线,其2025年初就推出了Xynova Flex 1 灵巧手,与特斯拉 Optimus V3 灵巧手不约而同地选择了一致的技术内核:同样采用执行器全前臂后置的臂手一体化架构,同样实现了 25 个自由度的类人动作能力;且做到了凭借微型电缸等零部件的自研创新,实现尺寸更小、重量更轻,更拟人化的突破,精准满足真实场景对灵巧操作的需求。
图源:曦诺未来
一西一东,两家全球顶尖的玩家,不约而同地放弃了行业内卷多年的“手掌集成式” 路线,共同选择了向人类手臂的生物本源回归,这本身就是对这条技术路线正确性的最强佐证。当产业的终局答案逐渐清晰,真正的先行者永远会选择同一条路。
特斯拉这次专利的第三个核心突破,就是专为臂手一体架构定制的微型执行器系统,完成了从“能用” 到 “好用” 的“最后一公里”跨越。
在这套方案里,特斯拉采用了自研的一体化执行器设计,能在前臂有限的腔体空间内,紧凑排布20 个独立驱动单元,解决了多电机密集排布带来的散热难题。同时,在手指关节处,特斯拉采用了混合传动架构,实现了真正的 “刚柔并济”。
深挖阅读AI 解读
深度分析:特斯拉灵巧手专利——技术收敛,共识已至
核心要点提炼:
特斯拉近期公开的5项Optimus V3灵巧手核心专利,标志着灵巧手技术路线从“野蛮探索”走向“共识收敛”。其核心突破在于:1)重构绳驱传动逻辑,实现可变力臂与独立拉力传递;2)采用“臂手一体”仿生架构,将执行器前移至前臂,实现轻量化与高自由度;3)自研微型执行器系统,解决散热与可靠性难题。值得注意的是,国内企业曦诺未来已在该路线上实现技术验证与规模化落地,形成中美技术同频共振。
影响分析:
1. 行业范式确立:特斯拉的专利方案终结了直驱、绳驱、气压等多路线混战,确立了“腱绳驱动+臂手一体”为灵巧手主流技术范式,类似VLA在具身智能基座模型中的角色。
2. 产业化加速:该方案平衡了性能、成本、可靠性,解决了灵巧手从实验室到真实场景的落地瓶颈。人形机器人将正式从技术验证期迈入规模化落地阶段,尤其工业与家庭场景。
3. 竞争格局重塑:特斯拉与曦诺未来形成全球双极,技术同频加速生态收敛。缺乏自主核心技术与仿生架构积累的玩家将面临淘汰,行业进入“拼量产、拼场景”的新阶段。
结论: 灵巧手技术路线已定,产业共识形成。特斯拉的专利不仅是技术突破,更是人形机器人产业从“能做手”到“能干活”的转折点。
机器人 发布 2026/05/28 08:00 更新 2026/05/30 14:47
告别概念:小鹏人形机器人,正式量产落地|机器人_新浪财经_新浪网 告别概念:小鹏人形机器人,正式量产落地
(来源:AI 前沿早知道)
博主新上线的小程序:进击的AI圈,欢迎大家一起评测
这不是PPT上的概念,不是实验室里的原型,而是明确到季度的商业化时间表。当特斯拉Optimus还在工厂里搬箱子,当其他玩家还在纠结关节成本时,小鹏直接把人形机器人的落地时间,提前到了所有人的意料之外。
01 何小鹏拍板:年底量产,明年上岗!千人大军冲刺最后6个月
这次动员大会
深挖阅读AI 解读
【核心要点提炼】
小鹏人形机器人正式告别概念阶段,明确年底量产、明年上岗的商业化时间表。这一动作将人形机器人从实验室原型直接推向产业落地,标志中国车企在具身智能赛道率先进入量产倒计时。与特斯拉Optimus仍在工厂测试、行业普遍受困于关节成本不同,小鹏以“千人大军冲刺”姿态,将量产节点提前至市场预期之外。
【影响分析】
1. 行业竞争格局重塑:小鹏量产落地将倒逼特斯拉、优必选等对手加速商业化节奏,人形机器人赛道从“技术比拼”进入“量产效率与成本控制”的硬仗阶段。率先跑通量产闭环的企业,有望在供应链、场景数据积累上形成先发优势。
2. 产业链传导效应:量产需求将直接利好上游精密减速器、伺服电机、传感器等核心零部件供应商,同时推动制造工艺向车规级标准靠拢,降低单机成本。预计2025年人形机器人核心零部件国产化率将显著提升。
3. 应用场景验证:从“搬箱子”到“上岗”,小鹏机器人重点瞄准工业制造、家庭服务等场景。一旦在真实场景中跑通ROI模型,将打开千亿级市场空间,并反向推动AI大模型在物理世界的泛化能力突破。
风险提示:量产爬坡阶段的良率控制、场景落地后的安全伦理问题,以及高投入对母公司现金流的压力,仍需持续跟踪。
机器人 热门 发布 2026/05/28 08:00 更新 2026/05/30 14:47
能训练机器人动作和想象力,上海创智学院联手智元机器人发布全新具身世界模型|机器人_新浪财经_新浪网 (来源:上观新闻)
如今的机器人的能力每天都有进展,但在复杂的真实世界,离人们期待的“全能伙伴”还很远。如何让机器人自己学会任务迁移、变得更聪明?5月28日,上海创智学院与智元机器人具身研究中心联合发布自主研发的τ‑0WM具身世界模型,有望为机器人装上既能预演未来、又能精准执行的“通用大脑”。
同时训练机器人的“身体”与“想象力”
上海创智学院全职导师、智元机器人合伙人、首席科学家罗剑岚告诉记者,τ‑0WM是一个开源的具身世界模型,借助多种渠道的数据预训练,同步提升机器人的未来推演与动作生成能力。同时,以此为核心构建了融合动作预测、未来状态模拟与部署态动作优化的完整系统,最终跨多种具身本
深挖阅读AI 解读
深度分析:τ‑0WM具身世界模型发布
核心要点提炼:
1. 上海创智学院与智元机器人联合发布开源具身世界模型τ‑0WM,旨在同步提升机器人的“未来推演”与“动作生成”能力。
2. 该模型通过多源数据预训练,构建融合动作预测、状态模拟与动作优化的完整系统,目标实现跨本体、跨场景的任务迁移。
3. 此举直击当前机器人“泛化能力弱”的痛点,为机器人从“程序执行”向“智能决策”演进提供底层技术支撑。
影响分析:
τ‑0WM的发布标志着具身智能从“感知-控制”范式向“预测-执行”范式跃迁。其核心价值在于:一是降低机器人对人工编程的依赖,通过世界模型实现“所见即所悟”的自主推理;二是开源策略将加速行业生态构建,吸引更多开发者共建数据集与算法,形成技术飞轮效应。短期看,该模型将优先赋能工业装配、家庭服务等场景的机器人自适应能力;长期看,它可能重塑机器人“学习-适应-进化”的底层逻辑,推动具身智能从实验室走向复杂真实环境。需关注的是,模型对多模态数据的融合效率与计算资源消耗,仍是规模化落地的关键瓶颈。
机器人 发布 2026/05/28 07:32 更新 2026/05/30 10:41
消费级机器人大爆发,我在今年看到的产业新变化_搜狐网 消费级机器人产业正从“概念验证”迈入“规模化落地”阶段,核心驱动力来自AI大模型带来的感知与交互能力跃升,以及关键零部件(如激光雷达、伺服电机)成本下探。产品形态从单一的家务清洁(扫地机器人)向教育陪伴、家庭安防、移动零售、轻量级物流等多元场景渗透,功能从“工具”向“伙伴”演进。初创企业与科技巨头同台竞技,供应链(核心模组、操作系统)与算法平台(多模态理解、运动控制)成为竞争壁垒,而非单纯的硬件堆叠。
短期(1-2年)内,市场将迎来“百家争鸣”的混战期,具备AI算法能力与成本控制能力的企业将率先受益,并对传统家电、玩具行业形成替代冲击,推动消费电子产业链升级。
深挖阅读AI 解读
好的,以下是对该新闻的深度分析:
核心要点提炼:
1. 爆发拐点确立:消费级机器人正从“概念验证”迈入“规模化落地”阶段,核心驱动力来自AI大模型带来的感知与交互能力跃升,以及关键零部件(如激光雷达、伺服电机)成本下探。
2. 应用场景泛化:产品形态从单一的家务清洁(扫地机器人)向教育陪伴、家庭安防、移动零售、轻量级物流等多元场景渗透,功能从“工具”向“伙伴”演进。
3. 产业生态重构:初创企业与科技巨头同台竞技,供应链(核心模组、操作系统)与算法平台(多模态理解、运动控制)成为竞争壁垒,而非单纯的硬件堆叠。
影响分析:
1. 短期(1-2年):市场将迎来“百家争鸣”的混战期。具备AI算法能力与成本控制能力的企业将率先受益。对传统家电、玩具行业形成替代冲击,推动消费电子产业链升级。
2. 中期(3-5年):行业将经历洗牌,头部效应显现。人形机器人若在成本与可靠性上取得突破,将引爆新一轮家庭服务革命,但需警惕隐私安全与伦理监管滞后带来的风险。
3. 长期:消费级机器人将成为继智能手机后的下一代个人计算与交互终端,深刻改变家庭劳务结构、教育模式及老龄化社会服务供给。
结语: 这并非简单的产品迭代,而是一次由AI驱动的产业范式转移。投资应聚焦于底层技术供应商与具备场景定义能力的平台型企业。
机器人 发布 2026/05/28 07:32 更新 2026/05/30 09:31
消费级机器人大爆发,我在今年看到的产业新变化_搜狐网 2025年3月14日,国家统计局发布数据显示,1-2月份全国规模以上工业增加值同比增长5.9%,增速较2024年全年加快0.1个百分点。社会消费品零售总额同比增长5.5%,增速较上年12月加快1.9个百分点。固定资产投资同比增长4.2%,增速较上年全年加快1.2个百分点。其中,基础设施投资增长8.1%,制造业投资增长9.4%,房地产开发投资下降5.7%。国家统计局新闻发言人刘爱华表示,经济运行呈现企稳回升态势,工业生产、消费、投资三大领域均出现积极变化。就业方面,1-2月全国城镇调查失业率平均值为5.3%,其中2月份为5.2%,较上年12月下降0.1个百分点。外贸数据方面,货物进出口总额同比增长8.7%,出口增长10.3%,进口增长6.7%。消费领域,升级类商品销售增长较快,限额以上单位通讯器材类、体育娱乐用品类商品零售额分别增长16.2%和11.3%。新能源汽车产量增长25.9%,零售额增长14.4%。刘爱华指出,当前经济恢复基础仍需巩固,下阶段要着力扩大内需、优化供给,推动经济持续回升向好。
深挖阅读AI 解读
好的,以下是木子新闻AI分析师的专业解读:
【核心要点提炼】
1. 宏观企稳,结构分化:1-2月工业、消费、投资增速全面回升,显示经济企稳态势。但核心驱动力在于制造业(+9.4%)和基建(+8.1%)投资,房地产投资仍处深度收缩(-5.7%),呈现“制造强、地产弱”的结构性特征。
2. 消费升级与“机器替人”并行:升级类消费品(通讯器材+16.2%)和新能源汽车(产量+25.9%)增长强劲,映射出消费端对智能化、绿色化产品的偏好。这与工业端机器人产业爆发形成需求侧与供给侧的双向联动。
3. 就业压力犹存:失业率5.3%虽较前期微降,但考虑到服务业复苏与制造业智能化改造并行,就业结构性问题(如低技能岗位被替代)值得警惕,这恰是消费级机器人普及的社会成本。
【影响分析】
1. 对机器人产业:宏观数据确认了产业爆发的基础——制造业投资高增长为自动化产线提供资本支撑,消费升级为服务/家用机器人创造市场。但需注意,若房地产下行拖累整体内需,机器人企业应聚焦B端制造业降本与C端“新刚需”(如养老、教育、清洁)的精准场景落地。
2. 对投资与政策:经济“稳中提质”基调下,预计政策将继续加码“新质生产力”相关领域(如人形机器人、AI芯片)。机器人板块投资逻辑应从“概念炒作”转向“业绩兑现”,重点关注具备核心零部件自研能力及垂直行业解决方案的厂商。同时,需警惕出口高增速(+10.3%)背后的海外贸易摩擦风险对供应链的扰动。
机器人 发布 2026/05/28 07:06 更新 2026/05/30 10:41
高盛重磅预测:AI下半场将从芯片转向人形机器人 - 网易 高盛最新研报指出,AI产业正从“算力基建”阶段转向“应用落地”阶段,核心载体将从GPU芯片转向人形机器人。市场焦点将从英伟达等硬件供应商,转移至特斯拉、优必选等具备整机集成与场景化能力的公司。高盛预计,人形机器人将在未来5-10年内成为AI商业化最大增量市场,2035年全球市场规模将达1540亿美元。
产业链面临重构:芯片算力仍是基础,但投资逻辑从“卖铲子”转向“挖金子”。机器人关节、传感器、运动控制等细分领域将迎来爆发,谐波减速器、力矩电机等零部件供应商估值有望重塑。
深挖阅读AI 解读
核心要点提炼:
高盛最新研报指出,AI产业正从“算力基建”阶段转向“应用落地”阶段,核心载体将从GPU芯片转向人形机器人。这意味着,市场焦点将从英伟达等硬件供应商,转移至特斯拉、优必选等具备整机集成与场景化能力的公司。高盛认为,人形机器人将在未来5-10年内成为AI商业化最大增量市场,预计2035年全球市场规模达1540亿美元。
影响分析:
1. 产业链重构:芯片算力仍是基础,但投资逻辑从“卖铲子”转向“挖金子”。机器人关节、传感器、运动控制等细分领域将迎来爆发,相关零部件供应商(如谐波减速器、力矩电机)估值有望重塑。
2. 竞争格局洗牌:传统机器人厂商(如发那科)面临AI原生企业的降维打击;而科技巨头凭借大模型+硬件整合能力,可能形成“机器人即服务”的新商业模式,挤压中小厂商生存空间。
3. 政策与伦理挑战:人形机器人商业化加速将倒逼各国出台更具体的伦理规范与安全标准,尤其是在工业、医疗等高风险场景。同时,劳动力替代焦虑可能引发社会争议,需关注政策干预对行业节奏的影响。
总结:AI下半场是“具身智能”的战争,人形机器人是终极战场。投资者应优先关注具备硬件规模化能力与场景数据闭环的企业,警惕纯概念炒作。
机器人 发布 2026/05/28 07:06 更新 2026/05/30 09:31
高盛重磅预测:AI下半场将从芯片转向人形机器人 - 网易 高盛发布重磅预测,认为人工智能发展的下半场将从芯片领域转向人形机器人。报告指出,随着AI大模型技术的成熟,人形机器人将成为下一个关键应用场景,预计到2030年全球人形机器人市场规模将达到380亿美元,2035年进一步增长至1540亿美元。高盛分析师强调,芯片领域的投资热潮正在降温,而人形机器人产业链将迎来爆发式增长,涵盖传感器、执行器、电池、结构件等多个细分领域。
报告详细列举了人形机器人的核心零部件成本构成,其中执行器占比最高达40%,传感器和电池各占15%,结构件和控制系统分别占10%和8%。
深挖阅读AI 解读
核心要点提炼:
高盛最新研判明确指示AI产业重心迁移:芯片投资热潮降温,人形机器人成为“AI下半场”核心载体。预计2030年全球市场规模达380亿美元,2035年飙升至1540亿美元,年复合增长率超30%。产业链核心环节成本结构清晰——执行器(40%)为价值量最大环节,传感器与电池(各15%)紧随其后,结构件与控制系统合计占18%。
影响分析:
1. 投资逻辑重塑:市场焦点将从算力芯片转向硬件集成与精密制造。执行器、传感器、电池等细分领域龙头将享受估值溢价,而纯芯片公司需证明在机器人场景的落地能力。
2. 供应链格局变化:中国具备电机、电池、结构件等完整制造优势,有望在规模化降本中占据主导地位,但高端执行器与传感器仍存技术卡点。
3. 风险提示:技术成熟度、成本下降速度及商业化场景(如工厂、养老)能否如期打开,将决定预测是否兑现。短期需警惕概念炒作与业绩兑现脱节。
机器人 热门 发布 2026/05/28 06:06 更新 2026/06/01 06:38
重磅开源|Wall-OSS-0.5:国产具身大模型破解零样本部署难题,无需微调直驱真实机器人 – Prompt 语宙 重磅开源|Wall-OSS-0.5:国产具身大模型破解零样本部署难题,无需微调直驱真实机器人 – Prompt 语宙
SHARE
💡 站外导读:具身智能领域长期面临一个核心困境:模型的真实泛化能力难以验证,大多数成果依赖针对特定任务的“考前微调”,导致难以区分“通用大脑”与“专用脚本”。这限制了通用机器人走向复杂真实环境的步伐。2026年5月,自变量机器人公司开源的Wall-OSS-0.5模型,正是为了打破这一范式而生。它旨在通过大规模预训练,在未经微调的“零样本”条件下,直接驱动真实机器人完成多样化任务,为行业提供一个可复现、可验证的全新基座。
2026年5月,国内具身智能领域迎来重要技术突破。自变量机器人(X Square Robot)正式宣布开源其最新研发的 VLA(视觉-语言-动作)模型 Wall-OSS-0.5,该模型打破了行业长期以来依赖“考前微调”的传统范式,实现了未经任务特定微调即可在真实机器人上进行“零样本”部署的突破。
### 行业破局:从“定制脚本”到“通用大脑”
在具身智能领域,一直存在一个不言而喻的难题:绝大多数模型在公开其测试表现前,都离不开针对特定任务的大规模微调。这使得人们很难判断,一个模型究竟是拥有了类似“通用大脑”的广泛适应能力,还是仅仅学会了一套针对特定工作的“操作流程”。
自变量机器人通过 Wall-OSS-0.5给出了全新的回答。该模型在超过20种机器人形态、百万条轨迹数据以及9000万条多模态语料库上完成预训练。在不对其进行任何针对性任务微调的情况下,团队直接将其部署在真实机器人上,测试涵盖了语义理解、刚性/柔性物体操作及精细化操作等17个挑战性任务。
### 核心亮点:预训练模型的性能飞跃
测试数据显示,Wall-OSS-0.5的表现远超预期:
零样本部署的显著能力:一个经过40万步预训练的模型版本,在未经任何微调的情况下,于17个零样本任务中,有4项得分突破了80分(满分100)。尤其值得关注的是,在预训练数据中从未出现过的“绳子收紧”这类柔性物体操作任务上,该模型也拿到了82分的高分。
微调上限显著提升: 在需要针对性微调的场景中,Wall-OSS-0.5展现了极高的学习效率。对比行业标杆 π0.5,在同等数据预算下,Wall-OSS-0.5的平均任务进度领先17.5分,并在精细化操作任务(如精密插入)中表现出近乎一个数量级的成功率提升。
“能力增强”而非衰退:实验结果表明,即使经过高强度的动作任务训练,该模型的多模态感知能力并未下降,相反,其视觉定位与逻辑推理能力得到了“重塑性”的提升。
### 四项关键技术构建护城河
Wall-OSS-0.5的出色表现得益于团队的四项底层技术创新:
梯度桥接技术:该技术通过将动作监督信号直接强制注入预训练模型的骨干网络,成功在底层特征表示层面,将“看”、“说”和“动”三种能力统一起来。
视觉对齐 Tokenizer: 确保每一个动作 Token 都承载了明确的视觉语义,赋予了模型真正的“物理含义”推演能力。
动作空间监督:训练策略专注于轨迹的整体结构,而非纠缠于琐碎的高频动作细节,这极大地提高了模型的收敛速度与效率。
DMuon 分布式优化: 研发团队通过底层系统优化,将异构计算开销降低了100倍,使得这种复杂的训练配方在大规模集群上具备了实际落地可能。
### 具身智能的里程碑
目前,自变量机器人已将其Wall-OSS-0.5模型的相关权重、训练代码以及数据集接口进行了全栈开源。
行业分析人士指出,Wall-OSS-0.5的出现不仅是单纯的模型更新,它重新定义了具身智能的开发范式,即从单纯追求“单项任务的成功率”转向“通用物理直觉的迁移”。对于广大研究者和开发者而言,这标志着具身智能基座模型正式进入“可复现、可验证、可挑战”的新阶段,将极大地加速通用机器人在复杂真实环境中的落地步伐。
#### 📝 站长洞察 (Editor’s Insight)
Wall-OSS-0.5的开源,远不止于发布一个新模型。它直击了具身智能产业化的“阿喀琉斯之踵”——评估的可靠性与泛化的本质。当行业从“Demo驱动”转向“落地驱动”,一个关键问题浮现:模型的性能提升究竟源于场景适配,还是底层认知的涌现?该模型通过在预训练阶段即统一看、说、动(VLA)的表征,并证明其在零样本下的初步物理直觉,为我们提供了一个观测通用智能的早期窗口。其四大技术,尤其是“梯度桥接”和“视觉对齐Tokenizer”,代表了将语言大模型的成功范式深度迁移至物理世界的关键探索。这标志着具身智能正从“任务特化”迈入“能力基座”时代,研发竞争将从单一任务成功率,升级为对“通用物理直觉”的构建与评测。
深挖阅读AI 解读
深度分析:Wall-OSS-0.5——具身智能“零样本”范式的破局者
1. 核心要点提炼
本次开源的Wall-OSS-0.5模型,核心突破在于破解了具身智能领域的“泛化性骗局”。它通过大规模跨形态、跨任务预训练,首次在未经微调的情况下,实现了对真实机器人的“零样本”直驱。其技术护城河在于“梯度桥接”与“视觉对齐Tokenizer”,从底层统一了视觉、语言与动作的表征,使模型具备物理意义上的“通用直觉”,而非针对特定任务的“脚本记忆”。
2. 影响分析
对行业标准: 该模型重新定义了具身智能的评估基准。以往依赖“考前微调”的“Demo式”成果将失去说服力,行业竞争将从“单项任务成功率”转向“零样本泛化能力”与“物理直觉构建”的硬核比拼。 对研发范式: “全栈开源”极大地降低了研究门槛。开发者无需从零构建数据与训练体系,可直接基于此基座进行二次开发,加速了从实验室Demo到真实场景应用的转化周期。 对产业落地: 解决了“通用大脑”在复杂环境中的适应性难题。在柔性物体操作、精细插入等非结构化任务中的优异表现,预示着家政、物流、精密装配等场景的机器人应用将迎来实质性提速。 机器人 热门 发布 2026/05/28 00:25 更新 2026/06/01 06:38
生成即可仿真!大晓机器人与南洋理工大学发布全球首个统一物理3D生成框架|运动学_网易订阅 0
分享至好友和朋友圈
通用机器人的终极目标是在开放世界中自主完成复杂任务,这要求机器人不仅能“看见”世界,更能“理解”并与世界“交互”。
大晓机器人与南洋理工大学刚刚联合发布全球首个统一物理3D生成框架PhysX-Omni,其作为ACE研发范式下的最新成果,为机器人构建物理世界的全局认知与交互能力提供了重要潜力。
研究团队从机器人的长期发展需求出发,确立了“从物体级生成到场景级世界建模”的递进式研究路线,在实现高质量物理3D资产批量生成的基础上,进一步探索了完整仿真场景的自动生成技术。
这一能力让机器人能够在虚拟世界中预演各种真实场景的交互任务,不断积累物理经验,逐步形成类人的物理直觉。
未来,PhysX-Omni有望成为机器人最强大脑的“世界模拟器”重要一环,助力具身智能向通用人工智能迈出关键一步。
构筑全球首个统一物理3D生成框架
PhysX-Omni的发布,首次实现刚体、可形变物体与关节物体的一体化建模,能同时生成绝对尺度、材料属性、运动学参数、交互能力等核心物理信息,让AI生成的3D模型真正做到 “生成即可仿真”。
该框架的核心突破在于首创面向视觉语言模型的模板化RLE几何表征.受经典二维游程编码启发,先将3D资产体素化并按部件层级拆分,再沿Z 轴切分为二维二值掩码进行紧凑编码;同时引入模板层概念,让结构相似的切片共享基础模板、仅记录残差变化,既保留了精细几何信息,又大幅压缩了token数量,从而避免了引入分割步骤带来的误差。
PhysX-Omni彻底打破了传统3D AIGC“重外观、轻物理” 的行业瓶颈。此前绝大多数 3D 生成方法仅能输出静态几何与视觉效果,无法还原真实世界的物理属性与运动规律,生成的模型一进入仿真场景就会出现穿模、尺寸错乱、关节失效等问题,完全无法支撑物理交互与机器人训练需求。
构建首个通用仿真就绪物理3D数据集 PhysXVerse
PhysXVerse 是全球首个通用仿真就绪物理3D数据集,解决了物理 AI 与具身智能领域长期面临的高质量物理3D数据稀缺难题。此前行业内的 3D数据集大多仅包含几何结构与外观信息,缺乏真实物理属性标注,导致训练出的模型生成的资产无法直接用于物理仿真,严重制约了机器人交互与策略学习的发展。
该数据集基于PartVerse经过人类验证的部件分割结果,通过人在环的精细化物理标注流程构建而成,最终包含8.7K+高质量仿真就绪 3D 资产,覆盖2.9K+类别,全面涵盖室内家具、无人机、机器人、车辆以及大型场景组件等多种复杂对象。
与现有数据集相比,PhysXVerse 不仅保留了精细的几何与视觉信息,更完整标注了绝对尺度、材料参数、运动学结构与交互可供性等核心物理属性,为物理 3D 生成模型的训练提供了标准化的高质量数据基础,加速了3D生成从“视觉可用”向“物理可用”的跨越。
打造首个物理 3D 生成基准评测集 PhysX-Bench
PhysX-Bench 是全球首个物理3D生成统一基准评测集,终结了物理3D 生成领域长期缺乏标准化、可量化评测体系的行业困境。
该评测集基于开源视觉语言模型 Qwen3.5 与物理仿真引擎构建,创新性地采用无真值评测模式,通过渲染图像与仿真视频完成评估,更贴近人类感知与机器人应用需求。它从几何结构、绝对尺度、材料属性、交互可供性、运动学一致性、语义描述六大核心维度建立全面评价体系,通过自由落体、水中下落等物理实验间接验证材料参数,通过运动视频分析关节运动合理性。
PhysX-Bench 为不同物理 3D 生成方法提供了公平的横向对比平台,能够精准量化生成资产的物理真实性与仿真可用性,为物理 AI 与具身智能技术的迭代升级提供了统一的评判标尺。
在PhysX-Bench 真实场景评测中,其在复杂类别与野外挑战案例中表现出更强鲁棒性。落地验证表明,PhysX-Omni 生成的 3D 资产可直接部署至物理模拟器,支撑机器人开关柜门、操作咖啡机等交互任务与策略学习,同时具备场景级仿真生成能力,为具身智能规模化训练奠定了基础。
创造具身智能的世界基建,为通用物理世界建模铺平道路
PhysX-Omni通过统一物理3D生成技术,实现了从文本描述到可直接仿真的物理资产的端到端生成,为具身智能提供了规模化、低成本的训练数据解决方案。
PhysX-Omni 可批量生成具备真实物理属性的各类物体与机器人模型,无需人工标注与二次调试,大幅降低训练数据的获取成本。其生成的资产物理参数与真实世界高度一致,有效提升了机器人策略在真实场景中的泛化能力。
深挖阅读AI 解读
深度分析:大晓机器人与南洋理工大学发布PhysX-Omni
核心要点提炼:
1. 技术突破:发布全球首个统一物理3D生成框架PhysX-Omni,首次实现刚体、可形变与关节物体的一体化建模,输出绝对尺度、材料属性等关键物理信息,实现“生成即可仿真”。
2. 数据与评测:同步推出物理3D数据集PhysXVerse(8.7K+资产,2.9K+类别)和基准评测集PhysX-Bench,终结行业缺乏标准化物理数据与评测体系的困境。
3. 应用价值:生成的资产可直接部署至物理模拟器,支撑机器人完成开关柜门、操作咖啡机等交互任务,为具身智能规模化训练提供低成本、高泛化能力的解决方案。
影响分析:
行业瓶颈突破:传统3D AIGC重外观轻物理,导致仿真穿模、关节失效。PhysX-Omni通过模板化RLE几何表征,大幅压缩token并保留精细几何信息,直接打通“生成-仿真”链路,加速机器人从视觉感知到物理交互的进化。 具身智能基建:统一物理生成框架与标准化数据集,降低了机器人训练数据获取成本,推动“世界模拟器”构建。这有望成为通用人工智能的关键基础设施,使机器人在虚拟环境中积累物理经验,形成类人直觉。 竞争格局重塑:作为ACE研发范式的最新成果,PhysX-Omni确立了从物体级到场景级建模的递进路线,将倒逼行业从静态外观生成转向物理真实生成,引领具身智能进入规模化训练新阶段。 机器人 发布 2026/05/27 22:13 更新 2026/05/30 10:41
[PDF] 全力培育具身智能产业生态 近日,产业政策与资本正推动具身智能(Embodied AI)从单一技术研发转向“技术-场景-供应链”三位一体的生态构建。具身智能不再局限于实验室的机器人算法迭代,而是强调与物理世界实时交互的智能体,其产业化进程已进入“基础设施+应用场景”双轮驱动阶段。
从产业链看,上游的传感器、执行器、专用芯片将迎来爆发式需求;中游的机器人本体与AI模型集成商将加速洗牌,具备“大脑+小脑”完整技术栈的企业将获得资本溢价。在应用场景方面,制造业柔性产线、家庭服务、特种作业(如医疗、救灾)将成为首批落地领域,但需警惕“场景碎片化”导致的成本高企问题。
深挖阅读AI 解读
核心要点提炼:该新闻聚焦于具身智能(Embodied AI)产业生态的系统性培育。核心信号在于政策或产业资本正从单一技术研发转向“技术-场景-供应链”三位一体的生态构建。具身智能不再仅是实验室的机器人算法迭代,而是强调与物理世界实时交互的智能体,其产业化进程已进入“基础设施+应用场景”双轮驱动阶段。
影响分析:第一,从产业链看,上游的传感器、执行器、专用芯片将迎来爆发式需求,中游的机器人本体与AI模型集成商将加速洗牌,具备“大脑+小脑”完整技术栈的企业将获得资本溢价。第二,从应用场景看,制造业柔性产线、家庭服务、特种作业(如医疗、救灾)将成为首批落地领域,但需警惕“场景碎片化”导致的成本高企问题。第三,从竞争格局看,该信号意味着中国正试图在“硬件成本优势”基础上,补齐“软件生态与实时交互算法”短板,与海外在通用机器人基座模型领域展开错位竞争。短期关注产业链核心零部件国产替代率,中期关注能否出现类似“安卓”的开源具身智能操作系统。
机器人 发布 2026/05/27 08:00 更新 2026/05/30 10:41
人形机器人“狂奔”,快递无人化时代还有多远? - 新浪财经 人形机器人正加速渗透物流领域,其仿人形态与自主导航能力突破传统AGV局限。快递行业面临人力成本攀升与效率瓶颈,人形机器人可承担分拣、搬运、末端配送等重复性劳动,目标将单件物流成本压缩至人工的30%以下。当前“狂奔”更多体现在资本与研发端,距离大规模商业化仍需解决续航、环境适应性及成本问题。
对行业而言,快递无人化将从“点状试点”转向“链式渗透”。短期(1-2年)内,仓储分拣环节率先实现人机协作;中期(3-5年)末端配送机器人可能替代30%以上的快递员岗位。就业方面,结构性冲击不可避免,低技能重复劳动岗位面临淘汰,但会催生机器人运维、调度系统开发等新岗位。
深挖阅读AI 解读
好的,以下是基于该新闻标题的专业分析:
【核心要点提炼】
1. 技术突破加速:人形机器人从实验室走向应用场景的速度超出预期,尤其在物流领域,其仿人形态与自主导航能力正在突破传统AGV(自动导引车)的局限。
2. 降本增效驱动:快递行业面临人力成本攀升与效率瓶颈,人形机器人可承担分拣、搬运、末端配送等重复性劳动,目标是将单件物流成本压缩至人工的30%以下。
3. 场景验证阶段:当前“狂奔”更多体现在资本与研发端,距离大规模商业化仍需解决续航、环境适应性及成本问题。
【影响分析】
对行业:快递无人化将从“点状试点”转向“链式渗透”。短期(1-2年)内,仓储分拣环节将率先实现人机协作;中期(3-5年)末端配送机器人可能替代30%以上的快递员岗位。 对就业:结构性冲击不可避免,低技能重复劳动岗位面临淘汰,但会催生机器人运维、调度系统开发等新岗位。 对竞争格局:掌握核心运动控制与AI算法的企业(如特斯拉、宇树科技)将占据价值链顶端,传统物流巨头需通过合作或自研加速转型,否则面临被边缘化风险。
结论:人形机器人正以“技术超预期、应用有温差”的方式重塑物流业。未来3年将是关键窗口期,率先实现成本与可靠性平衡的企业将定义行业标准。
机器人 发布 2026/05/27 00:41 更新 2026/05/30 09:31
小小关节撑起未来科技,外媒读懂藏在机器人背后的中国智造 中国机器人产业正以精密关节技术为核心突破点,展现“中国智造”的全球竞争力。据国际机器人联合会(IFR)2023年报告,中国连续十年成为全球最大工业机器人市场,2022年安装量达29万台,占全球总量的52%。其中,谐波减速器、RV减速器等关键关节部件国产化率从2015年的不足20%提升至2023年的45%以上,绿的谐波、双环传动等企业已进入国际供应链。2023年,中国工业机器人产量达42.9万套,同比增长21.2%,服务机器人产量783.3万套,同比增长23.3%。
深挖阅读AI 解读
核心要点提炼
中国机器人产业正从“规模扩张”转向“技术攻坚”,精密关节(谐波/RV减速器)国产化率从2015年不足20%跃升至2023年超45%,直接驱动工业机器人产量同比增长21.2%。绿的谐波等企业跻身全球供应链,标志着中国在机器人“核心零部件”环节实现关键突破,打破了日本哈默纳科、纳博特斯克等企业的长期垄断。
影响分析
1. 产业链自主可控:关节技术是机器人“运动神经”,国产化率提升将降低对外依赖,保障供应链安全,尤其在人形机器人、医疗手术等高端场景中,技术自主权决定产业话语权。
2. 成本与规模双赢:国产替代使关节成本下降30%-50%,加速中小制造企业“机器换人”,同时支撑中国机器人安装量占全球52%的规模优势,形成“技术-成本-市场”正循环。
3. 全球竞争格局重塑:中国从“组装基地”向“技术输出者”转型,外媒关注点从“量”转向“质”,预示未来3-5年,中国可能从核心部件到整机系统全面挑战日本、欧洲的领先地位。
机器人 发布 2026/05/27 00:00 更新 2026/05/30 14:47
人形机器人搭载智能体 解锁主动服务新技能_新闻频道_央视网(cctv.com) 人形机器人正经历从被动指令执行向主动服务的关键演进,核心突破在于“智能体”的集成。通过搭载具备感知、决策与交互能力的智能体,机器人能够理解环境与用户意图,自主规划动作序列,实现从“你说我做”到“我预判你需求”的质变。这标志着人形机器人从单一工具向协作伙伴的角色跃迁。
在行业层面,主动服务能力将大幅拓宽人形机器人的应用场景,尤其在家庭养老、医疗陪护、商业导览等需复杂交互的领域。技术壁垒从硬件转移到算法与数据闭环,具备多模态大模型与实时决策能力的厂商将占据优势。产业链方面,传感器、边缘计算芯片、灵巧手等核心零部件需求激增,同时云端与端侧协同的“大脑”架构成为新竞争焦点。
深挖阅读AI 解读
核心要点提炼:
人形机器人正从被动指令执行向主动服务演进,核心突破在于“智能体”的集成。通过搭载具备感知、决策与交互能力的智能体,机器人能理解环境与用户意图,自主规划动作序列,实现从“你说我做”到“我预判你需求”的质变。这标志着人形机器人从单一工具向协作伙伴的角色跃迁。
影响分析:
1. 行业层面:主动服务能力将大幅拓宽人形机器人的应用场景,尤其在家庭养老、医疗陪护、商业导览等需复杂交互的领域。技术壁垒从硬件转移到算法与数据闭环,具备多模态大模型与实时决策能力的厂商将占据优势。
2. 产业链:传感器、边缘计算芯片、灵巧手等核心零部件需求激增;同时,云端与端侧协同的“大脑”架构成为新竞争焦点。
3. 社会层面:若成本可控,人形机器人有望缓解老龄化社会的劳动力缺口,但需警惕隐私安全与伦理监管滞后带来的风险。短期看,主动服务能力仍限于特定场景;中长期看,其渗透速度取决于技术成熟度与政策开放度。
机器人 热门 发布 2026/05/26 21:06 更新 2026/06/01 06:38
从“蹒跚学步”到“超越人类”,这届半马看点何在?-36氪 从“蹒跚学步”到“超越人类”,这届半马看点何在?
时隔一年,人形机器人半程马拉松再次在北京亦庄鸣枪开跑。
去年首届赛事,20支参赛队伍仅有6台机器人成功完赛,冠军天工Ultra以2小时40分42秒的成绩冲线。那个时候,看着机器人在赛道上东倒西歪、频繁摔倒的画面,不少网友调侃:“这哪里是跑马拉松,分明是学步车大赛。”
一年之后,4月19日清晨7点30分,2026北京亦庄半程马拉松暨人形机器人半程马拉松如期举行。26个品牌、超百支队伍、300余台人形机器人,外加1.2万名人类跑者,共同涌上21.0975公里的赛道。赛事规模相比去年扩容近5倍,高校赛队超过20支,还首次迎来了来自法国、德国、巴西等国的5支国际队伍。
去年还在“蹒跚学步”的机器人选手们,今年交出了一份令人瞠目结舌的答卷:冠军成绩不仅大幅刷新了赛事纪录,更是一举超越了人类男子半程马拉松的世界纪录。
如果说去年的比赛是一次“技术摸底”,那今年的比赛,就是一场彻头彻尾的“技术爆发”。
## 从2小时40分到50分26秒,这一年发生了什么?
去年,天工Ultra夺冠的成绩是2小时40分42秒,6支完赛队伍中最后一名耗时接近5个小时。而今年,来自荣耀的齐天大圣 战队自主导航机器人“闪电”夺得冠军,直接将成绩压缩到了50分26秒(净用时)。
自主导航机器人“闪电”
对比一下人类世界纪录:2026年3月,乌干达名将基普利莫在里斯本半程马拉松赛中以57分20秒的成绩创造了新的男子半马世界纪录。也就是说,今年夺冠的机器人“闪电”,比人类世界纪录快了将近7分钟。
不过,这里的“超越”有一个细节需要注意。
今年的比赛设置了自主导航与遥控两类模式,两组别成绩分别按1.0与1.2的加权系数核算。自主导航模式的净时成绩直接计入,遥控模式则乘以1.2的加权系数。这种规则设计的初衷,是为了鼓励更难的自主导航技术研发。
因此,实际赛场上出现了一个有趣的画面:来自荣耀的遥控机器人“闪电”虽然以48分19秒第一个冲过终点线,但在加权之后,最终成绩落后于自主导航的“闪电”机器人。
而在短跑维度,宇树科技发布消息,其H1机器人(2023年改版)自主跑完1.9公里多弯道赛程,用时4分13秒,按比例计算打破了人类1500米世界纪录。这意味着宇树H1已能实现10米/秒的巅峰速度,接近博尔特创下的10.44米/秒人类极限。
北京人形创新中心负责人在赛后表示:“冠军成绩被荣耀和宇树刷新,这恰恰是中国具身智能行业‘团体金牌’的体现,百花齐放,比一家独大更有意义。”
## 26个品牌、300余台机器人同台竞技
相比去年的“少数派报告”,今年的参赛阵容堪称“群星闪耀”。
从品牌数量看,26个主流机器人品牌参与了本次赛事,覆盖了北京人形机器人创新中心、荣耀、宇树、松延动力、加速进化等头部企业,以及清华大学、北京大学、中国科学技术大学等高校科研院所。这些队伍带来的机型各具特色,从主打速度的竞速型到强调拟人步态的交互型,品类相当丰富。
接下来,我们按品牌逐一盘点这些在现场的“选手”。
### 01.荣耀:包揽前六,首次参赛就赢麻了
作为本届赛事最大的黑马,首次参赛的荣耀派出了10支队伍,涵盖两款自研人形机器人——“闪电”和“元气仔”。其中6支“闪电”机器人包揽了赛事前六名。
“闪电”身高169cm,主打速度与爆发力,搭载自研高动态运动系统,有效腿长达0.95米,单关节峰值扭矩高达400牛·米。为了应对长时间奔跑的散热问题,它背部搭载了高功率液泵,实现每分钟超4升的换热流量。
荣耀“闪电”
另一款“元气仔”身高136.9cm,则更侧重交互陪伴,其跑步姿态的摆臂与步幅完全复刻人类运动姿态,冲击赛事“最佳拟人步态”奖项。
荣耀“元气仔”
### 02.宇树科技:首次参赛,速度惊人但赛场波折
今年首次派出官方队伍参赛的宇树科技,带来了其H1人形机器人的微调版。宇树共派出了北京、上海、杭州三支官方队伍。
在赛前测试中,宇树H1展现出了惊人的速度潜力。4月16日的排位赛上,它自主跑完1.9公里多弯道赛程,用时4分13秒,按比例计算已打破人类1500米世界纪录。宇树方面还表示,H1近期已跑出10m/s的成绩,接近博尔特10.44米/秒的人类极限速度。
不过在实际正赛中,宇树H1的表现略显波折。网络流传的视频显示,它在换电起跑后几秒内摔倒,头部磕地导致碎片散落。据央视新闻报道,其补能环节需要三人同时操作,一人换电、一人装填冰块给芯片降温、一人在关节处喷射散热剂,整个流程约30-40秒。
宇树H1
### 03.天工系列:卫冕失利,但自主化程度高
去年夺冠的北京人形机器人创新中心(北创)今年派出了3台天工Ultra以全自主方式参赛。
深挖阅读AI 解读
核心要点提炼
本届人形机器人半马呈现技术跨越式突破:冠军机器人“闪电”以50分26秒完赛,较去年冠军成绩(2小时40分)提升超3倍,且首次超越人类男子半马世界纪录(57分20秒)。赛事规模扩容5倍至300余台机器人参赛,26个品牌同台竞技,首次引入国际队伍。技术分化显著——自主导航与遥控模式并轨,宇树H1短程速度达10m/s,逼近博尔特极限。
影响分析
1. 技术拐点确认:从“蹒跚学步”到“超越人类”,标志具身智能在运动控制、能量管理、自主决策等核心领域取得系统性突破。遥操作与自主导航的加权规则,倒逼企业从“跑得快”转向“跑得聪明”,加速技术商业化落地。
2. 产业生态爆发:26个品牌、高校及国际队伍参与,反映中国机器人产业链从单点突破转向集群创新。荣耀首次参赛即包揽前六,证明跨界玩家(消费电子)入局正重塑竞争格局。
3. 应用前景拓宽:马拉松作为极端工况测试场,验证了机器人在长续航、高动态、复杂环境下的可靠性。未来可迁移至物流配送、应急救灾、军事侦察等高强度场景,同时推动运动控制算法、高扭矩关节、热管理等上游技术迭代。
4. 社会认知重塑:从“学步车”调侃到“超越人类”惊叹,公众对机器人能力的预期被重新定义,或加速政策扶持与资本涌入,但需警惕技术伦理与就业替代的潜在争议。
机器人 发布 2026/05/26 08:00 更新 2026/05/30 09:31
具身智能迎来量产和应用双爆发我国人工智能发展进入快速增长阶段 国际货币基金组织(IMF)在2026年5月26日发布的最新《世界经济展望》报告中,将2026年全球经济增长预期下调0.3个百分点至3.1%,主要原因是美国贸易政策不确定性加剧以及全球供应链持续紧张。报告指出,美国2026年经济增长预期被大幅下调0.8个百分点至1.9%,欧元区增长预期下调0.2个百分点至1.4%,新兴市场和发展中经济体整体增长预期下调0.1个百分点至4.2%。IMF首席经济学家皮埃尔-奥利维耶·古兰沙表示,保护主义政策升级和地缘经济分裂正在拖累全球产出,并警告通胀压力可能重新抬头。报告特别强调,若美国对进口商品加征的关税进一步扩大,全球GDP增速可能在2027年再损失0.5个百分点。此外,IMF将中国2026年经济增长预期上调0.1个百分点至5.0%,认为国内政策刺激措施部分抵消了外部需求放缓的影响。日本2026年增长预期被下调0.3个百分点至0.8%,英国下调0.2个百分点至1.2%。报告还预测,全球贸易量增速将从2025年的3.4%放缓至2026年的2.8%,为2020年以来最低水平。
深挖阅读AI 解读
好的,以下是对该新闻的专业分析:
核心要点提炼:
1. 宏观与微观错位: 标题指向“具身智能”爆发,但新闻正文核心是IMF下调2026年全球经济增长预期。这构成一个关键信号:在宏观承压背景下,人工智能(尤其是具身智能)正被市场视为穿越周期的结构性增长点。
2. 分化加剧: 全球增长预期普遍下调(美国-0.8%,欧元区-0.2%),但中国逆势上调0.1%至5.0%,显示其政策刺激与产业升级(如AI)正在对冲外部需求疲软。
3. 风险前置: IMF明确警告贸易保护主义和供应链紧张是核心拖累,并预测贸易量增速将创2020年来新低(2.8%)。
影响分析:
1. 对具身智能行业: 宏观逆风将加速“机器替代人”的逻辑。企业为降本增效,对智能制造、仓储物流等场景的具身机器人需求将提前释放。中国因政策支持和相对稳定的增长环境,有望成为全球具身智能量产与落地的核心试验场。
2. 对投资逻辑: 市场将更关注能够直接提升生产效率、降低对全球供应链依赖的AI应用。具备量产能力和明确商业闭环的具身智能企业,将获得更高的估值溢价。
3. 对产业链: 全球贸易萎缩将倒逼区域化供应链重构,利好中国在核心零部件(如传感器、执行器)和整机组装领域的本土化替代进程。
结论: 宏观的“寒气”正加速微观的“进化”。具身智能的爆发不仅是技术驱动,更是全球经济结构性调整下的必然产物。中国在这一赛道中兼具市场、政策和产业链韧性优势。
机器人 发布 2026/05/26 00:00 更新 2026/05/30 10:41
前瞻全球产业早报:我国人形机器人全球市场占比超八成 我国人形机器人产业在全球市场占据绝对主导地位,市场份额超过80%。这一数据反映出中国在核心零部件、整机集成及场景落地方面的系统性优势,而非单一环节的突破。产业链的完整度与规模化成本控制能力,是支撑这一占比的关键。
从产业层面看,高市占率将加速国内技术标准的制定与输出,形成“量产-迭代-降本”的正循环。同时,对上游传感器、电机、AI芯片等供应链的拉动效应显著,可能催生一批隐形冠军企业。在竞争格局上,海外企业如特斯拉、波士顿动力在高端复杂应用领域仍有技术储备,但中国在制造效率与场景渗透(如物流、巡检、教育)上已形成护城河,未来竞争焦点或转向“通用性”与“人机交互”能力。
深挖阅读AI 解读
核心要点提炼
我国人形机器人产业在全球市场占据绝对主导地位,市场份额超80%。这一数据反映出中国在核心零部件、整机集成及场景落地方面的系统性优势,而非单一环节的突破。产业链的完整度与规模化成本控制能力,是支撑这一占比的关键。
影响分析
1. 产业层面:高市占率将加速国内技术标准的制定与输出,形成“量产-迭代-降本”的正循环。同时,对上游传感器、电机、AI芯片等供应链的拉动效应显著,可能催生一批隐形冠军企业。
2. 竞争格局:海外企业(如特斯拉、波士顿动力)在高端复杂应用领域仍有技术储备,但中国在制造效率与场景渗透(如物流、巡检、教育)上已形成护城河。未来竞争焦点或转向“通用性”与“人机交互”能力。
3. 风险提示:需警惕产能过剩风险——若下游应用场景(如养老、家庭服务)渗透不及预期,可能导致价格战与利润压缩。此外,核心技术(如高精度伺服电机、实时操作系统)的自主化率仍需提升,避免“量占优、质受制”的隐患。
结论:中国在人形机器人领域已取得阶段性领先,但需从“市场占比”转向“价值占比”,通过技术纵深与生态建设巩固长期竞争力。
机器人 发布 2026/05/25 08:00 更新 2026/05/31 02:07
让机器人“边想边做”,蚂蚁灵波“因果世界模型”论文被世界机器人顶会RSS 2026接收_腾讯新闻 近日,蚂蚁灵波科技与香港科技大学等高校合作完成的研究论文 《Causal World Modeling for Robot Control》被国际机器人顶级学术会议 Robotics: Science and Systems(RSS)2026 接收。
RSS 是全球机器人领域公认的顶级学术会议之一,长期关注机器人学习、控制、感知、规划与系统等前沿方向,录用标准严格。论文被 RSS 接收,意味着相关研究
深挖阅读AI 解读
核心要点提炼:
蚂蚁灵波与港科大合作的“因果世界模型”论文被RSS 2026接收,标志着其从“感知-执行”向“因果推理-行动”的范式跃迁。核心突破在于:机器人不再仅依赖视觉或模仿学习,而是通过构建因果图进行“边想边做”,即实时推理动作的因果后果,实现零样本适应新任务与动态环境。该模型将传统“黑箱”预测升级为可解释的因果链条,显著提升了复杂操作任务的泛化性与成功率。
影响分析:
1. 技术层面: 该成果直击当前具身智能的“泛化瓶颈”。传统机器人依赖海量数据或预置规则,面对光照、物体位置等微小变化易失效。因果模型通过分离“不变因果机制”与“变化噪声”,使机器人能从少量交互中学习通用物理规律,大幅降低数据依赖,加速从实验室到工业、家庭的落地进程。
2. 产业层面: 蚂蚁集团借此切入“AI+机器人”高端赛道,强化了其在前沿基础研究领域的布局。获RSS认可,将提升其技术品牌信誉,吸引更多产学研合作。对行业而言,该路径或成为继大模型后,解决机器人“智能决策”的新范式,推动服务机器人、柔性制造等场景的实用化。
3. 竞争格局: 全球头部机构(如Google DeepMind、OpenAI)正竞相攻克“世界模型”。蚂蚁灵波的“因果”路线提供了差异化解法,若后续能结合其场景优势(如物流、金融),可能形成独特壁垒。但需注意,从顶会论文到稳定产品,仍有工程化与成本挑战。
机器人 发布 2026/05/25 08:00 更新 2026/05/30 10:41
从“表演”到“实干”,具身智能机器人加速产业落地 - 腾讯新闻 具身智能机器人正从实验室原型迈向真实场景应用,行业拐点已至。技术成熟度曲线显示,算法泛化能力提升与硬件成本下降正催生首批商业化闭环。产业链协同加速,大模型(如多模态感知)赋能“大脑”,精密零部件(如灵巧手、高扭矩关节)支撑“身体”,AI与机械融合不再停留于概念。
短期1-2年内,制造业、物流、巡检等结构化场景将率先实现机器人替代人工,尤其利好3C电子、汽车装配等高重复性工序。企业需关注“机器人即服务”模式带来的成本重构,而非单纯采购硬件。中期3-5年,家庭服务、养老陪护等非结构化场景将出现首批爆款单品,但需突破安全交互与低功耗续航瓶颈。
深挖阅读AI 解读
深度分析:具身智能机器人从“炫技”迈向“量产”
核心要点:
1. 行业拐点已至:具身智能机器人正从实验室的“表演式”原型,转向工厂、家庭等真实场景的“实干型”应用。技术成熟度曲线显示,算法泛化能力与硬件成本下降正在催生首批商业化闭环。
2. 产业链协同加速:大模型(如多模态感知)赋能“大脑”,精密零部件(如灵巧手、高扭矩关节)支撑“身体”,AI+机械的融合不再停留于概念。
影响分析:
短期(1-2年):制造业、物流、巡检等结构化场景将率先实现机器人替代人工,尤其利好3C电子、汽车装配等高重复性工序。企业需关注“机器人即服务”(RaaS)模式带来的成本重构,而非单纯采购硬件。 中期(3-5年):家庭服务、养老陪护等非结构化场景将出现首批爆款单品,但需突破安全交互与低功耗续航瓶颈。政策端,中国在“人形机器人”领域的标准制定与补贴政策可能加速国产供应链崛起。 长期风险:技术路径尚未收敛(如双足vs轮式、遥操作vs自主决策),过早押注单一形态可能导致沉没成本。建议投资者关注具备“场景-算法-硬件”三位一体整合能力的平台型企业,而非纯硬件厂商。
结论:具身智能正经历“从0到1”的质变,但“从1到100”的规模化仍需3-5年。当前应聚焦于解决“痛点场景”的务实产品,而非追逐概念热度。
机器人 发布 2026/05/25 08:00 更新 2026/05/30 09:31
从“表演”到“实干”,具身智能机器人加速产业落地 - 腾讯新闻 根据您的要求,以下是该新闻的精炼摘要:
具身智能机器人正从实验室的“表演”阶段加速迈向产业“实干”阶段。在2024世界机器人大会上,多家企业展示了人形机器人在搬运、分拣、焊接等工业场景中的实际应用。优必选科技发布了全新一代工业人形机器人Walker S Lite,已在极氪工厂的流水线上执行螺丝拧紧、物料搬运等任务,其单台机器人可替代2-3名工人,预计投资回报周期为1.5至2年。宇树科技的人形机器人H1在宁德时代工厂进行电池模组搬运测试,其负载能力达30公斤,连续作业时长超过8小时。
深挖阅读AI 解读
深度分析解读
1. 核心要点提炼
具身智能机器人正从实验室“炫技”转向工业场景“实干”,2024世界机器人大会成为产业落地的分水岭。优必选Walker S Lite已在极氪工厂执行螺丝拧紧、物料搬运,单台替代2-3名工人,投资回报周期1.5-2年;宇树H1在宁德时代测试电池模组搬运,负载30公斤、连续作业超8小时。这标志着人形机器人从概念验证进入商业化验证阶段。
2. 影响分析
制造业效率跃升:机器人直接替代重复性体力劳动,降低人力成本与工伤风险。优必选的数据显示,1.5-2年回本周期对制造业企业具有强吸引力,加速工厂自动化改造。 产业链重构:核心零部件(伺服电机、减速器、AI芯片)需求激增,推动国产供应链升级。同时,机器人运维、编程等新岗位将涌现,但低技能岗位面临挤压。 投资风向转变:资本市场从追捧“概念”转向关注“落地能力”。优必选、宇树等企业凭借工业场景订单,有望率先盈利,带动行业估值体系从PS(市销率)向PE(市盈率)切换。 风险提示:当前机器人仍依赖预设程序,泛化能力不足;单台成本约50-80万元,中小企业可能观望。若规模化量产未达预期,行业泡沫风险需警惕。
结论:具身智能机器人正从“表演”走向“实干”,工业场景是当前最佳突破口。投资者应聚焦有真实订单、回本周期明确的头部企业,同时关注供应链国产化进程。
机器人 发布 2026/05/25 07:44 更新 2026/05/30 10:41
美芯晟战略投资金钢科技,深化机器人智能感知产业布局 美芯晟(MixinStar)对金钢科技实施战略投资,重点布局机器人智能感知领域。此次投资聚焦传感器与感知系统等机器人核心部件,旨在通过资本纽带整合上游技术资源,提升自主可控能力。美芯晟作为模拟芯片与传感器供应商,此举可补齐其在机器人“触觉+环境感知”环节的短板,形成从芯片设计到整机应用的垂直整合,增强供应链韧性。
机器人行业正从“运动控制”向“智能感知”演进,此次投资将加速高精度传感器(如力矩、六维力传感器)的国产化替代,降低对进口依赖,并推动人形机器人、协作机器人等场景的落地成本下降。资本市场信号显示,资本正从“硬件制造”向“感知算法+核心器件”双轮驱动转移。
深挖阅读AI 解读
【核心要点提炼】
美芯晟(MixinStar)战略投资金钢科技,意在加强其在机器人智能感知领域的技术与产业链布局。此举聚焦于机器人核心部件——传感器与感知系统,旨在通过资本纽带整合上游技术资源,提升自主可控能力。
【影响分析】
1. 产业链协同:美芯晟作为模拟芯片与传感器供应商,投资金钢科技可补齐其在机器人“触觉+环境感知”环节的短板,形成从芯片设计到整机应用的垂直整合,增强供应链韧性。
2. 技术竞争升级:机器人行业正从“运动控制”向“智能感知”演进。此投资将加速高精度传感器(如力矩、六维力传感器)的国产化替代,降低对进口依赖,并推动人形机器人、协作机器人等场景的落地成本下降。
3. 资本市场信号:该动作显示资本正从“硬件制造”向“感知算法+核心器件”双轮驱动转移。短期看,美芯晟有望在机器人零部件领域获得估值溢价;长期看,若技术突破顺利,将重塑国产机器人感知模块的竞争格局。
结论:这是一次典型的“技术卡位”式投资,美芯晟通过资本布局抢占机器人智能感知的制高点,行业正进入“感知决定性能”的深水区竞争阶段。
机器人 发布 2026/05/25 07:44 更新 2026/05/30 09:31
美芯晟战略投资金钢科技,深化机器人智能感知产业布局 美芯晟科技股份有限公司宣布对金钢科技有限公司进行战略投资,具体金额未披露。金钢科技成立于2021年,专注于机器人智能感知领域,核心产品包括高精度力矩传感器、触觉传感器及多维力传感模组,技术指标达到国际先进水平。其传感器已应用于工业机器人、协作机器人及人形机器人,客户覆盖多家头部机器人企业。
此次投资将整合美芯晟在模拟芯片、信号链及电源管理领域的技术积累,与金钢科技的传感器技术形成协同。双方计划在机器人关节驱动、力控反馈及环境感知等环节联合开发集成化解决方案,提升机器人的动态响应精度与作业安全性。
深挖阅读AI 解读
深度分析解读
核心要点提炼:
美芯晟战略投资金钢科技,本质是芯片设计公司向机器人产业链上游传感器环节的垂直整合。金钢科技掌握高精度力矩/触觉传感器核心技术,其产品已切入工业、协作及人形机器人头部客户。双方将打通“模拟芯片+传感器”技术链路,聚焦关节驱动与力控反馈的集成化方案。
影响分析:
1. 产业协同价值:美芯晟的电源管理、信号链芯片与金钢的传感模组形成物理层互补。此举可缩短机器人关节的力控闭环延迟,提升动态响应精度——这正是当前人形机器人从“能走”到“能精准操作”的关键瓶颈。
2. 竞争格局重塑:传感器成本占机器人BOM约15-20%,且长期被海外厂商主导。美芯晟的国产芯片替代能力叠加金钢的传感器量产经验,有望加速国产机器人核心部件的成本下探与性能突破,尤其利好人形机器人量产降本。
3. 战略卡位:投资发生在具身智能爆发前夜,双方通过“芯片+传感”的预集成方案绑定,可形成差异化壁垒。后续若推出标准化模组,将直接降低下游机器人厂商的研发门槛,加速行业从定制化走向模块化。
机器人 发布 2026/05/22 10:00 更新 2026/05/30 09:31
人形机器人“狂奔”,快递无人化时代还有多远? 2025年3月,人形机器人领域迎来密集突破。特斯拉Optimus在工厂内完成电池分拣、螺丝拧紧等精细操作,单次充电续航达20小时;Figure AI与OpenAI合作开发的Figure 02机器人,在宝马工厂实现每小时搬运300个零件的效率,失误率低于0.1%。国内方面,优必选Walker S在比亚迪产线完成质检、物料搬运等任务,宇树科技H1机器人实现每秒3.3米奔跑速度,追平人类慢跑水平。行业数据显示,2025年全球人形机器人市场规模预计达120亿美元,同比增长210%,其中中国占比35%。
快递无人化进程同步加速。
深挖阅读AI 解读
核心要点提炼:
2025年3月,人形机器人技术迎来爆发式突破。特斯拉Optimus实现工厂精细作业与20小时续航,Figure 02在宝马工厂达到每小时300件搬运效率且失误率低于0.1%,国内优必选、宇树科技分别在质检、奔跑速度上取得进展。全球市场规模预计达120亿美元,中国贡献35%。快递无人化进程同步加速,技术成熟度与商业化落地形成共振。
影响分析:
1. 制造业与物流业效率革命:人形机器人可替代重复性、高精度劳动,降低人力成本与失误率,尤其适用于电商仓储、分拣、末端配送等场景。快递无人化将从“半自动”向“全自主”跨越,缩短“最后一公里”实现周期。
2. 产业链重塑与竞争格局:中国占比35%显示本土企业已在硬件、场景适配方面占据先机,但核心算法、传感器仍依赖进口。特斯拉、Figure AI等海外巨头通过“AI+机器人”闭环加速迭代,倒逼国内产业链向垂直领域深耕。
3. 社会与就业结构挑战:大规模替代低技能岗位将引发结构性失业,但催生机器人运维、AI训练等新职业。政策需提前布局再培训体系,平衡效率与公平。
4. 投资与资本风向:120亿美元市场仅是起点,预计2027年突破500亿美元。资本将向“场景落地快、成本控制强”的企业集中,垂直物流机器人或成短期爆发点。
机器人 发布 2026/05/20 09:50 更新 2026/05/30 09:31
盖茨比创下美国历史,成为首个humanoid 机器人做家庭清洁工作 盖茨比(Gatsby)作为全球首款人形机器人,于2024年3月15日正式进入美国加州一户家庭,承担扫地、拖地、整理物品等日常清洁任务,创下美国历史。该机器人由硅谷初创公司RoboDynamics研发,身高1.75米,重68公斤,配备16个关节和4个摄像头,可自主导航并识别200余种常见家居物品。RoboDynamics首席执行官迈克尔·陈(Michael Chen)表示,盖茨比搭载的AI系统经过超过1万小时的模拟训练,能完成从擦拭桌面到吸尘地毯的完整清洁流程,单次充电可持续工作4小时。
在为期30天的试点项目中,盖茨比成功处理了包括打翻的牛奶、散落的玩具等突发状况,任务完成率达97.3%。
深挖阅读AI 解读
核心要点提炼:
盖茨比(Gatsby)成为美国首款进入家庭执行清洁任务的人形机器人,标志着人形机器人从实验室走向消费级场景的里程碑。其1.75米身高、68公斤体重、16关节及4摄像头配置,结合超1万小时模拟训练的AI系统,实现自主导航、物品识别及突发状况处理,单次充电续航4小时,试点任务完成率达97.3%。
影响分析:
1. 行业催化:盖茨比的成功试点将加速人形机器人商业化进程,尤其在家用服务领域。RoboDynamics的技术验证可能吸引更多资本涌入,推动供应链成本下降及算法迭代。
2. 社会与市场影响:家庭清洁场景的机器人替代效应初显,短期或冲击传统家电清洁产品(如扫地机器人)市场,长期可能重塑家政服务行业结构。同时,人形机器人的“拟人化”设计提升用户接受度,为后续医疗、教育等场景渗透铺路。
3. 挑战与隐忧:当前4小时续航与200种物品识别能力仍存局限;突发状况处理能力虽达97.3%,但极端场景(如易碎品、宠物互动)的可靠性需验证。此外,隐私安全(4摄像头数据流)与成本问题(初期售价或超5万美元)仍是规模化门槛。
结论:盖茨比的成功落地是人形机器人从“概念”到“工具”的关键转折,但技术成熟度与商业闭环仍需时间检验。行业应聚焦场景痛点解决与成本优化,而非盲目追求“类人”外形。