2025年4月22-24日
上海世博展览馆

上海电子展|2025 具身智能与智能机器人技术演进、挑战与未来趋势研判

具身智能与智能机器人发展态势如何?2025 年,人工智能在工业制造领域又将迎来怎样的重大突破?市场调研机构 MarketsandMarkets 预测,到 2030 年,全球垂类 AI 应用市场规模将突破 471 亿美元。其中,工业制造作为关键领域,正加速向智能化生产与全流程自动化方向迭代升级,具身智能与智能机器人技术也在持续与传统工业制造领域深度融合。2025 年,将是具身智能从实验室迈向工厂的关键转折点,人形机器人作为高阶形态,有望率先在工业领域实现商用突破,重塑全球制造业竞争格局。

 

上海电子展了解到,中国工程院院士、博士生导师,中国科学院沈阳自动化研究所研究员,机器人与智能系统全国重点实验室主任于海斌,在沈阳市高新技术企业协会主办的 “创新聚沈・向阳而行” 大会上,围绕具身智能与智能机器人展开了深度分享。

一、人工智能的历史脉络与具身智能的诞生

 

自 1956 年达特茅斯会议正式提出人工智能(AI)概念以来,这一领域历经多次技术浪潮与寒冬。于海斌院士指出,AI 的发展可划分为四个阶段:

 

符号逻辑推理阶段(1950s - 1980s):此阶段以知识表达和专家系统为核心。然而,由于知识获取困难,终因实用性欠佳,AI 进入第一次寒冬。

神经网络连接阶段(1980s - 2000s):辛顿(Geoffrey Hinton)等人提出反向传播算法,有力推动了神经网络的发展。但受限于当时的算力和数据,应用场景较为有限。

深度学习阶段(2010s 至今):以卷积神经网络(CNN)和斯坦福大学李飞飞团队构建的 ImageNet 数据库为标志,AI 在图像识别等领域取得重大突破,识别率从 60% 提升至超越人类水平。

具身智能(Embodied AI)阶段(2020s 起):AI 从单纯的数据驱动模式,转向与物理世界交互,强调智能体通过身体、环境与任务的协同作用,实现认知与行为的进化。

 

上海电子展了解到,早在计算机理论发展初期,图灵就提出了两种智能路径 ——“离身智能”(如 ChatGPT,主要依赖纯数据推理)与 “具身智能”(需与物理设备相结合)。但由于技术复杂度高,具身智能长期发展滞后。直到机器人学、神经科学和心理学交叉融合,为其发展提供了全新思路。

二、具身智能的核心内涵与科学依据

(一)环境交互与智能发育的必然性

 

于海斌院士通过一项科学实验,阐释了环境交互与智能发育的正相关性,证明智能的成长依赖于与环境的动态互动。

 

麻省理工学院的两位研究人员将两只小猫置于圆桶内,两只小猫在圆筒内绕圈运动。第一只小猫自主行走,第二只小猫则被放置在与柱体中心轴相连的小盒子里,二者所见相同。结果显示,只有自主运动的小猫发育出正常视力。这一实验反向验证了 “心灵手巧” 的逻辑,即肢体动作的灵活性(如操作工具)能够促进认知能力的提升。

(二)具身智能三位一体的智能框架

 

具身智能强调 “大脑 - 身体 - 环境” 三位一体的结构。其中,大脑负责高层决策与意图理解(如大语言模型);身体通过传感器与执行器实现物理交互(如机械臂、仿生关节);环境提供动态反馈与训练场景(如仿真平台、真实物理空间)。三者协同运作,形成闭环,使智能体能够通过试错学习,适应复杂任务。

(三)从 “感知智能” 到 “行动智能” 的跨越

 

上海电子展了解到,传统 AI 擅长静态感知(如图像识别),但在对物理世界的动态响应能力上有所欠缺。波士顿动力(Boston Dynamics)的 Atlas 机器人通过深度学习与强化学习相结合,实现了翻越障碍、适应地形变化等复杂动作,标志着具身智能在运动控制领域取得重大突破。

三、围绕具身智能四大热点的思考与技术挑战

 

数字人:中国通用人工智能研究院开发的 “数字人通通” 模拟人类从婴儿期开始的成长过程,通过与虚拟环境的交互(如听觉、触觉反馈)实现认知进化。这一尝试为研究人类智能发育提供了新范式,但也引发了伦理争议 —— 若机器人通过环境交互自主进化,人类是否会失去控制?

机械臂与大语言模型的融合:谷歌 RT - X 平台将大语言模型(LLM)与机器人操作相结合,使机械臂能够理解自然语言指令(如 “整理房间”),并自主分解任务步骤(识别杂物、分类归置)。该技术已在叠衣服、精细装配等场景中展现出应用潜力,但其泛化能力仍受限于物理规则与数据多样性。

人形机器人的争议与前景:马斯克力推的 Optimus 人形机器人引发了两极评价。支持者认为人形是通用化的终极形态,能够适配人类环境(如楼梯、工具);质疑者则指出其成本高昂、技术存在冗余(如多关节驱动难题)。

 

于海斌院士认为,人形机器人的核心价值在于 “本体硬件” 与 “智能算法” 的协同突破。例如,开源算法(如波士顿动力的运动控制模型)大幅降低了本体研发门槛,而英伟达 CEO 黄仁勋布局的具身智能训练平台,或将推动行业标准化进程。
4. 智能驾驶与低空经济:尽管全无人驾驶面临地面环境的极端复杂性(如突发行人、不规则道路),但网联汽车的辅助驾驶(如车道保持、自动泊车)和低空经济(无人机物流、巡检)已成为更具可行性的商业化方向。

四、技术路径:肢体、小脑与大脑的协同进化

 

在探讨机器人技术路径的未来发展趋势时,于海斌院士表示,未来人形机器人的肢体部分存在很大提升空间,例如基于高能量密度的仿生驱动肢体。可仿照人类心脏的高效供能机制,研发微型液压驱动与仿生肌肉,德国费斯托的气动机械臂就是一个很好的参考范例。该机械臂融合了高精度控制与仿生设计,拥有 12 个自由度,动作柔性且稳定,部分型号搭载 AI 技术实现自我学习优化,电磁阀寿命超 3000 万次,具备出色的性能和耐用性。

 

此外,生物融合也是未来机器人的发展趋势之一。未来,我们或许能够通过培养生物细胞构建具有感知与驱动能力的 “类器官” 产品。尽管这类产品对生存环境要求苛刻,但为软体机器人的发展提供了新思路。

 

小脑的主要作用是提升人形机器人的运动协调能力。运动控制依赖海量物理数据,而在真实环境中进行训练成本过高。目前,国内已有相对成熟的平台用于机器人模拟训练,例如国家地方共建人形机器人创新中心开发的异构人形机器人训练场,通过 “虚拟 - 现实” 迁移学习(Sim2Real),使机器人能够在低成本场景中预训练动作(如行走、跳跃),再迁移至真实环境进行微调。

 

大脑则为机器人提供决策模型与认知能力。目前,多模态感知技术是主要解决方案,该方案融合视觉、触觉、力觉传感器,提升对环境理解的全面性。例如,北京大学电子学院程翔教授团队提出的 “机器联觉” 系统,通过智能融合通信与多模态感知信息,有效提升了机器人在复杂环境中的感知、决策与通信能力。

 

此外,于海斌院士还提及了如何解决大模型 “灾难性遗忘” 问题,以实现机器人的终身学习。爱丁堡大学提出的增量强化学习框架是解决 “灾难性遗忘” 的有效方案之一。它能够在保留已有知识的基础上,通过逐步增量式地更新策略,快速适应新环境或新任务,从而显著提升机器人在动态变化环境中的学习效率和性能表现,无需重新训练整个模型。

五、未来十年技术趋势研判与产业启示

 

于海斌院士预测,未来十年,具身智能的算法与训练平台将快速发展,而硬件(如高精度传感器、仿生关节)受限于材料与工艺,发展速度相对较慢。企业应优先布局软件生态(如仿真平台、数据链),而非盲目投入硬件研发。

 

此外,具身智能缺乏统一的理论体系(如认知科学的世界模型),但场景驱动的工程化应用(如仓储机器人、医疗外骨骼)将率先落地。国家需推动跨机构协作,解决数据确权与模型共享难题。

 

在通用终端的终极形态方面,于海斌院士认为人形机器人未必是唯一答案,具身智能可能通过 “一脑多机” 模式赋能多样化设备(如工业机床、家用电器)。例如,同一 AI 核心可同时调度无人机群与地面机器人,实现任务协同。

 

在伦理与安全方面,于海斌院士指出,若具身智能体通过环境交互自主进化,可能超出人类预设的边界。行业需提前建立伦理规范(如行为约束算法、人机权责界定),避免技术失控风险。

六、结语与未来

 

具身智能正推动 AI 从 “虚拟大脑” 向 “物理实体” 迭代。在技术演化过程中,需更加关注技术创新的有效性与产业化的可落地性。正如于海斌院士所说:“蓝海的意义在于未知,而未知需要勇气与智慧并存。” 对于产业从业者而言,打破学科壁垒、深化理论突破,聚焦场景刚需、参与生态共建,或将成为抢占先机的关键。

 

 

 

文章来源:腾讯网