原标题:协同创新,推动人形机器人落地
通过部署大模型实现多感官推理能力,未来有望覆盖生活工作众多应用场景
上海科技创新成果展集聚了基础研究、人工智能、生物医药等领域的高科技成果。其中,两款人形机器人引人注目——傅利叶智能公司研发的GR-1高1.65米,重55公斤,拥有模拟人类体形的头部、躯干和四肢;智元机器人公司展示的“远征A1”高1.75米,重53公斤,分为足式和轮式两种形态。
通用人形机器人的未来应用场景有哪些?它离产业化应用还有多远?记者采访了多位专家。在他们看来,这类智能终端将成为人工智能和机器人产业热门赛道,需要政产学研用协同创新。政府可依托新型研发机构,建立人形机器人“原子动作”训练平台和数据平台,并通过开源共享,推动产业生态创新和产品应用落地。
打造发达“小脑”和“大脑”
机器人为什么要设计成人形?傅利叶智能创始人兼首席执行官顾捷解释,与其他形态的机器人相比,人形机器人能直接使用人类发明的工具;另一方面,人形显得可亲,给用户带来很高的“情绪价值”。
业界普遍认为,“具身智能”将成为人工智能的下一个浪潮。所谓“具身智能”,是将语言、视觉、语音等多模态大模型与机器人结合,让人工智能“大脑”拥有可支配、可感知、可交互和可行动的“身体”,从而为人类提供更多的智能服务。
实现“具身智能”的首选载体,就是人形机器人。顾捷认为,它们有望用于养老陪护、家政服务、迎宾接待、危险场所巡逻等领域,覆盖生活和工作的众多应用场景。
“我们正在提高人形机器人的运动智能水平,让它的‘小脑’更发达,早点学会跑和跳。”顾捷介绍,“接下来还要部署大模型‘大脑’,实现机器人的视觉、听觉、触觉等多感官推理能力。”
智元机器人的“远征A1”也在上海科技创新成果展上亮相。公司联合创始人彭志辉透露,下一代面向商用的“远征A2”正在开发中,会采用多个自主研发的关键核心零部件,将消除“远征A1”的稳定性、可靠性缺陷,并大幅提升机器人的运动能力上限。
产业化应用面临的挑战
在迈向产业化应用的征程上,傅利叶智能、智元机器人等企业面临哪些挑战?顾捷表示,在人形机器人产业链上,傅利叶属于智能终端整机企业,其上游是零部件供应商,下游是利用GR-1等整机的开放式软硬件接口,为各种应用场景开发专用机器人的企业。未来,产业链下游的生态体系会越来越大。为此,他建议政府一方面促进产学研合作,早日实现人形机器人一系列关键核心技术的突破;另一方面,借鉴我国新能源汽车产业扶持政策的经验,研究制定培育人形机器人产业、支持产品应用落地的政策,让这类机器人好用、耐用、老百姓用得起。
“目前,国内这条产业链还不完善,比如机器人雷达用的是车用雷达,摄像头用的是家用产品,机械臂来自工业机器人。”顾捷说,“这些零部件今后要定制化,更符合人形机器人的开发需求。”
谈及产业化应用的技术挑战,彭志辉认为,整机的系统设计、关节电机和灵巧手等核心零部件、全身运动控制算法、实时操作系统、通用泛化的感知能力、基于大语言模型的对话理解和动作编排……这些技术点都是有待探索的方向,需要企业有全栈的技术视角和坚定的探索精神,也需要政府立项支持和产学研合作。
搭建通用机器人平台
在大模型与机器人融合方面,通用机器人产业研究院理事长宋海涛介绍,通用机器人模型可分为三种——多模态感知模型、运动控制模型和自主任务执行模型。“这些模型能否顺利部署到机器人端,让它们有发达大脑和强大执行力,需要做大量预训练研究。”
他进一步解释:人形机器人执行任务时的各种动作可分解为一系列“原子动作”,比如抓取工具、摁按钮、搬物品,机器人掌握这些“原子动作”后,通过排列组合,就能在“大脑”指挥下完成任务。因此,新型研发机构可在政府支持下建立“原子动作”训练平台,对各种应用场景中的人形机器人进行大样本训练,并利用训练产生的大数据建立数据平台。
在共性技术研发方面,通用机器人产业研究院科研副院长、上海交通大学机器人研究所博士生导师闫维新表示,研究院将联合其他创新主体,瞄准机器人端算力平台、操作系统、高爆发执行器、触觉传感器等关键核心部件进行协同攻关,为国产通用人形机器人提供技术支撑。