• 四川省人形机器人训练场B场近日投用,记者探访机器人“学校”都教些啥——

    具身智能机器人何以成“人”?



  • 5月21日,机器人正在四川省人形机器人训练场训练。



    扫码看机器人训练视频。

    □四川日报全媒体记者 高杲/文 郝飞/图
    问题
      ●具身智能机器人怎么“上课”?最终何以成“人”?

    回答
      ●训练师是机器人的启蒙老师,他们需“手把手”引导机器人学习,直到把它们训练成掌握多种技能的工作伙伴
      ●每个训练师对同一任务进行一段时间训练后,就会和其他训练师进行轮换。如果一直让一个人训练,当机器人遇到突发情况时就难以灵活应变
      ●高质量动作数据“教材”的出现,让机器人的学习能力更强。“以前机器人学一个新动作可能需要几天,现在也许只需要一两个小时”
      ●除了用机器人采集数据来编写“教材”,训练场也在构建多元化数据体系,同时探索世界模型、机器人自主学习等先进训练范式,提高整体数据规模与训练效率

    目的
      ●训练的核心不是提升机器人做事的技能,而是产生数据,然后用这些数据去训练模型,提升机器人的适应能力
      ●聚焦智慧健康、工业巡检等垂直场景,推动人形机器人技术成果在真实环境中快速验证与示范应用

      在装满零食、饮料瓶的货架旁,一台人形机器人在练习货物抓取。一旁的机器人训练师及时记录下机器人的每一次抓取,并不时调整其动作幅度……这一幕发生在近日投用的四川省人形机器人训练场B场。四川省人形机器人训练场由天府绛溪实验室牵头建设,采用“本部—展示—外场”布局。其中,“本部”聚焦具身智能机器人核心研发和训练,“外场”则构建机器人室外验证场,训练场B场是场景展示与示范平台,聚焦智慧健康、工业巡检等垂直场景,推动人形机器人技术成果在真实环境中快速验证与示范应用。近日,记者走进这座占地面积超1000平方米的训练场,看机器人是如何“上课”的。

    “手把手”教学 每个动作每天重复数百次
      “机器人就像一个小孩子,只有不断配合动作示范、纠错和强化,才能让它学得更快、更稳”
      训练场有高度复刻的超市、管廊、复杂地形等仿真场景。每个细分场景中,都有一台或几台机器人,以及它们的专属训练师。
      训练师张明每天的工作是根据不同任务需求,引导机器人进行重复抓取、交互等动作。在整个训练场,像张明这样的训练师还有20余个。
      训练师是机器人的启蒙老师,他们需“手把手”引导机器人学习,直到把它们训练成掌握多种技能的工作伙伴。张明以抓取货物为例,整个任务会被拆解为识别、抓取、摆放等动作,需要训练师操控手柄控制机器人移动、俯仰、弯折手臂,每个动作每天需训练数百次。“动作既要准确,还要尽量自然、接近人类习惯。”
      为避免机器人只学到某一个人的操作习惯,每个训练师对同一任务进行一段时间训练后,就会和其他训练师进行轮换。“以抓取货物来说,有人喜欢横着抓,有人喜欢竖着抓,大家习惯都不相同。”张明说,如果一直让一个人训练,当机器人遇到突发情况时就难以灵活应变。
      “机器人就像一个小孩子,只有不断配合动作示范、纠错和强化,才能让它学得更快、更稳。”训练场共建方代表四川具身人形机器人科技有限公司CEO、天府绛溪实验室交互人形机器人前沿研究中心副主任冯振宇说,训练的核心不是提升机器人做事的技能,而是产生数据,然后用这些数据去训练模型,提升机器人的适应能力。

    用数据编写“教材” 让机器人的学习能力更强
      “当‘智能涌现’越来越频繁,机器人的智慧化程度也会越来越高”
      “一个三岁小孩,只需要坐过几个凳子,就知道凳子是可以用来坐的。”四川具身人形机器人科技有限公司算法工程师曾易介绍,这是因为人具备通过直接经验快速建立功能关联的能力。
      这项能力,也在机器人身上显现。记者在现场摆放几个不在训练计划中的饮料瓶,当训练师发出抓取指令后,机器人不仅能顺利抓取,还能稳稳放在固定位置。
      “这是因为‘教材’已经教会了它。”曾易所说的“教材”,是指高质量动作数据。他打了一个比方,平时训练机器人从货架上抓取苹果、梨子等水果,这些数据赋予到一个新的机器人上,它依然会抓取苹果、梨子等水果,但当货架上突然多了一个桃子,它之前并没有训练过,但“教材”提示说桃子也是水果,它就会自我判断,重复抓取这个动作,这就是“智能涌现”。“当‘智能涌现’越来越频繁,机器人的智慧化程度也会越来越高。”
      “教材”的出现,让机器人的学习能力更强。“以前机器人学一个新动作可能需要几天,现在也许只需要一两个小时。”曾易说,这并不是因为它突然变“聪明”了,而是在“教材”中已经进行了“预学习”,这样到真实场景,仅需要微调就能学会。
      除了用机器人采集数据来编写“教材”,训练场也在构建多元化数据体系,包括高保真合成数据、人类视频数据、无本体训练数据等。同时,探索世界模型、机器人自主学习等先进训练范式,提高整体数据规模与训练效率。“真实数据和合成数据‘虚实结合’的方式,能够实现模型训练效率和泛化能力的平衡。”冯振宇说。

    从“课内”到“课外” “学区地图”正在四川形成
      “训练场可以为机器人企业提供测试与优化,采集高质量数据,训练出更智能、更可靠的模型”
      训练场B场已投用,几十公里外的训练场“本部”建设也在提速。放眼全省,随着位于绵阳的四川省具身智能机器人训练场、自贡的四川人形机器人多模态数据采集测试中心、宜宾的西南具身智能训练中心等陆续铺开,一张机器人“学区地图”正在四川形成。
      除了搭建“课堂”,四川也将机器人的学习拓展到“课外”,一些机器人产品纷纷走进工厂、养老院、超市等真实空间采集数据。比如,去年7月,人形机器人在富临精工股份有限公司“直播打工”;更早之前,“四川造”养老机器人“小丽”走进成都养老社区,正式“上岗”……
      “学区”的价值,远不止于训练机器人,更在于构建一个产业整体发展的开放生态。四川省人形机器人训练场B场所在地——“诸葛空间”人工智能产业生态示范区,汇聚四川具身科技、越凡创新等机器人企业。“训练场可以为机器人企业提供测试与优化,采集高质量数据,训练出更智能、更可靠的模型。”该园区相关负责人说。

分享到微信朋友圈