汽车制造的总装环节目前的自动化程度相对较低,是人形机器人可以发挥作用的机会点,其余制造环节已有工业机器人的成熟部署。
文|杨柳
编辑 | 郭丽琴
成为“打工人”,是人类期望人形机器人承担的“宿命”。虽然人形机器人的技术迭代仍需时日,但目前市场上的两股力量正在试图加速驱动其从0到1的蜕变,实现产品的商业化落地。
最新的热潮来自于一段突破性技术的展示视频。当地时间3月13日,当红人形机器人初创公司 AI在社交平台上公布其与合作13天后的机器人——的最新视频。视频中,机器人展示了与人类的对话交互能力,随即引发全球热议。最新视频表明了视觉语言模型加持人形机器人所带来的极快升级,呈现了机器人的推理交流能力。浙商证券3月14日发布的一份研报预期,就大模型+人形机器人目前所呈现的状态,人形机器人有望打开 C 端市场。
人形机器人技术突破背后,资本正大力输血。一级市场上,近3个多月以来,已有多个上亿人民币或美元的融资案例。二级市场上,作为中国人形机器人第一股的优必选,市值从港股上市初的380亿港元,翻番至当前的928亿港元。
与此同时,商业化落地场景也深入到前景广阔的产业新贵的生产一线。人形机器人厂商的潜在甲方——新能源车企,已开始为机器人的场景化训练提供“实习平台”。2月下旬,优必选首次公开最新版人形机器人 S在蔚来汽车生产线的实训视频。3月15日,梅赛德斯-奔驰宣布将公司研发的人形机器人引入生产线,以应对低技能、重复性工作岗位的劳动力短缺。
受制于成本和应用难题,受访人士预估,还需5-10年才能看到人形机器人大批量部署汽车装配车间,但机器人厂商和车企,基于互补的需求,已经开始“双向奔赴”,助推新的科技浪潮到来。
机器人有了大模型“大脑”
资本乐意输血的核心原因是,人形机器人在大模型的加持下,不仅初具“智能”,且迭代速度加快。
据《财经》不完全统计,近3个多月以来,已有星动纪元、智元、宇树科技等中国厂商完成了超亿元人民币的融资。这三家公司的融资规模分别在超1亿元、超6亿元和近10亿元。
在国际市场,2024年年初,挪威人形机器人公司1X 收获1亿美元融资;更引发关注的是美国人形机器人赛道新星 AI,在2月下旬完成6.75亿美元B轮融资,微软、英伟达等科技巨头投资者提供资金和技术支持。
1X 和 AI还有个共同的背景——得到的站台。有了大模型,人形机器人就有了“大脑”,具身智能体才有望步入现实。人形机器人的结构,可以拆解为“肢体”“小脑”和“大脑”三个组成模块。其中“大脑”主导机器人的环境感知、推理决策和语言交互。
“机器人大模型的执行成功率是衡量机器人智能化程度的重要指标。”咨询公司弗若斯特沙利文大中华区执行总监崔楠告诉《财经》,要训练机器人大模型的执行成功率,需要机器人拥有自主可靠的决策能力、多模态感知能力以及实时精准的运控能力,这些能力离不开大量的数据采集、模型训练、仿真测试。只有这样,才能真正将大模型适配到人形机器人的“大脑”。
此前,人形机器人厂商更热衷于展示产品的运动控制能力,但 AI+的组合,让外界窥见了具身智能体的初级表现。 AI的视频显示,在 的视觉语言模型加持下,能和人类进行语言交互,并自主完成指令动作。整个过程中,的大模型负责视觉推理和语言理解,而 AI的神经网络处理快速灵巧的机器人动作。
实现与人类语言交互,来源:视频截图
据该公司AI团队负责人Corey Lynch的解释,研究人员将机器人摄像头拍摄的图像和机载麦克风接收的语音文本,输入到训练的、能理解图像和文本的多模态模型。由于具有短期记忆能力,机器人“大脑”内的模型会根据历史对话记录,以文字转语音的方式给予人类回应。
AI创始人兼CEO Brett 透露,现有交互能力的实现,用时仅13天。
在2023年3月领投的1X ,同样正在研发搭载了GPT大模型的双足人形机器人NEO,但上市日期暂不清楚。
大模型服务商与人形机器人厂商的合作,前者获得了布局大模型硬件端侧落地的场景,后者则获得先进的“大脑”技术支撑,加快商业化进程。语言交互能力表现,关乎人形机器人打开C端市场的潜力。
去汽车生产线“实习”
早在今年1月,同宝马就签署了一项合作协议,计划在宝马位于南卡罗来纳州的汽车制造车间部署人形机器人,不过未透露宝马将使用多少台机器人。
前述浙商证券研报指出,目前, 已经与一众股东和行业领军者签署系列协议,有望形成“模型训练-云端设施-车厂落地”商业闭环,并在行业加速扩散。
车厂落地的场景亦备受中国厂商看重。2月下旬,优必选公布了最新迭代的人形机器人 S在蔚来合肥第二先进制造基地总装车间“实习”的画面。视频展示了 S完成车门锁质检、安全带检测、车灯盖板质检、贴车标等任务的表现。
优必选公司向《财经》介绍, S身高1.7米,外观比例更接近人类,搭载了41个高性能伺服关节,以及多维力觉、多目立体视觉、全向听觉和惯性、测距等全方位的感知系统,拥有全面升级的视觉定位导航、手眼协调操作、步态控制、多模态路径规划垂域模型等技术,机器人的自主运动及决策能力大幅提高,可在工厂流水线实现精准安全同步的作业。