“我认为时间还很早,但目前所有的投资人都已经内卷起来了。”
在谈及具身智能的投资时,英诺天使基金管理合伙人王晟说到WAIC具身通用人工智能论坛上的一个细节,“那场每一个茶歇,一个嘉宾周围都围着十几二十个投资人在那扫码约时间。”
ChatGPT等生成式人工智能与人形机器人行业结合,开启了具身智能(Embodied Intelligence)的时代。近一年来,包括马斯克、黄仁勋这样的科技圈名人都在押注具身智能,认为其是下一个AI浪潮,OpenAI也在今年投资了一家人形机器人初创企业,“大佬们都在讲具身,所有的投资人都觉得,已经没投到大模型,不能再没投到具身了。”王晟说。
清华大学交叉信息研究院助理教授陈建宇一直在研究人形机器人领域,他对第一财经表示,以ChatGPT为代表的AGI造成了非常轰动的影响,但ChatGPT只是一个“缸中大脑”,缺乏在物理世界中行动的能力,人形机器人就成了最佳的具身本体。
“未来,人形机器人结合AGI的具身智能,有可能为我们带来下一个iPhone时刻。”陈建宇说。
风已经起来了
陈建宇也是具身通用人工智能论坛的主持人,谈到现场反馈他表示,确实观众非常热情,“一开始会场最多只能容纳300人,但报名就达到了七八百人,最后基本座无虚席,后排也站了非常多人。”大会间隙和他建立联系的人也不少。
在前一天的人形机器人高峰论坛,热度丝毫不输这场,论坛两侧与后方都挤满了观众,甚至有报道称“投资人站在会场门口4个小时听完了全程”。
实际上,人形机器人领域已经发展了很长一段时间,陈建宇较早开始接触了这一领域。作为92年的科研新星,陈建宇本科就读于清华大学,后直博美国加州大学伯克利分校,师从Tomizuka教授,研究领域包括强化学习、控制、深度学习、自动驾驶和机器人技术。在2021年,不到30岁的他成为清华大学交叉信息研究院助理教授、博导。
在陈建宇看来,自己最开始研究的时候,关注这个领域的人并不多。机器人一直以来只有较为底层的智能,主要是物理上的操作能力,但缺乏通用的智能,即高层的、抽象一点的复杂规划决策能力、自然语言的语音交互能力等。
直到大模型的出现,给机器人带来了曙光。
优必选首席技术官熊友军认为,接入大模型之后,一方面,人形机器人可以更加聪明,客观提升人形机器人的应用场景和应用范围,加速机器人的产业化落地;另一方面,人形机器人和ChatGPT结合,可以大幅度拓展ChatGPT的应用空间。
“我梦想中的机器人一定是仿生机器人,接入大模型做很多训练,可以根据实际情况去生成控制策略甚至是代码,这是未来的一个方向。”熊友军称。
陈建宇能够感受到的是,去年特斯拉人形机器人Optimus推出,“突然一下就多了一些(热度)”,每次马斯克发一些进展视频,又会带起来一些讨论。
就在2022年9月,特斯拉人形机器人Optimus(也称“擎天柱”)正式亮相,在前不久的WAIC上也进行了展出,虽然来到现场的只是一个静止的模型、不能行走,但现场观众非常热情,如果想要近距离看一眼,还需穿过层层人群。
特斯拉的Optimus人形机器人身高172cm,体重56.6kg,是一个正常成年人的身形。据现场工作人员介绍,机器人全身拥有28个自由度,就如同人体的关节。手部有11个自由度,可以更加灵活地抓握,且力大无比,能够单手举起一台钢琴。目前,这款人形机器人可以完成行走、上下楼梯、下蹲、拿取物品等动作,也已经具备了保护自身和周围人安全的能力,未来还可以做饭、修剪草坪、帮助照看老人,或是在工厂替代人类从事枯燥和有危险的工作。
除了特斯拉外,不少前沿科技公司都在押注这一领域。今年3月,OpenAI领投了挪威一家人形机器人公司1X Technologies,引发外界对大模型与机器人结合的无限遐想。5月,英伟达创始人黄仁勋在演讲中提到,下一波人工智能浪潮将是一种被称为具身AI的新型人工智能。
国内科技公司亦动作频频,今年4月小米成立机器人技术公司,在此之前,小米于2022年8月发布了一款名为CyberOne的机器人产品。此外,腾讯投资的机器人公司优必选在今年1月正式递交招股书,有望成为“机器人第一股”。
在WAIC开幕式的视频致辞中马斯克称,未来机器人的数量可能将在某个时刻超过人类数量,大大提高全球的生产效率,这一趋势已经十分明显。
拐点未到
业界此次的热情主要是看到了AGI给人形机器人领域带来的可能性,有望弥补高层智能的缺陷。陈建宇认为,人形机器人行业本身的技术突破还没有到,包括技术难度大,制造成本高昂以及商业化难度高仍是三座大山。
机器人双足行走一直以来都是一个技术难点,两条腿如何平衡、去支撑这么大和重的一个身体,且和其他硬件结合控制,存在不少的难题。此外,人形机器人还有多指的灵巧手,需要控制的点就更多了。
陈建宇认为,波士顿动力是目前在行业做得较为出色、有普遍认可度的机器人公司。不过,波士顿动力在2021年卖身韩国现代汽车公司,在更早前,它属于日本软银旗下,还是从谷歌收购而来。作为业界最强技术,三次“卖身”的经历,某种程度上也反映了人形机器人还未找到实现商业价值的落脚点。
“美国波士顿动力基于40年的控制经验,针对双足机器人的控制方法更换了4代,但在2022年的视频中依旧呈现出稳定性差、技术成熟度低的问题。”中兵智能创新研究院董事长刘勇提到,人形机器人经过这么长时间也未达到市场化和可用,主要存在软件技术的鲁棒性差,和硬件超配带来的易损坏和高成本问题。
不过,刘勇表示,人工智能赋能人形机器人,再通过大数据的训练、模型的驱动,可以降低人形机器人关键零部件的需求和要求。
在熊友军看来,人形机器人的量产将会分三步走:第一步是在结构化、可控环境中的小批量试用和进化,完成一些简单任务;第二步是在非结构化、可控环境中训练和进化,进一步提升运动、感知和决策能力;待与之适配的人工智能技术逐步成熟、制造工艺趋于稳定、成本也大幅降低后,人形机器人大规模量产就水到渠成了。
熊友军认为,理想中的人形机器人一定是仿生设计的人形机器人。人的肌肉看起来这么小小一块,在能量的存储和释放上却是收放自如,在需要的时候可以展现极高的爆发力,但是现在人形机器人的技术暂时还做不到,但随着技术的不断迭代,驱动方式还有很大的想象空间。
作为投资人,王晟表示,自己团队明确将具身智能作为投资方向有挺长一段时间,但至今还未下手,他认为“时间还早”,“很多人类先验积累的知识和行动,机器是无法理解的,更难决策,过去最简单的控制论达到效果是很差的,现在大家用强化学习来训练,而这研究刚刚开始。”
不过,奥比中光董事长兼CEO黄源浩认为,人形机器人这个形态可能是最通用的机器人形态,未来机器人的数量可能有100-200亿,其中人形机器人数量或达70亿,这个市场潜力仍然巨大。“大概率猜测在5到10年以后,人形机器人在整个国家的数量会成为类似GDP指标一样的国家战略指标。”
就在6月底,北京印发《北京市机器人产业创新发展行动方案(2023—2025年)》,提出着眼世界前沿技术和未来战略需求,加快布局人形机器人。
为什么需要做人形机器人?中国科学院院士乔红认为,如果不做,会冲击我国在工业机器人领域积累的成本优势,其次,在国防领域,人形机器人属于新装备,非常重要。此外,人形机器人涉及到产业链上下游很多领域,会影响到我国在这一赛道软硬件能力的提升。
在达闼科技创始人兼CEO黄晓庆看来,未来,世界上每个人都会拥有一个机器人,就像手机一样,“现在相当于20世纪90年代初,没多少人有手机,但30年之后每个人都有。”