某个周末,我和朋友们在咖啡馆闲聊时,突然有人提起了最近发布的一种新型机器人。
有人说,这机器人不仅能走能跑,还能骑车跳舞,简直像是科幻电影里的场景。
大家听了都很惊讶,不约而同地打开手机搜索,果然,这款机器人的发布会成为了热门话题。
这时,一位朋友说:“这机器人竟然是由一个华为前天才少年发布的,真是不敢相信!
”于是,我们决定一探究竟。
彭志辉的机器人梦——灵犀X2的初次亮相原来,这个引起大家关注的机器人叫做灵犀X2,是由彭志辉发布的。
提起彭志辉,可能很多人并不熟悉,但他可是华为的前“天才少年”。
彭志辉在2022年底离开华为后,于2023年2月联合创立了智元机器人,并担任首席技术官。
他一直梦想着能造出一种像人类一样智能灵活的机器人,这款灵犀X2就是他梦想的结晶。
彭志辉说,灵犀X2重达33.8公斤,全身有28个自由度,没有使用任何一个并联结构。
换句话说,这款机器人具备了极高的灵活性和适应性,不仅可以灵活地行走,还能跑、旋转甚至跳舞。
而且,它还能通过学习和进化,逐步摆脱运动瓶颈,迈向一个更高的运动智能水平。
灵犀X2的多样技能:跑步、跳舞、骑车大家问我:“机器人会骑车、滑板,甚至能做举重大动作,这是怎么回事?
”其实,彭志辉早在2021年就开发了无人驾驶自行车,当时也引起了不少关注。
而这次的灵犀X2,不仅沿袭了无人驾驶技术,还进一步实现了机器人自行车驾驶。
它不仅会骑车,还会踩滑板、玩平衡车,这些在我们看来尚且不易掌握的技能,它都能做到。
灵犀X2搭载了基于Diffusion(扩散模型)的生成式动作引擎,这让它不仅“四肢发达”,还有了一颗“聪明大脑”。
通过边缘侧大脑和端到端的模型架构,还进行了大量的工程优化,灵犀X2拥有了毫秒级的交互反应能力。
彭志辉希望通过不断的技术迭代,赋予机器人更多的复杂作业能力,让它们更加接近人类的生活。
智能化发展的新趋势:大模型带来的突破在彭志辉的带领下,智元机器人开发出了一套通用具身基座大模型Genie Operator-1(GO-1)。
通过这个模型,机器人可以通过学习人类的视频,完成各种复杂的任务,比如递送水杯、制作餐点、迎接客人等。
GO-1相比已有的模型,成功率提高了32%,尤其在“倒水”“清理桌面”“补充饮料”等任务中表现特别突出。
为了增强策略的泛化能力,智元提出了Vision-Language-Latent-Action(ViLLA)架构。
这个架构可以利用Latent Actions(隐式动作)来建模,这样便能将外部动作知识迁移到通用操作任务中。
GO-1模型不仅能够快速适应新任务,还能部署在不同的机器人本体上,加速了具身智能的普及。
智元机器人的战略发布:GO-1的惊人表现过去一年里,智元机器人一直在积极推动技术的发展。
去年底,他们联合上海人工智能实验室等单位,宣布开源百万真机数据集项目AgiBot World,这涵盖超100种真实场景,共收录了80余种人类生活必备技能。
虽然带动作标签的真机数据量仍然有限,但基于ViLLA架构的优势,利用隐式变化可以帮助机器人更好地完成操作任务。
GO-1大模型借助人类和多种机器人的数据,能够迅速适应新的任务需求,进一步推动了具身智能的发展。
彭志辉表示,未来的机器人将不再仅仅是完成特定任务的工具,而是具备通用智能的自主体。
这为我们描绘了一幅未来科技生活的蓝图,让人充满期待。
通过这次探讨,我们不仅了解了灵犀X2机器人闪耀登场的背后故事,还感受到了彭志辉和他的团队在智能化道路上的不懈努力。
如果说之前的科技创新还停留在实验室和专业领域,那么随着灵犀X2和GO-1这样的技术成果落地,未来的智能机器人将逐渐走进我们每个人的生活。
我们不禁思考,未来的生活会是什么样子?
人工智能与我们的生活相连,将会带来哪些全新的变化?
这些问题也许暂时没有明确答案,但可以确定的是,科技的不断进步,正在创造一个更加智能和便利的未来。
朋友们的兴奋和讨论让我意识到,智能机器人的发展不仅仅是技术的进步,更是一种生活方式的变革。
或许若干年后,灵犀X2这样的智能机器人将像现在的智能手机一样普及,成为我们生活中不可或缺的一部分。
未来,真的值得期待。
的