天啊,人形机器人又双叒叕进化了

智能机器能不能 2024-02-27 08:33:24

机器之能报道

编辑:Sia

看起来莫拉维克的悖论可能是错误的?

才两个月时间,特斯拉 Optimus 又进化了。

最新视频里,Optimus 步速已达每秒 0.6 米,虽然只是健康成年人步速的一半,但和去年 12 月的视频相比,速度已经提升了 30% 以上。

视频链接:https://mp.weixin.qq.com/s/Ny0GATWx7cL9hNV1DqHhzA

Optimus 每天都在生产它的工厂里转悠,步伐更稳定,也显得更自信(转弯时也是如此)。另外,还增加了轻微的躯干和手臂摇摆。为此,团队不仅改进了模拟人类的前庭系统(一个维持人体平衡的重要感受器,位于我们内耳),还优化了足端轨迹和与地面接触的逻辑,升级了动作规划器并降低了从输入到输出所需的时间周期。

这是去年 5 月、 12 月到今年 2 月 Optimus 走路动作的对比视频,速度和姿态的进化肉眼可见。

视频链接:https://mp.weixin.qq.com/s/Ny0GATWx7cL9hNV1DqHhzA

Optimus 进化了,还是免不了网友一波恶搞,这转悠的步速是不是颇有拜登风范?

前不久,另一家颇受关注的人形机器人公司 1X 也发布了最新视频。过去一年里,他们构建了一个数据引擎,用于以完全端到端的方式解决通用的移动操作任务。最新视频展示了 EVE 在这一技术路径下掌握的新技能。这是从事物流场景下的例行工作,将货架上的包裹放到传送带上、选取物品放到盒子,自由行走、出入不同房间。

家庭场景的技能,收拾地面物品。

EVE 还能给自己充电,自己插入、拔掉插头。

每一个行为都是由一个 10Hz 频率的视觉神经网络控制,它主要控制机器人们的前进、手臂、躯干和头部。为了证明这个近三分钟的新视频没有猫腻(没有远程遥控、没有 CGI 特效、并非脚本重放),他们采用了一镜到底的拍摄方式。

一镜到底的完整视频

家庭和办公环境具有挑战性,因为它们是非结构化的且不断变化的。机器人不能对身体以外的世界做出太多假设,所以 1X 追求最通用的自主性方法。

他们在 30 台 EVE 中组装了一个高质量、多样化的演示数据集,利用这些数据训练一个“基础模型”,这个基础模型可以理解一系列人类活动和技能——从清洁到整理房屋、从捡起物体到与人类和其他机器人互动。

接下来,他们微调这个基础模型,以获取实现更加具体功能的模型。比如,一般门操作的模型和另一个用于仓库任务的模型,并进一步微调这些模型以解决特定任务,比如打开这扇特定的门。基于这一策略,EVE 掌握新技能仅需短短几分钟的数据收集和基于桌面 GPU 的训练。更重要的是,训练 EVE 不用写代码而仅需要数据。这意味着没有 AI 工程师的普通客户也能训练人形机器人新技能。

1X AI 团队负责人也点赞了特斯拉的最新进展。

据 1X CEO Bernt Bornich 透露,接下来四周 EVE 将持续进化,学会整理办公室并在 EVE、NEO 人形机器人生产线上从事物流相关工作。所有这些都会使用与视频中一样的数据收集和训练流程。

现在, EVE 已经部署到了一些大型企业中。人形机器人 Digit 正在亚马逊研发仓库接受测试,全球最大的纯合同物流供应商 GXO Logistics 也在测试 Digit,工作内容也差不多——与自主移动机器人 (AMR) 打配合,运输装送包裹和物品的周转箱。

英伟达、OpenAI 和贝索斯都有投资的人形机器人公司 Figure AI 已宣布与宝马合作,将机器人引入汽车制造领域,但至今尚未透露任何具体进展。在国内,优必选工业版人形机器人 Walker S 已经进入蔚来汽车第二先进制造基地总装车间,接受实地“培训”,在汽车工作流水线上与人类协作完成装配、质检作业。

视频链接:https://mp.weixin.qq.com/s/Ny0GATWx7cL9hNV1DqHhzA

工业版人形机器人 Walker S,身高 1.7 米,可替换末端执行器,搭载了 41 个高性能伺服关节以及多维力觉、多目立体视觉、全向听觉和惯性、测距等全方位的感知系统,拥有全面升级的视觉定位导航、手眼协调操作、步态控制、多模态路径规划垂域模型等技术,机器人的自主运动及决策能力大幅提高,可在工厂流水线实现精准安全同步的作业。

除了既有玩家,就在身家暴涨、突破 2 万亿美元当口,英伟达也宣布成立通用具身智能体研究实验室 GEAR( Generalist Embodied Agent Research ,意为“通用具身智能体研究”),入局具身 AI。

“我们相信,在未来,每一台移动的机器都将是自主的,机器人和模拟代理将像 iphone 一样无处不在。”英伟达 AI 科学家 Jim Fan 在 X 上表示,他同时也是该实验室的联合创始人,“我们正在打造基础智能体:一个具备通用能力的 AI,其能在虚拟与现实的多个世界中学习如何熟练行动。2024 年将是机器人之年、游戏 AI 之年、模拟之年。”

他还补充了一条 X 说:我们团队可能是全球最有钱的具身智能实验室。参考链接https://www.therobotreport.com/agility-robotics-jonathan-hurst-to-discuss-humnaoids-robotics-summit-keynote/https://twitter.com/home?lang=zhhttps://www.1x.tech/discover/all-neural-networks-all-autonomous-all-1x-speed

0 阅读:0

智能机器能不能

简介:感谢大家的关注