Dyna发布DYNA-1模型，实现机器人24小时叠700张餐巾，准确率达99.4%

编译 | 江宇

编辑 | 漠影

机器人前瞻4月30日消息，初创公司Dyna Robotics Inc.正式公布其自主研发的人工智能模型DYNA-1，专为驱动机器人而设计。

DYNA-1模型的发布，距离Dyna Robotics Inc.成立仅一个月。Dyna在创立时，即获得由CRV和First Round Capital领投的2350万美元种子轮融资。Dyna的首席执行官林登·高（Lindon Gao）曾创立零售科技公司Caper Inc.，该公司开发了商店无人结账系统，并于2021年被Instacart以3.5亿美元收购。

Dyna正在开发一套自动化系统，包含并排放置的两个机械臂，旨在为餐厅、杂货店等企业实现重复性任务的自动化。如今发布的DYNA-1模型正是为这些机械臂提供智能支持的核心技术。

为实现经济效益，机器人需长时间稳定执行相同任务。

Dyna指出，许多搭载现有AI模型的机器人，在数小时运行后易出现错误，需人工干预解决，这不仅增加维护成本，还会因机器人停机导致产量下降。

Dyna宣称，DYNA-1在长时间运行中的可靠性远超传统算法。在一项内部测试中，搭载DYNA-1的机械臂在24小时内折叠了超过700张餐巾，准确率高达99.4%，且无需任何人工干预。

Dyna在博客中表示：“餐巾折叠涉及一系列独特挑战，包括从一叠餐巾中精确抽取单张餐巾，以及在意外拉出多张餐巾时进行恢复的能力。”

DYNA-1的开发采用了行业标准的强化学习方法。在强化学习中，工程师为AI设定与实际应用相似的训练任务，每次任务完成后，模型会收到反馈以优化性能，通常通过一种称为“奖励模型”的算法生成。

“奖励模型”的核心在于评估AI完成任务的准确性，并据此提供反馈，进而提升模型表现。

为提升DYNA-1的性能，Dyna开发了一款定制化奖励模型。相较于现有算法，该模型在评估AI是否准确完成训练任务方面表现更优，从而提供更高质量的反馈，进一步增强DYNA-1的性能。

“奖励模型”进度估算

此外，DYNA-1展现了技能迁移能力。内部测试显示，其在餐巾折叠训练中获得的技能可部分应用于其他复杂操作任务，如衣物折叠和杯子填充。

搭载DYNA-1的机器人进行杯子填充任务

搭载DYNA-1的机器人还能在无需大量手动重新配置的情况下，适应新环境。

在训练过程中，DYNA-1在定制化“奖励模型”的指导下，执行大量任务，并学习不同动作的效果与结果。Dyna团队表示：“通过长时间的运行，DYNA-1积累了丰富的动作经验，能够理解每种动作可能带来的后果。这种经验使DYNA-1无需为特定客户环境进行额外的预训练，就能直接在实际场景中成功完成餐巾折叠任务。”

传统上，由AI驱动的机器人价格昂贵，通常高达数十万美元。Dyna计划，以远低于市场平均价格的策略销售其硬件。据《财富》杂志2025年3月报道，Dyna的目标是将机器人硬件价格显著降低到传统市场价格的一个数量级以下。

此次DYNA-1的发布标志着Dyna Robotics在机器人自动化领域的进展，其高可靠性、低成本的解决方案有望为餐饮和零售行业带来改变。

玩酷网

Dyna发布DYNA-1模型，实现机器人24小时叠700张餐巾，准确率达99.4%

智东西