索尼AI暴虐人类冠军车手，未来的赛车运动要被机器统治了？

还记得2016年，谷歌围棋AI——阿尔法狗吊打棋王李世石吗？现在AI瞄准赛车了。

前不久，索尼集团宣布已在旗下赛车游戏《GT SPORT》中开发出人工智能驾驶者，实现击败人类车手的成果，该研究已刊载于2月10日出版的《自然》杂志，作为封面研究发表。

索尼为这个AI起名为GT Sophy，“Sophy”在西方是个常见的人名，源自希腊语σοφα，意为“知识与智慧”。

GT Sophy由索尼AI部门、索尼互动娱乐SIE和PDI工作室（《GT SPORT》开发商）共同研发而来，其中AI部门提供深度学习算法、负责训练模型；PDI工作室的游戏作为AI训练和验证的环境；互动娱乐的云计算架构将千台PS4主机串联起来作为大规模训练架构和平台。三方合力用了近五年的时间为GT Sophy注入智慧。

一般来说，在赛车游戏中，AI都是有固定的走线风格，速度也不会太快，我们普通人只要勤加练习就能战胜最高难度的AI。但GT Sophy完全就是另一个世界的产物，它能够自我学习、自我进化，跑的越来越快，现在，它已经快到突破了顶尖车手的想象。

索尼人工智能研究人员和工程师开发了创新的强化学习技术，包括一种新的训练算法QR-SAC，给AI的各种高速驾驶决策做出规则和物理限制内的合理性后果分析。并用智能体可理解的赛车规则编码，以及获得一种促进细微赛车技能的训练方案。

在强化学习中，AI赛车手需要考虑其行为的长期后果，并能在学习过程中独立收集自己的数据，避免了对复杂的手工编码行为规则的需求。总之，GT Sophy对开车这件事和人类车手思考的方式是完全相同的，它们理解怎么在赛事规则下尽可能地开地更快。

在强化学习的帮助下，GT Sophy仅用了几小时的训练，就适应了赛道飙车。并且在一两天内做到了训练数据快过95%的车手。经过45000小时的总训练，GT Sophy就已经在游戏中战胜了顶级的人类车手。这里面包括2020年FIA GT 锦标赛冠军Takuma Miyazono、2018 年FIA GT锦标赛冠军Igor Fraga,2020年 FIA GT 锦标赛总决赛车手Emily Jones等等。

这次与人类车手的较量分为两次，在去年7月的第一场比赛中，GT Sophy首次对战人类车手便在计时赛中全方面吊打人类。最夸张的是在Dragon Trail Seaside赛道，GT Sophy的单圈时间比人类车手快0.5-1.5秒，这在一条5.2公里的赛道上是非常巨大的优势。

要知道，在F1赛事中，第一名和最后一名的飞驰圈成绩只差2-3秒，这种差距主要还是赛车性能差距带来的。而在游戏中，GT Sophy和赛车都是一样的，它的领先优势全是依赖于更强的驾驶技术。

不过，就像李世石曾赢下阿尔法狗一局一样，在第一场比赛中，GT Sophy在复杂的多人竞赛中有点毛脚，最终在团队积分上没能战胜人类车队。但在10月份的第二场比赛，GT Sophy的算法有了巨大的提升。在三条赛道的比拼中，GT Sophy一雪前耻，包揽了所有的冠亚军，赢得了车手和团队的双料冠军。

在两次比赛中，GT Sophy展现出了惊人的驾驶技巧，比如出人意料的高效走线、对赛道宽度的极致利用、速度极快又十分稳定的比赛节奏等等。从车载画面我们就可以看到，GT Sophy的转向非常流畅，几乎没有修正动作，而人类车手多多少少都会左右摇摆方向盘来寻找最佳角度。

人类赛车手都在用这种方式寻找弯道中车辆的极限，但每一次修正其实又都在损失时间。除了圈速更快，GT Sophy的驾驶风格还极富赛道礼仪，比如超车时给对手留足空间、不会冲动碰撞等等。

Takuma Miyazono在赛后表示：“我在GT Sophy上学到了很多，它使用了一些我不会想到的方式来跑得更快。”

更夸张的是，GT Sophy吊打人类车手还是在各种限制条件下完成的。索尼表示，GT Sophy可以精确地记住赛道地图，快速做出反应。

比如，它能够在23-30毫秒内对比赛环境中的事件做出反应，这比专业运动员估计的最高反应时间200-250毫秒要快得多。为了让比赛更加公平，研究人员增加了人为延迟，训练GT Sophy的反应时间提高到了100毫秒、200毫秒和250毫秒。换言之，如果不加以限制，GT Sophy会对人类车手形成更强的压制。

GT Sophy超越人类车手

虽然这次比赛是在游戏中进行的，但对赛车运动来说却是一件大事。了解赛车游戏的读者应该知道，《GT SPORT》是一款偏向拟真的赛车游戏，在轮胎、悬挂、动力系统、赛道抓地力变化、空气动力学等各个维度都十分接近现实，玩家在《GT SPORT》中学习到的驾驶技巧完全可以应用在现实赛车上。

基于此，索尼和SIE在很早之前就开始举办职业比赛来挑选优秀的电竞车手，输送到现实赛事中。而在现在，很多俱乐部和车队会使用模拟赛车游戏训练车手，甚至会从专业的赛车电竞比赛中选拔车手。

这种虚拟与现实的高度互通，意味着赛车AI同样可以应用在现实赛车中，它们更稳定、更快的圈速和成绩，对车队来说是天大的好事，AI车手既能省下巨额的车手工资，还能取得出色的成绩，比生产队的驴还能干。不过，对赛车运动来说，让AI跑赛车恐怕并是一件好事。

赛车的魅力不止是车手挑战车辆的极限，还有一些赛事中的戏剧性因素。很多车迷都有自己喜欢的车手，有人崇拜智商超群、攻防强大的阿隆索，有人喜欢激进冲动、为了胜利不顾一切的维斯塔潘。我们常常惊叹于红牛车队惊人的战术策略，也总是嘲笑法拉利愚蠢的失误。这些车手、车队的变量才是赛车运动最大的精彩。

CHINA GT冠军车手郑晚成表示：“赛车考验的是驾驶的精准度、响应速度和策略的计算，这些方面AI肯定是完胜人类，赛道上人类永远赢不了AI。但AI没有性格，AI不会犯错，AI毫无感情，它们追求的只有高效的驾驶，看AI的比赛，可能起跑顺序就是最终比赛的成绩了，没有什么悬念和观赏性，人类之间的比赛才有意思。”

那么，赛车AI有什么用的呢？索尼AI CEO Hiroaki Kitano也表示“人工智能不会取代人类，我们要创造出能够释放人类创造力和想象力的人工智能。” 赛车AI还能在很多领域发光发热。

首先是自动驾驶，虽然赛道环境和公路环境完全不同，但让AI学习到极限驾驶的技巧，在公路自动驾驶遇到紧急情况（比如雨雪天打滑）时，它就可以拥有更强的救车能力。而且这种面对动态、复杂环境的快速反应能力，是普通自动驾驶算法在公路上很难遇到、学习到的。

还有就是利用AI训练车手，人类车手可以向AI学习更极致的驾驶技巧，提高赛道上的成绩。索尼也表示，GT Sophy会部署到下一代《GT赛车》游戏中。

玩酷网

索尼AI暴虐人类冠军车手，未来的赛车运动要被机器统治了？

热门分类