还记得2016年,谷歌围棋AI——阿尔法狗吊打棋王李世石吗?现在AI瞄准赛车了。
前不久,索尼集团宣布已在旗下赛车游戏《GT SPORT》中开发出人工智能驾驶者,实现击败人类车手的成果,该研究已刊载于2月10日出版的《自然》杂志,作为封面研究发表。
索尼为这个AI起名为GT Sophy,“Sophy”在西方是个常见的人名,源自希腊语σοφα,意为“知识与智慧”。
GT Sophy由索尼AI部门、索尼互动娱乐SIE和PDI工作室(《GT SPORT》开发商)共同研发而来,其中AI部门提供深度学习算法、负责训练模型;PDI工作室的游戏作为AI训练和验证的环境;互动娱乐的云计算架构将千台PS4主机串联起来作为大规模训练架构和平台。三方合力用了近五年的时间为GT Sophy注入智慧。
一般来说,在赛车游戏中,AI都是有固定的走线风格,速度也不会太快,我们普通人只要勤加练习就能战胜最高难度的AI。但GT Sophy完全就是另一个世界的产物,它能够自我学习、自我进化,跑的越来越快,现在,它已经快到突破了顶尖车手的想象。
索尼人工智能研究人员和工程师开发了创新的强化学习技术,包括一种新的训练算法QR-SAC,给AI的各种高速驾驶决策做出规则和物理限制内的合理性后果分析。并用智能体可理解的赛车规则编码,以及获得一种促进细微赛车技能的训练方案。
在强化学习中,AI赛车手需要考虑其行为的长期后果,并能在学习过程中独立收集自己的数据,避免了对复杂的手工编码行为规则的需求。总之,GT Sophy对开车这件事和人类车手思考的方式是完全相同的,它们理解怎么在赛事规则下尽可能地开地更快。
在强化学习的帮助下,GT Sophy仅用了几小时的训练,就适应了赛道飙车。并且在一两天内做到了训练数据快过95%的车手。经过45000小时的总训练,GT Sophy就已经在游戏中战胜了顶级的人类车手。这里面包括2020年FIA GT 锦标赛冠军Takuma Miyazono、2018 年FIA GT锦标赛冠军Igor Fraga,2020年 FIA GT 锦标赛总决赛车手Emily Jones等等。
这次与人类车手的较量分为两次,在去年7月的第一场比赛中,GT Sophy首次对战人类车手便在计时赛中全方面吊打人类。最夸张的是在Dragon Trail Seaside赛道,GT Sophy的单圈时间比人类车手快0.5-1.5秒,这在一条5.2公里的赛道上是非常巨大的优势。
要知道,在F1赛事中,第一名和最后一名的飞驰圈成绩只差2-3秒,这种差距主要还是赛车性能差距带来的。而在游戏中,GT Sophy和赛车都是一样的,它的领先优势全是依赖于更强的驾驶技术。
不过,就像李世石曾赢下阿尔法狗一局一样,在第一场比赛中,GT Sophy在复杂的多人竞赛中有点毛脚,最终在团队积分上没能战胜人类车队。但在10月份的第二场比赛,GT Sophy的算法有了巨大的提升。在三条赛道的比拼中,GT Sophy一雪前耻,包揽了所有的冠亚军,赢得了车手和团队的双料冠军。
在两次比赛中,GT Sophy展现出了惊人的驾驶技巧,比如出人意料的高效走线、对赛道宽度的极致利用、速度极快又十分稳定的比赛节奏等等。从车载画面我们就可以看到,GT Sophy的转向非常流畅,几乎没有修正动作,而人类车手多多少少都会左右摇摆方向盘来寻找最佳角度。
人类赛车手都在用这种方式寻找弯道中车辆的极限,但每一次修正其实又都在损失时间。除了圈速更快,GT Sophy的驾驶风格还极富赛道礼仪,比如超车时给对手留足空间、不会冲动碰撞等等。
Takuma Miyazono在赛后表示:“我在GT Sophy上学到了很多,它使用了一些我不会想到的方式来跑得更快。”
更夸张的是,GT Sophy吊打人类车手还是在各种限制条件下完成的。索尼表示,GT Sophy可以精确地记住赛道地图,快速做出反应。
比如,它能够在23-30毫秒内对比赛环境中的事件做出反应,这比专业运动员估计的最高反应时间200-250毫秒要快得多。为了让比赛更加公平,研究人员增加了人为延迟,训练GT Sophy的反应时间提高到了100毫秒、200毫秒和250毫秒。换言之,如果不加以限制,GT Sophy会对人类车手形成更强的压制。
GT Sophy超越人类车手
虽然这次比赛是在游戏中进行的,但对赛车运动来说却是一件大事。了解赛车游戏的读者应该知道,《GT SPORT》是一款偏向拟真的赛车游戏,在轮胎、悬挂、动力系统、赛道抓地力变化、空气动力学等各个维度都十分接近现实,玩家在《GT SPORT》中学习到的驾驶技巧完全可以应用在现实赛车上。
基于此,索尼和SIE在很早之前就开始举办职业比赛来挑选优秀的电竞车手,输送到现实赛事中。而在现在,很多俱乐部和车队会使用模拟赛车游戏训练车手,甚至会从专业的赛车电竞比赛中选拔车手。
这种虚拟与现实的高度互通,意味着赛车AI同样可以应用在现实赛车中,它们更稳定、更快的圈速和成绩,对车队来说是天大的好事,AI车手既能省下巨额的车手工资,还能取得出色的成绩,比生产队的驴还能干。不过,对赛车运动来说,让AI跑赛车恐怕并是一件好事。
赛车的魅力不止是车手挑战车辆的极限,还有一些赛事中的戏剧性因素。很多车迷都有自己喜欢的车手,有人崇拜智商超群、攻防强大的阿隆索,有人喜欢激进冲动、为了胜利不顾一切的维斯塔潘。我们常常惊叹于红牛车队惊人的战术策略,也总是嘲笑法拉利愚蠢的失误。这些车手、车队的变量才是赛车运动最大的精彩。
CHINA GT冠军车手郑晚成表示:“赛车考验的是驾驶的精准度、响应速度和策略的计算,这些方面AI肯定是完胜人类,赛道上人类永远赢不了AI。但AI没有性格,AI不会犯错,AI毫无感情,它们追求的只有高效的驾驶,看AI的比赛,可能起跑顺序就是最终比赛的成绩了,没有什么悬念和观赏性,人类之间的比赛才有意思。”
那么,赛车AI有什么用的呢?索尼AI CEO Hiroaki Kitano也表示“人工智能不会取代人类,我们要创造出能够释放人类创造力和想象力的人工智能。” 赛车AI还能在很多领域发光发热。
首先是自动驾驶,虽然赛道环境和公路环境完全不同,但让AI学习到极限驾驶的技巧,在公路自动驾驶遇到紧急情况(比如雨雪天打滑)时,它就可以拥有更强的救车能力。而且这种面对动态、复杂环境的快速反应能力,是普通自动驾驶算法在公路上很难遇到、学习到的。
还有就是利用AI训练车手,人类车手可以向AI学习更极致的驾驶技巧,提高赛道上的成绩。索尼也表示,GT Sophy会部署到下一代《GT赛车》游戏中。