天气与气候预测不仅是国际科学前沿问题,也具有巨大的经济与社会价值。目前的数值天气气候预测通过求解描述大气运动的非线性偏微分方程组来推断未来大气状态;针对未来几天的预报往往需要花费超级计算机的数百个核时。世界气象组织将数值天气预报评价为20世纪最重要的科学、技术和社会进步之一。然而,使用传统方法进一步提升预测水平遇到了瓶颈。
近年来,伴随高质量气象资料的不断累积,人工智能(artificial intelligence,AI)技术,特别是深度学习方法,逐渐被用于建模多种多样的地球系统过程,几乎覆盖了所有时空尺度的天气/气候事件。与传统方法相比,AI气象模型直接从海量数据中学习潜在物理规律,而不依赖偏微分方程组。经国内外多个业务预报部门和研究机构的实时预报持续评估发现,这类数据驱动的模型技巧较传统动力数值模式有一定程度的提升,表现为更低的预报误差及更长的预报时效。在此背景下,复旦大学大气与海洋科学系穆穆院士团队呼吁,应充分发挥AI模型的优势,深入开展AI气象大模型的可预报性研究。
天气与气候事件的可预报性研究聚焦于厘清产生预报不确定性的原因和机制,在此基础上,给出减小预报不确定性的方法和途径。Lorenz将动力模式的可预报性研究分为两类:第一类——考量由初始场误差引起的预报误差,第二类——考量由模式误差引起的预报误差。研究人员使用动力数值模式对各种天气气候现象开展了其两类可预报性问题研究,并已取得了大量有价值的成果,为天气气候的预测提供了不可或缺的理论指导与技术支撑。
目前开展AI模型可预报性研究的主要障碍是AI模型的结果缺乏物理可解释性,主要体现在两方面:其一是现有AI模型的时空分辨率过粗,无法刻画大气状态演化的中间过程;其二是目前针对AI模型的性能评估大多只关注最终预报结果,较少关注中间过程是否与观测一致。因此,在开展基于AI模型的可预报性问题研究时,应首先关注AI模型对所研究现象的过程的模拟能力,至少应与数值模式保持一致。若一个AI模型能够模拟出和观测非常相近的结果,则可认为该AI模型以数据驱动的方式给出了(更确切说,以极小的差距拟合了)动力偏微分方程组的数值解,此时的AI模型具有了一定的物理可解释性。
为了实现AI模型具有与数值模式相当的模拟能力,对于气候尺度现象,AI模型一次迭代的时间步长应达到小时级,而对应于天气尺度现象,时间步长应该达到分钟乃至秒级。应该承认,实现上述目的从目前的技术条件来讲是有一定难度的。对于现阶段来说,用于不同天气气候事件可预报性研究的AI模型时空分辨率的选择可以稍微弹性一些,以充分发挥AI模型的长处。此外,借助于AI模型的高运行效率、低时间/资源开销以及自带优化模块的优势,有望开展以往在数值模式中难以进行的可预报性问题研究。
几十年来,动力数值模式在大气海洋科学的研究中扮演着极其重要的角色,数值模拟成为了理论研究与观测试验之外的第三种研究范式,如图所示。开展动力数值模式的可预报性问题研究可指导观测系统的设计以获得更高质量的数据,进而提升对天气气候事件的认知;也可以追踪初始误差的演化,挖掘潜在物理机制。然而对于AI模型来说,目前除了利用现有的累积资料训练AI模型外,AI模型并没有对观测系统的构建与天气气候现象的认知提供正向的反馈,如图中的红色虚线所示。因此作者呼吁将基于AI模型的可预报性问题研究提上日程,驱动“big data”向“big and better data”的转型。在此基础上,进一步开展不同AI建模方案对预报和模拟影响的研究,挖掘AI模型捕获的物理机制,真正做到“AI for science”。为了这一目标,我们不仅需要Deep learning,也需要Deep thinking以及Deep collaborating。
大气海洋科学中的认知-观测-模拟研究范式。动力数值模型几乎参与了所有相关研究(如所有箭头所示),而AI模型目前仅涉及使用观测(或再分析)数据进行训练,未来应围绕AI模型大力开展其他相关的工作。
“The Predictability Study of Weather and Climate Events Related to Artificial Intelligence Models ”一文作为封面文章发表于《大气科学进展(英)》(Adv. Atmos. Sci.)2025年第一期