在当今混乱的世界里,专业情报分析师必须应对几乎无穷无尽的数据流,这可能会让他们不堪重负,同时也加剧了认知偏见的影响。人工智能是解决方案,还是会带来更多风险(由于目前困扰人工智能的缺陷)?事实上,人工智能既不是万灵药,也不是危险。与其他新兴技术一样,人工智能并不是一种即时的“开箱即用”解决方案,而是一种持续发展的能力。今天,人工智能可以通过解决特定的挑战来增强人类的能力并增强分析过程。然而,人工智能并非没有问题。这意味着它的价值在于作为人类情报分析人员的专业知识和判断的补充能力。在大规模采用人工智能来支持情报分析之前,有必要了解分析师面临的具体问题:处理大量数据;从非传统来源获取数据;也许最令人烦恼的是,认知偏见会影响情报评估的客观性。人工智能可以在缓解这些挑战方面发挥重要作用,但前提是人类必须参与其中。
数据过载,完整性和偏见
将小麦从谷壳中分离出来,或从每天收集的大量信息中进行分类,是当今困扰美国情报界的一个主要问题。尽管在自动化收集手段和相应的基础设施上进行了投资,以存储、组织和构建大量数据,提供给情报分析人员检索和检查。尽管这一令人印象深刻的过程可能消耗了美国情报界预算的很大一部分,但信息仍然挂一漏万或未经人类分析。一个简单的论点是,数据过多比数据不足更可取。然而,情报方面的失误,比如2003年对伊拉克大规模杀伤性武器的错误识别,以色列情报部门未能辨别出1973年埃及和叙利亚领导的阿拉伯联合军队即将入侵的原因(导致了赎罪日战争),以及2023年10月7日哈马斯对以色列的突然入侵和袭击,这些都表明,情报过剩可能不利于至关重要的情报分析过程。特别是如果分析人员无法对现有信息进行分类和筛选,以确定对手意图的关键指标。处理越来越多的信息需要情报分析人员对不同的数据点进行梳理、识别并综合成一个判断——如果做得好,可以减少不确定性。然而,认知偏差加上数据过多或数据质量差的问题困扰着这一过程,导致不精确的评估,可能导致政策和决策失败,增加军事行动的风险,以及其他不利和连锁后果。考虑到情报分析的挑战性,人工智能能否帮助避免这些后果,并为决策者提供关键、客观和准确的信息?如果人工智能的前景是正确的,那么基于大型语言模型的ChatGPT等生成式人工智能技术可以提高分析过程的效率。例如,生成式AI可以总结冗长的文本(如国外灰色文献,即由传统商业或学术出版和分发渠道之外的组织所产生的资料和研究报告)、翻译外语、进行开源情感分析、以及执行各种其他功能。此外,生成式人工智能也可以在情报评估过程中提供帮助,但这些并没有减轻人类情报分析师的关键作用。不过,生成式人工智能可以作为分析过程的辅助工具,帮助识别分析缺陷或不一致之处。虽然这些都是很有前途的功能,而且有理由认为情报机构已经将这些技术纳入了他们的日常流程,但生成式人工智能并非没有缺点。首先,生成式人工智能对缓解长期存在的分析偏见问题几乎没有帮助。基于大型语言模型构建的生成式人工智能技术依赖于预先存在的数据集,这些数据集本质上是非结构化的,并且可能存在缺陷。与此相关的是,今天的生成式人工智能模型容易出错,并可能提供虚假或不准确的内容。这些“幻觉”与生成式人工智能模型的发展有关。尽管使用大量数据进行训练,但如果生成式人工智能系统遇到不熟悉的单词、短语或主题,或者如果数据不足,它将根据对语言的理解做出推断,并给出系统认为合乎逻辑但可能是错误的答案。其次,确定对手的能力和意图所需的信息不再仅仅是政府的职权范围。非政府组织、私人实体、社交媒体公司和其他机构已经成为重要的数据经纪人,拥有了解战略环境和构建准确情报评估所需的信息。在情报分析中使用生成式人工智能需要解决数据访问、质量和偏见等相关的潜在问题。
关于思考的思考:心态的邪恶本质
认为人类完全控制自己的思维过程是一种谬论。人类的思维表现出本能和无意识的倾向来处理新信息。例如,人类表现出一种寻找模式的倾向,比如因果关系,这有助于分析未知事物或遇到新的问题集。此外,作为生存本能的组成部分,个体潜意识地形成影响人类判断和决策的心智模型或认知和感知偏见。心理模型是人类潜意识的组成部分,它通过我们在没有意识控制的情况下执行的心理捷径指导我们的日常行为。就情报分析而言,心理模型是一种范式,它指导分析人员对对手将如何行动或情况将如何发展的思考过程。与心理模型相关的优势取决于上下文(语境)和环境。尽管如此,心智模型可以促进批判性思维,帮助决策,并将不同的观点纳入分析或决策过程。理想情况下,多种心智模型的结合可以产生更积极的情报分析结果。相反,在一个主题上的丰富经验或知识可能被证明是有害的,因为心理模型可能会促使个人拒绝新的和矛盾的信息,或者错误地处理它。也许心理模型最令人担忧的方面是抗拒变化的倾向。一旦分析师制定了评估,特别是如果评估经过了审查和批准,分析师的心智模型可能会阻止他们接受新的和实质性的信息,这些信息会改变他们评估的特征。心理模式加剧分析偏差的一个鲜明例子是,以色列情报机构未能正确识别导致1973年赎罪日战争(Yom Kippur War)的阿拉伯国家的意图。在1967年六日战争取得成功之后,以色列在组织上和制度上都坚信以色列情报部门所说的“概念”。这一概念为以色列情报部门和政策制定者提供了分析框架,塑造了他们对阿拉伯国家活动的看法,他们认为,鉴于以色列在1967年战争中取得了压倒性的成功,埃及和叙利亚在没有对方配合的情况下不会发动攻击,阿拉伯军队在没有可能威胁以色列机场和平民的地对地弹道导弹的情况下不会发动攻击。联合起来的阿拉伯军队不会进攻,除非他们能够通过提供苏联防空能力来对抗以色列的空中优势。以色列情报分析人员表现出一种倾向,只审查与概念有关的情报,企图根据战略计算而不是战术现实来推断阿拉伯人的意图,助长了不精确的评估,导致未能预警阿拉伯联合部队的突然袭击。
人工智能助力?
情报机构是以信息为中心的组织,这意味着该组织的基础依赖于持续不断的数据流入。分析师随后将这些“原始”数据转换为连贯的信息,以供客户演示或交付。很少,如果有的话,关于一个问题的全部事实会显示出一个几乎确定的结论。相反,情报机构是通过对不确定的事实(依赖通过情报收集行动)的评估、以及从分析人员的知识及专业经验和培训中得出的假设,力求评估的准确性。尽管他们对这个问题的历史方面有着深刻的理解,(更重要的是)他们也拥有情报技术,但心智模型的不利影响始终笼罩着情报评估。考虑到心智模型潜在的无意识和非自愿影响,生成人工智能能否穿透人类认知的固有偏见,提供公正和客观的评估?为了解决这个问题,首先有必要了解生成式人工智能如何使情报分析过程成为可能。也许生成式人工智能对情报分析的主要贡献功能是能够将复杂性提炼为分析师更易于管理的核心组件。具体来说,人工智能可以处理来自多个不同来源的大量结构化和非结构化数据,并确定数据中的联系,而这些联系对于人类分析师来说并不明显。此外,假设生成式人工智能的大型语言模型具备能力,它可以融合来自多种情报渠道(如信号情报、人力情报、地理空间情报等)的信息,以更快的速度更清晰地描述问题。可支持行动的情报的价值很高,特别是在时间敏感的场景中,因此,人工智能在识别模式和相关性方面的处理速度要快得多,这对分析师来说非常有价值。作为附带的好处,支持行动的情报相关的交付及时性可以加强情报机构与其客户之间的关系。人类与生成式人工智能系统交互的能力——即使提示包含令人困惑的语法、拼写错误和缺乏标点符号——并得到有用的回应,这是自然语言处理的一个例证。自然语言处理促进了人类与人工智能之间的交互,使系统能够处理和理解人类的文本和语音。目前世界上大约有7164种语言。此外,每天产生的数据量可能在3 - 4亿Tb之间。从情报的角度来看,分析哪怕只是这些数据的一小部分,尤其是当来源是外语时,都是一项困难且耗时的任务。自然语言处理减轻了翻译负担,并有助于从文章、书籍和其他文档等文本数据中提取相关信息。也许更重要的是,随着这项技术的成熟,招聘、培训和保留语言专家的需求将会减少。
一切都与数据有关
数据分析和自然语言处理只是生成式人工智能在情报工作中的应用的一个例子。事实上,人工智能的前景可以在情报分析领域产生多种好处,而不仅仅是这两种功能。然而,人工智能并非没有问题。至关重要的是要强调,生成式人工智能的核心功能来自用于训练模型的数据。如果数据集包含偏见,模型将继续传播甚至放大这些偏见。因此,我们回到了负面心理模型影响分析的长期问题,因为这些分析结果可能会成为生成式人工智能系统学习的数据。利用预先存在的情报数据集的主要后果是现有情报分析产品中包含的未知偏见成分。这些数据集的注入可能会继续传播有偏差的分析,形成一个循环过程,以指数方式增加不精确和可能可疑的情报产品汇编。生成式人工智能系统可能会提供由不完整或不准确的数据形成的误导性输出或幻觉,这是当今人工智能技术的一个普遍问题和固有限制。生成式人工智能系统根据训练数据中的可观察模式组合评估下一个单词、短语、图像或其他输出。在缺乏数据或存在无关数据的情况下,生成式人工智能将推断出最可能的内容序列,其中可能包含虚假陈述或简单的虚构信息。因此,在这项技术成熟之前,人类的知识、经验、专业知识和直觉将继续是情报技术的重要组成部分。因此,高质量的数据对于使用生成式人工智能进行情报分析至关重要。也许获取数据同样重要。数据当然是一种商品:一种用于购买、销售或收集的有利可图的产品。尽管情报机构在获取高度机密材料的复杂情报收集能力上可能花费了不成比例的资金,但随着公开信息或开源信息的激增,政府不再垄断数据。事实证明,私营部门的数据与通过高技术手段收集的数据一样有价值,甚至更有价值。因此,情报机构应该努力获取这些数据。然而,当政府试图从私营部门获取数据时,会出现一些挑战,包括信任问题、权属问题和兼容性问题。一般来说,私营部门收集个人数据是为了通过为客户提供个性化的产品和服务来改进公司的产品和服务,了解消费者行为,并提高客户保留率。我们都可能经历过基于我们的浏览历史、过去的购买和人口统计数据的定向营销活动。此外,多媒体流媒体公司通常通过播放列表或推荐接下来要听或看的内容来提供定制体验。最终,以消费者为基础的公司分析数据,通过满足他们的需求来发展和维护客户关系。虽然这些数据中的大部分看起来微不足道,但如果该公司自由地与政府分享数据,可能会损害消费者的信任,并产生公众对该公司的负面看法。此外,关于分享个人数据,特别是关于个人是否同意(或不同意)与政府实体分享他们的数据,还存在道德问题。除了以消费者为基础的公司之外,还有一个庞大的行业,即收集和销售个人和企业的数据的行业。数据代理从各种公共和私人来源收集数据,然后将其出售,用于市场营销、风险分析和商业智能等目的。此外,智库、非政府组织、教育机构和其他各种开展数据收集和分析活动的机构也产生了大量公开可用的数据。然而,与政府实体共享这些数据可能会出现问题。私人组织可能认为他们的数据是专有的,因为它提供了竞争的市场优势,因此,共享可能会影响他们的市场地位。此外,私有实体根据其用途构建特定的数据,因此,兼容性问题(如数据模式变化、数据完整性和数据安全性)可能需要昂贵的集成解决方案。总的来说,这些数据的汇聚有可能增加情报数据的全面性,并为复杂的情报问题提供丰富的见解。很难反对加入额外的数据,因为这将加强情报分析过程。但情报机构如何获取和利用这些信息的问题仍然存在。信任、专有数据和兼容性等问题无疑会加剧此类信息的获取。不过,事实证明,将额外的数据集(尤其是那些由生成式人工智能支持的数据集)纳入情报数据库,将增强分析过程,是值得的。在这样做的过程中,情报机构应该谨慎行事,避免继承原始数据中的偏见。
结论
情报问题通常不是信息收集不足的结果,而是分析不足的结果。面对情报失败,部署新的和高度复杂的收集能力不一定是答案。人工智能肯定能帮上忙。快速识别大型数据集中的关系的能力肯定会提高情报分析的效率,并导致构建更精确的评估。生成式人工智能也可以帮助,但不能完全解决与认知偏见和心理模型相关的问题。但这需要情报机构对用于训练模型的数据进行筛选,以确保它代表了经过深思熟虑和验证的分析方法,以避免偏见。此外,由于数据是任何人工智能系统的组成部分,情报机构应该寻求合法的方法来获取私营部门的数据,同时认识到与这些数据相关的兼容性、结构和信任的固有问题。这是一项具有挑战性的任务,因为私营部门肯定会表现出不愿意向政府实体提供数据,担心影响经济底线或违反消费者信任。解决这种情况需要强有力的参与和战略,以确保数据获取,同时平衡私营组织的关注。为了解决幻觉问题,高质量的训练数据与检索增强生成(一种事实核查来源的功能)等工具相结合可以有所帮助。在短期内,生成式人工智能在情报方面的应用仍然需要分析师花时间验证和反复检查人工智能的贡献,这让人质疑这项技术的实用性。然而,随着情报机构对各种模式进行测试和试验,现在投入的时间肯定会在长期内获得回报。采用和实验这项技术将促进其成熟,训练数据可以得到改善,促进生成式人工智能与情报技术的更大整合。也许生成式人工智能在情报领域取得成功的最关键因素是被情报分析界所接受。人工智能技术不是人类的替代品,相反,它们正在启用仍然需要人类“在流程中”操作和改进功能的系统。情报工作与模糊性和复杂性作斗争,以快速识别环境中的转变和变化,并相应地将这些信息提供给那些有权和有能力制定和执行决策的人。自动化和速度并不能免除情报分析人员的主要职责,即在正确的时间提出和考虑正确的问题,以提供及时准确的情报。情报专业人员既不应将人工智能视为灵丹妙药,也不应该因人工智能尚不成熟而因噎废食,而应将其视为一种毫无疑问会随着时间的推移而改进的工具。作者简介:
诺亚·B·库珀(Noah B. Cooper)是一名职业美国陆军军事情报官员,拥有近20年的经验。他获得约翰霍普金斯大学文学硕士学位和伦敦国王学院文学硕士学位。本文仅代表作者个人观点,不代表美国陆军、美国国防部或美国政府的官方政策或立场。