当下,人工智能已成为引领新一轮科技革命和产业变革的重要驱动力,知识生产、信息形态、传播法则、行业规范也因此正在经历着裂变与焕新。
7月10日,中信出版集团召开“万象亿新 蓬勃未来:2024数智化战略发布会”,向全社会展示多年来的数字化成果和数智化战略规划,发布了万象亿新智慧出版体系以及数智化产品,并启动数智出版产业生态联盟。
中信出版集团党委书记、董事长陈炜以“AI时代,重新思考知识生产”为主题,分享了中信出版在数字化和人工智能领域的一些思考,展示了成果和未来规划。
他表示,未来大模型与出版知识库的结合,将为人类知识生产提供新的可能性,从而催生新型的出版知识服务。
以下为本次演讲内容精编,希望对大家有所启发。
1 当下回应时代之问:AIGC时代,出版还有价值吗?AIGC时代,出版作为传统传播形态,还有价值吗?
这是一个时代对于出版业的发问。
事实上,“GC”这两个字母就告诉我们,出版会变。因为出版人不再是简单地与固化为图书的知识展开对话,而是和一个动态发展的智能体系开展对话。这就构成了巨大的挑战。这种挑战,当下尚未颠覆行业,所以没有答案。
在过去一两年的时间里,AIGC技术的突破性进展,给内容行业带来了巨大的震动,主要表现在两个方面。
一方面,内容生产效率得到了极大提升。我们看到了文生图、图生文,看到了AI作为智能在辅助生产和决策方面的巨大能效。
另一方面,它也部分冲击了知识的边界和传统秩序,给知识的获取和应用带来新的挑战。
但是我们要看到,作为智能个体的人,并不会被AI迭代。在知识生产过程中,人是核心要素,知识的传播,本质上是人和知识的对话,这一点毋庸置疑。
所以出版作为传统传播形态,必定有其价值。
2 人和AI的对话是对知识秩序的重构我们都知道,传统的知识生产具有一套完整的规则,主要由教育系统和评价系统构成,用于引导和约束知识的产生、传播和应用。
知识生产秩序的存在确保了知识的可靠性和持续性,也促进了知识的共享、突破与创新,同时对人类社会的其他秩序产生支撑作用。然而,随着互联网和人工智能技术的发展,知识生产的秩序发生了革命性变化。
在传统的知识生产中,机构和专家是知识生产的核心主体,他们拥有将知识权威化的能力,定义了什么才是真正的知识和科学,同时知识传播的范围也有局限。
但随着互联网和AI时代的到来,新一代知识生产的工具打破了原有的知识壁垒,提供了人人唾手可得、更为个性化和交互性的知识获取渠道,将单向的问答变为双向的对话互动,更高效地辅助用户实现知识的吸收和创造,甚至可以作为用户的灵感来源,提供个性化的创意思路。
平民化的知识分享降低了知识获取的门槛,用户无须具备专业背景或付费获取资源,仅通过与模型对话便可获得知识,个体和非权威的声音得到了更广泛的传播。
作为大众出版业的参与者,我们乐见知识更多地走向平民,更多地去中心化。
ChatGPT作为一种具有革命意义的知识生产工具,依靠算力、算法和大数据这三项关键要素,提升了人类知识生产的效率。我们通常把算法看作知识生产的引擎,因为算法指导着数据的处理和转化。算力的提升则保证了模型的性能和效果,加快了响应速度。
但我们要看到在人工智能时代,内容输出的基石是数据本身。这也就是我们出版业说的知识。大模型平台通过大规模数据的预训练不断优化自身,使其能够更好地理解用户输入并生成更有深度的回应。
随着AI的应用,我们也看到了很多场合,AI会“一本正经地胡说八道”,也就是AI幻觉。AI训练依赖于大量数据,一旦训练数据中存在系统性的偏见和错误,模型将会学习并持续输出这些问题。
AIGC产品目前虽然拥有强大的自然语言处理能力,但不完全具备验证生成内容准确性的能力,还需要人类不断进行调整和修正。我们需要对其准确性保持警惕,确认其知识源的准确性。
作为出版人,我们愿意通过出版这一传统逻辑,来对抗AI幻觉,实现AI的有效治理。
回过头来看什么是知识。按照美国社会学家彼得·伯格的定义,信息经过处理、分类、批判和系统化后形成了知识。
知识是对信息的理解、内化和应用的结果,是个体或群体对现实世界的认知,包括可感知的经验知识和经过抽象的理论知识。知识既可以被表达和传播,也可以作为默认的社会经验独立存在。
但AI时代来了,我们真的掌握了更多的知识吗?
人类的历史可视作“集体性知识”的历史,人类文明演进的过程得益于知识的传承与演化。出版业就是在这种绵延中发展出来的。
然而,信息化时代,特别是到了AIGC的历史关口,技术的进步使大量的信息和数据快速生成、储存和传播,但我们却被大量无效信息包围,更难有效地处理和应用信息,大量未加工信息的积累速度远快于被处理并转化为知识的速度,造成了主体信息过载的困扰。
从历史发展的脉络来看,今天的人类在总体上相较于过去,拥有、掌握着更加丰富的知识;但就个体而言,人的记忆和学习水平并没有出现跨越式的提升,而知识过载让人们在获取、处理和记忆有效信息时变得更加困惑甚至成为负担,信息的有效利用和深入理解变得更加困难。
所以,我们似乎被迫陷入了一个知识泡沫的时代。
3 看见出版的未来图景让我们目光聚焦到出版行业,在人工智能、Web3.0和元宇宙三重技术叠加影响下,作为技术驱动型产业,出版在内容生产、内容复制、产品形态、传播和服务方式,甚至用户消费等各环节都发生了本质改变。
数字经济对于出版业而言,是将数据作为新的生产要素,从传统的作者生产、到用户生产再到机器和用户共同生产,推动生产力和生产关系的革命性改变,构建新的用户场景与商业模式。
从出版行业来看,利用人工智能技术为出版知识库的构建赋能,将成为数字化的底层基础。出版知识库将是我们未来最重要的数据资产。
出版的内容数据库的价值是巨大的,它是人类知识和智慧的精华体现与累积,也是我们未来抵抗AI幻觉和知识泡沫的有力工具。
这些存量的知识具有结构化、权威性、多样化的特点,同时最大的特征是,它是具有版权价值的高质量数据库。
我们利用包括知识图谱等技术,对碎片化知识进行语义集成,实现知识的互补和融合,最终完成大规模知识泛化和推理,构建高价值的自有出版知识库体系。
未来,大模型与出版知识库的结合,为人类知识生产提供了新的可能性,通过知识图谱增强大模型的专业知识和输出质量,同时也利用大模型的能力来更新和维护知识图谱。
我们的基本判断是,出版内容资源库可以有效弥补人工智能知识生产的制约问题,形成高质量内容知识库。AI和出版知识库的双向赋能,将催生新型的出版模式,出版行业也将开启一个内容生产的全新时代。
回到中信出版来说,我们是一个内容领先的公司,但我们还不是一个技术驱动的公司。我们如何作为后来者参与AIGC领域的牌局?
当下的实验是,我们已经利用自身在内容领域的优势,通过知识图谱等相关技术,初步实现了中信自有文本资源库的碎片化和序列化,形成智能书库系统。
未来,我们也将借势与大模型公司合作,进一步构建自有出版知识库,提升针对目标客户的需求提供在线定制化服务的能力。
畅想一下,AI可以让我们得以与孔子或者亚里士多德展开一场跨越千年的对话,我们的写作者一样可以通过AI获得让自己思想价值直指未来的能力。
在今天这样一个技术改变知识权力结构的时代,AI技术将让任何一个普通人,都拥有与顶级智者对话的机会。未来,AI模型训练的作者数字分身可以随时随地与普通用户互动问答。
我们相信,未来的出版图景将是一个融合传统与现代、实体与虚拟、个性化与互动化的多维空间,有着无限的创想和可能。
我们也将迎来万象亿新、蓬勃美好的未来!