(本文发表于《文化软实力研究》2023年第1期,转载或引用请注明出处。)
日前,中办、国办联合印发了《关于推进新时代古籍工作的意见》,明确提出,要促进古籍有效利用,推进古籍数字化,并对相关工作进行了细化。“建立健全国家古籍数字化工作指导协调机制, 统筹实施国家古籍数字化工程。积极对接国家文化大数据体系,加强古籍数据流通和协同管理,实 现古籍数字化资源汇聚共享。支持古籍数字化重点单位做强做优,加强古籍数字化资源管理和开放 共享。统筹古籍数字化版本资源建设与服务,推进古籍专业数据库开发与利用。积极开展古籍文本 结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级。” 在十三届全国人大五次会议上,“加强文物古籍保护利用”首次被写入了国务院的《政府工作报 告》。不难看出,《意见》是对《政府工作报告》的细化,使之更具可操作性。应该说,国家对古籍的 保护利用一直都比较重视,但像今年这样浓墨重彩却前所未有。这是为什么呢? 因为古籍工作确实 进入了一个“新时代”。对此,笔者深有体会。
近年来,因为曾在北京大学从事新媒体及大数据的研究工作,笔者对互联网以及数据库比较熟悉。又因对唐诗宋词等古代文学颇有兴趣,就利用网上的多种古籍数据库对部分经典唐诗及其争议 作了一些考证和辨析,仅用一年多的时间,就撰写了 30 多篇共计 40 多万字的论文,并结集出版了 《唐诗正本———大数据视域下的唐诗新考》( 长江出版传媒崇文书局,2021 年 10 月) 。
之所以能够获得学界的认可,应该主要是因为这些论文确实有很多全新的发现,甚至解决了一些长期困扰学界的“疑难杂症”。比如贺知章的《回乡偶书》,“少小离家老大回,乡音未改鬓毛衰。 儿童相见不相识,笑问客从何处来”中的“衰”字应该怎么读,一直存在争议,有人认为应该读作shuāi,有人认为应该读作 cuī,甚至不同版本的《语文》教科书都各执一词。之所以长期争议不断,主要是因为两种观点都不能自圆其说: 若读作 shuāi,全诗押韵了,但流传下来的古代韵书灰韵中没有“衰”字; 若读作 cuī,与尾句的“来”字又不押韵。为了弄清这个问题,笔者在各种古籍数据库中对此诗进行了全面的检索,获得了大量的相关文献,其中很多信息是近几十年来其他学者未曾引用的。基于这些新的发现,笔者得出了不同于上述两种观点而且能够自洽的结论: 《回乡偶书》中的“衰”应该读作 shuāi,灰韵中之所以没有这个字,是因为宋人在修订韵书时把灰韵中的“衰”字删掉了,只保留了支韵中的“衰”字。唐代的韵书早已无存,流传下来的韵书都是宋代以后的。关于这一观点的论文在《光明日报》发表后,获得了广泛的认同。
考证研究中,笔者还发现了很多经典唐诗在流传中出现的严重讹误,比如李白的《望庐山瀑布》,“遥看瀑布挂长川”中的“长”讹为“前”; 杜甫的《望岳》,“会当临绝顶”中的“临”讹为“凌”; 常建的《题破山寺后禅院》,“初日朗高林”中的“朗”讹为“照”; 岑参的《白雪歌送武判官》,“胡儿琵琶与羌笛”中的“儿”讹为“琴”; 王之涣的《凉州词》,“黄沙直上白云间”中的“黄沙直上”讹为“黄河远上”;张继的《夜泊松江》,“江村渔父对愁眠”中的“江村渔父”讹为“江枫渔火”,诗题也讹为《枫桥夜泊》,等等。这些重要讹误的认定绝不是轻易作出的,而是基于大量的古籍版本以及相关文献。除这些前人未经发现的讹误外,笔者还发现了很多前人在考证辨析中的错误判断,比如著名文献学家余嘉锡在《四库提要辨证》中认为,常建的《题破山寺后禅院》里,“竹径通幽处”的“竹”讹为“曲”,是始于明末清初毛氏汲古阁刊刻的《常建集》,但笔者查验发现,汲本《常建集》仍为“竹径通幽处”,毛氏并未窜改此字,而明朝中前期的很多文献版本已经讹为“曲径通幽处”,余嘉锡的“‘曲’字为毛刻之误,审矣”之说虽然斩钉截铁,实则大错特错。再如崔颢的《黄鹤楼》中,“昔人已乘白云去”讹为“昔人已乘黄鹤去”,主流观点认为始作甬者为王安石,因为王氏辑编的《唐百家诗选》此句中为“黄鹤”; 笔者查《唐百家诗选》清代以后的多种版本,此处确为“黄鹤”,但在国家数字图书馆的两种宋本中却为“白云”,这说明王安石并没有窜改,而是被后人窜改。
笔者能发现这些问题,主要是因为占有的文献远远多于前人。就拿《黄鹤楼》的考证来说,之前有多位学者曾经涉足,比如 2017 年第 6 期《中南民族学院学报( 人文社科版) 》曾发表罗漫的论文《<黄鹤楼>诗案的千年偏误及其学术史的警省意义》,此文列出的参考文献有 18 种,均为当代的出版物。而笔者引用的参考文献仅古籍版本就有72 种,包括 1 种唐写本( 即敦煌卷子) ,7 种文献的 9 种宋本( 即《唐百家诗选》《才调集》各 2 种,《河岳英灵集》《唐文粹》《苕溪渔隐丛话》《舆地纪胜》《方舆胜览》《太平寰宇记》各 1 种) 。宋太宗手书碑刻,也是宋代的文物。另外,还有两种现存日本和朝鲜的古籍版本。罗漫就认为王安石的《唐百家诗选》最早把“白云”改成了“黄鹤”,之所以判断失误,主要就是因为他所占有的文献版本太少、太近。余嘉锡关于“竹”与“曲”之误,也是这个原因。
校勘考证,版本是基础。获取的版本越多、越古,判断就会越准确。而古籍的数字化、数据库的建立以及检索功能的完善,为文献的获取提供了极大的方便。前人考证唐诗的论文,引用古籍版本超过 10 种的都很少,而笔者平均每篇论文引用的古籍版本约有60 种。由于占有的古籍文献很多,笔者能够率先利用大数据进行考证,并对同一古籍文献进行多版本的比对。由于获取的古籍版本太少,很多学者甚至完全没有版本意识,以为同一文献的内容不会因版本而异,这是一种严重的误解。或因无心的失误,或为有意的窜改,古籍文献的每一次重新刊刻都可能产生文本的异变。
中国的古籍数字化工作虽然开展的时间不长,但已初具规模。仅中国国家数字图书馆可供查询的数字古籍就达十几万种,包括英藏和法藏的敦煌遗书等珍贵古籍文献的实物照片。有了这些数据库,用关键字一搜索,相关的文献瞬间就会涌到眼前,这是传统的手段所无法比拟的。那种区别就像是: 一是用古代的罗盘找方向,一是用现代的“北斗”( 软件) 来定位———无论是效率,还是精确度,完全不可同日而语。
古籍是珍贵的历史文化资源,但保存和利用之间的矛盾一直困扰着收藏业界及有关部门。虽然“纸寿千年”,但在历经数百甚至上千年之后,纸质会因碳化而松脆,每次翻阅都会造成损坏,因此很多稀有的古籍版本都是深藏高阁,向不借阅。比如《唐百家诗选》的两个宋本,一直藏于国家图书馆,借阅过的人肯定寥寥无几。几年前,国家曾推出了“中华再造善本”工程,但成本仍然不低,发行量也很少。而古籍的数字化,既最大限度地保护了古籍,也极大地提高了利用率。一劳永逸,两全其美,可以说古籍的数字化是古籍文献资源保护和利用的一次革命,也是提高我国文化软实力的一个重要途径。
几十年来,我国在古籍整理方面做了大量工作,也取得了很多的成果。但在考证研究的过程中,笔者有一个强烈的感受,那就是很多古籍,包括考校类的文献,都存在很多的错误。这在很大程度上,是考据手段传统及研究方法落后造成的。智能技术支持下的古典文献研究,是未来古籍研究的重要方向之一。我甚至觉得,在古籍数字化及各种专业数据库建设基本结束后,在全新的文献信息资源环境下,古籍整理工作应该重新来过。
互联网、大数据、云计算……现代信息技术在各行各业都带来了颠覆性的变革。古籍的保护利用,以及中华优秀传统文化的传承和弘扬,当然也要与时俱进。令人欣慰的是,党中央、国务院已经有了及时、全面、科学的《意见》。这既是古典文献工作者之幸,更是中华优秀传统文化之幸。