第四,充分发挥新的古籍整理方式——汇编影印优势,在图录编纂、丛书汇编、出土文献刊布、海外善本回归等方面成果丰硕、精品迭出。在影印技术传入我国之前,雕版印刷和传抄是古籍传播的主要路径。相比抄写,雕版的优势是副本的制作速度大大提高,成一版而化为百千。但缺点也很明显——成本高、速度慢,如果遇到超大部头典籍,反过来又被抄写替代,《永乐大典》和《四库全书》即是明证。影印技术传入后,张元济等出版家意识到其独特优势,并印刷了《四部丛刊》为代表的众多丛书。大型文献资料丛书应当首选影印,郑振铎在《古本戏曲丛刊三集序》中论述至为精辟:“这部丛刊本来是内部参考资料性质的图书……和供给一般读者们作为精读之用的选本或读本,基本上是不相同的……这种用照相石印的印刷方法,乃是用以替代钞胥之劳和油印本子的费多而不精的办法,且足以解除铅印工厂的紧张情况的比较最可能想到的最经济而且最省时省力的方法,似乎是应该坚持下去的。”他总结影印的特点选是题多为参考资料性质,并非精读之物;其优势在于节约成本,省时省力。从70多年的古籍整理成果来看,影印古籍所涉子目至少5倍于排印古籍,在图录编纂、丛书汇编、出土文献刊布、海外善本回归等方面更是绝对主力。
图录,是古籍目录的升级版。有图为证,目录所描述的古籍行款一目了然。早期,很多“书影”著作靠“摹刻”追求形似。是影印技术,促进了图录的实质发展。赵万里主编的《中国版刻图录》为当代古籍图录发轫之作。其后,陆续有藏书机构出版善本图录。近十多年,随着《国家珍贵古籍名录图录》第1—6批的出版,彩色印刷已经成为古籍图录的标准。我国传世古籍有20多万个品种50多万个版本,尚不包括民国时期线装书。其中,绝大多数读者使用研究的“基本古籍”数量,不过万种。其中适合不断深入整理、注释、解读的,更是倍尠之。为数庞大的“非基本”古籍,受众面有限,不需要浪费人力物力逐本点校。但这些古籍或承载思想火花,或流淌文学情志,或载录一代、一派、一地、一族、一人之史料,依然是优秀传统文化的物质性载体。按照一定学术脉络进行汇编影印为丛书,方便相关领域专家研究利用,可以为当下学术研究提供坚实的文献支撑。今人汇编影印的丛书有近千种,举其大者如《续修四库全书》《四库全书存目丛书》等“四库系列”、《清代诗文集汇编》《原国立北平图书馆藏甲库善本丛书》《子藏》《中国古籍珍本丛刊》系列等等,均为人们常用资料。出土古籍(或出土文献)整理是近年的显学。其中以唐前最为重要,如商周甲骨、金文、战国简帛、敦煌遗书等等,这些承载着我国古代文化的源头和早期支流,是传世文献定本之外的重要文本,对探究早期文本生成和文化源流发展至为重要。因此,绝大多数出土文献的刊布,采用的是影印(或加释文)的方式,如《甲骨文合集》《殷周金文集成》《清华大学藏战国竹简》《国家图书馆藏敦煌遗书》等。
第五,与时俱进,通过数字化和数字人文新技术方式的不断更新迭代,使古籍整理步入数字时代的初级阶段。计算机的发展让大数据和人工智能时代不期而至。与时偕行,拥抱新技术,是新时代古籍整理工作的突出特征之一。我国古籍数字化起步于20世纪90年代,成型于新世纪初。早期,数字化古籍以光盘版、单机版为主。进入新世纪尤其是近十年,随着技术不断进步,科技赋能古籍工作取得了系列可喜成果。年国家图书馆搭建的“中华古籍资源库”平台,已经累计发布古籍及特藏数字资源10万部(件),全部实现免登录在线阅览。同时,国家古籍保护中心联合海内外收藏机构发布“东洋文化研究所汉籍全文影像数据库”“哈佛大学善本特藏”“法藏敦煌遗书”“天津图书馆古籍”“云南省图书馆古籍”等,基本搭建成了“国家古籍数字平台”架构。上海图书馆“家谱知识服务平台”,实现了时空坐标溯源家族发展源流与迁徙分布。中华经典古籍库,已入库十多家专业古籍出版社出版的图书部。古联公司古籍OCR系统在籍合网上线,可以处理刻本、稿钞本、石印本等图像,识别率高于95%,其“古籍自动标点系统”上线一年多来,也好评如潮。阿里巴巴研发的“汉典重光”古籍平台,自动扫描与OCR识别准确率超过97.5%,等等。古籍数字化为传统文化典籍的保护、利用提供了更快更便捷的途径,而AI智能技术襄助古籍整理,将大大提高古籍工作者的效率,有助于他们对内容进行更为深入的研究,也有助于加快数字人文进程。如今,古籍专业数据库建设方兴未艾。清华大学数字人文中心等多家机构正在积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级。开放共享,是时代的呼声。当古籍遇到数字,让旧与新成为有机结合体,古籍整理已然进入数字人文的初级阶段。
(作者:南江涛,系国家图书馆副研究员)