提示:建议使用chrome浏览器、QQ浏览器、360极速模式,体验更佳
首页
数字化,让江苏文库走出“深闺”

来源:新华日报 日期: 2022-01-19

江苏文库前三批出版成果已实现数字化

每天打开“江苏文库”数据库软件平台(https://www.jiangsuwenku.cn/),读几篇江苏传世名著《世说新语》里的小故事,是供职于文化企业的南京市民孙子佳最近养成的习惯。“《江苏文库》已出书目实现数字化后,古往今来大量的经典著作‘飞’入电脑,变得触手可及了。”孙子佳对线上的《江苏文库》赞不绝口。

2016年启动的“江苏文脉整理研究与传播工程”如今已经进入精彩的下半场,目前累计推出四批出版成果740册。记者了解到,文脉工程的数字化工作也在有序推进,目前已经完成一期工程,江苏历史上的经典文献化身千百,走出“深闺”,走近大众。

江苏文脉工程是在省委省政府直接领导下,由省委宣传部具体组织实施的一项全省性文化发展战略工程,计划用十年时间编辑出版《江苏文库》(包括纸本与数字版)3000册左右,共分书目、文献、精华、史料、方志、研究六编,规模超过其他省市现今已编和在编的任何一部同类著作,是江苏历史上第一部文化历史百科全书。

从2018年以来,《江苏文库》纸质图书出版成果逐年增加,2018年推出首批成果86册,2019年推出第二批成果184册,2020年推出第三批成果217册,2021年推出第四批成果253册,出版总量已达740册。

另一方面,《江苏文库》的数字化工作也在稳步推进中。凤凰传媒数字化中心副主任蔡立介绍,文献资源的数字化是伴随信息技术进步发展起来的新领域。数字化不仅能对古籍进行高效、永久的保存,更能让古籍成果化身千百、造福社会。早在《江苏文库》首批纸本图书出版的同时,文库数字化工作就已开始同步规划。2019年第二届江南文脉论坛上,“江苏文库数字化工程”正式启动。至2021年6月份,成功完成《江苏文库》数据库一期工程建设。去年11月,《江苏文库》数据库工程(一期)被列入国家新闻出版署“2021年度国家古籍数字化工程专项资助项目”。

“目前,在PC端打开‘江苏文库’数据库软件平台,或在手机上搜索‘江苏文库’微信小程序,读者可以在线阅读《江苏文库》推出的前三批图书487册,包括排印本图书122册,总字数约4500万字;影印本图书365册,图片总数约35万张。”蔡立说。

一本本厚重的《江苏文库》图书,如何被“搬到”线上,走上云端,实施起来相当有难度。

蔡立介绍,《江苏文库》数字化工作主要分为两个部分。第一部分,是对《江苏文库》已出版的纸本图书,按照国家古籍电子化技术标准进行内容数字化、编辑标引加工处理,实现文献的数字化保存;第二部分,建立“江苏文库”数据库软件平台,包括“书目编”“文献编”“精华编”“史料编”“方志编”“研究编”六个部分,电子版的《江苏文库》图书按照分类一一纳入其中。

具体到每一本书,情况又各不相同。《江苏文库》的书目编、精华编和研究编均为排印本,在进行数字化时,要将排版文件转换并通过编辑加工,处理插图、表格等对象数据,处理注码与注文之间的对应关系,形成内容完整无误、结构清晰、成分标引规范、图文对照的xml数据;《江苏文库》的文献编、史料编、方志编均为影印本,在数字化时,要先将影印本图书页面去边,根据需要裁切为筒子页或单页,保持文件名称的顺序同原书顺序一致。识别、录入页面上的标题文本,分析古籍体例,标引标题层级,输出可按篇章切分的xml数据。

据了解,在全国各省区市已编或在编的近20家地方文库中,建立数字平台,推动文献数字化工作的仅有两家。 蔡立说,《江苏文库》的数字化,一方面让读者能够方便地阅读、挖掘和利用古籍文献,解决了一些珍贵古籍养在“深闺”、经不起翻阅、一般读者无法看到等难题。另一方面,通过时间、地点、人物、书目信息等知识元的关联,数字化《江苏文库》将古籍文献、学术研究成果、知识条目有机结合起来,建立起立体化知识系统,提供了传统纸质图书无法实现的检索、类聚、知识与信息的链接、知识提示等服务功能。

打开“江苏文库”数据库软件平台,记者随机性找到《江苏文库·精华编》中的《瓯北集》,这是清代常州诗人赵翼的代表作。在线阅读《瓯北集》,读者可以复制、引用、在线记笔记、查阅联机字典,这种阅读体验和功能体验是纸质图书无法给予的。

回到“江苏文库”数据库软件平台首页,读者还可以通过关键词搜索自己想阅读的典籍,查阅所需资料。记者输入“王安石”三字,瞬间显示289处《江苏文库》已上线书籍中和“王安石”相关的内容,这无疑为查找资料、进行相关研究提供了方便。

在将《江苏文库》已出版纸本图书一一电子化的同时,“江苏文库”数据库软件平台还在渐渐形成“江苏文脉”的大数据。“何承天,南北朝时代,京口人”,“潘世恩,字槐堂,号芝轩,清代苏州人”“刘歆,字子骏,汉代沛县人”……该平台将已经上线的487本书目涉及的主要作者一一列出,正点滴描绘出历史上江苏籍学者和在江苏留下著作的外省学者的集体群像;此外,已上线的487本书目1113种著作也大致勾勒出历史上的“江苏文献地图”,“从作者籍贯和著作产生地来看,苏州、无锡、南京、常州排在前列,充分证明苏南历来是江南文化繁盛之地。而就苏州来说,明清两代涌现出来的作者数量尤其多,更能证明这两个朝代是苏州文化的一段高峰时期。”

目前,蔡立和他的团队正在对2021年12月30日正式公布的《江苏文库》第四批出版成果进行数据化,“一般来说,纸质图书出版后3到6个月内,我们能完成数据加工,实现数字版上线。”蔡立说,用不了多久,读者就能在PC端和手机端在线阅读2021年《江苏文库》“上新”典籍了。