1. 引言
近年来,随着公共图书馆文献保护进入数据密集型范式,数字化技术已成为推动馆藏资源活化利用的关键驱动力,在文化遗产保护中具有重要的战略价值和意义。公共图书馆和档案馆蕴藏着丰富的馆藏文献,对建构文化认同与传承国家记忆具有重要意义。公共图书馆重视馆藏文献的数字化保护,有助于构建和传播全人类共同的记忆。然而,面对馆藏文献保存过程中面临的不稳定性因素与损失风险,建立数字图书馆已成为当务之急。在这种趋势下,世界公共图书馆和国际组织开展了馆藏文献数字化保护与利用的有益探索。1992年,联合国启动的“世界记忆项目”强调数字化保护包括档案和图书在内的世界文化遗产,以促进世界文献遗产的传播与活化利用,并确保这些珍贵资料不再消逝[1];随后,1994年,大英图书馆发起的国际敦煌项目(IDP)旨在对敦煌文献进行数字化保护,取得了显著成就,成为同类项目的成功典范[2];2008年,欧洲多媒体在线图书馆正式开放,使公众能够获取超过两百万种书籍、地图、音像及图片资料,成为欧洲最大的数字资源平台[3];此外,2009年,联合国教科文组织与32个合作伙伴共同启动了世界数字图书馆项目,汇集各国文化资料和档案[4];2010年,中日韩三国数字图书馆签署协议,加强三国国家图书馆在元数据标准化、信息服务整合及数字资源长期保存等方面的合作[5];2015年,教科文组织发布建议书,鼓励会员国通过数字化等方式保护濒危文献[6];2019年,国际图书馆联盟发布《开展数字化联合项目指南》,为图书馆实施数字化项目提供了标准化建议[7];这些举措表明,图书馆馆藏文献数字化工作已经成为全球范围内一个备受关注的重要议题。
1994年,数字图书馆的概念也被引入我国,引起学者、业界的广泛关注和热议。1998年,我国教育部发布中国高等教育文献保障系统(CALIS)项目,标志着我国数字图书馆进入操作、运营与实施阶段[8]。2017年,文化部印发《“十三五”时期全国公共图书馆事业发展规划》要求加强图书馆数字化建设,深入实施数字图书馆推广工程,提高各地公共图书馆数字化服务能力。加强公共图书馆数字资源的整合利用,丰富资源类型,提升资源适应性,满足不同终端、不同人群的实际需求。利用云计算、大数据等信息技术,推动图书馆信息化装备和系统软件的研发应用,促进图书馆数字服务手段升级换代,提升公共图书馆的现代化服务水平[9]。2022年,中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》,其中提出要建设全国智慧图书馆体系,增强公共文化数字内容的供给能力,提升公共文化服务数字化水平[10]。可见,我国对馆藏文献数字保护日益重视。然而,我国公共图书馆的馆藏文献数字化工作尚有不足,中国公共图书馆大多开展文化数字化理论研究,从数字化保护实践角度开展研究的文献较少。
美国国会图书馆历来重视馆藏文献的数字化保存,在数字化管理方面进行了很多积极的探索和实践。面对规模庞大的馆藏文献,美国国会图书馆大力推动数字化保存项目。早在1990年,美国国会图书馆就联合高校教师、学生、读者开始建设“美国记忆”计划(American Memory),共同开展馆藏历史文化档案的数字化保存。这一项目通过互联网免费向公众开放,极大地方便了历史文化的研究与传承。在1995年还开启了“国家数码书库项目”(National Digital Library Program),该项目联合了全美几十家高校图书馆,旨在促进美国国会图书馆的馆藏文献数字化保护工作,加强文献资源的系统整合,并提高公众对馆藏文献保护的意识。
美国国会图书馆在2021年发布的《2022~2026年数字馆藏发展战略》中强调数字馆藏建设已成为图书馆信息资源建设的重要组成部分,数字化识别、选择、获取、描述、处理、保存更多馆藏文献。图书馆需要为读者借阅不同主题阅读资源提供便利[11]。由此可见,美国国会图书馆在数字实践和政策引领上都重视对馆藏文献的数字化保护。本研究以美国国会图书馆为调查对象,探究美国国会图书馆在文献数字化领域的成功经验,以期为中国公共图书馆开展馆藏资源数字化实践提供参考。
2. 图书馆馆藏文献数字化内涵及价值
公共图书馆馆藏文献数字化,就是运用现代信息技术对馆藏文献进行数字化加工、处理,建成文献书目数据库和全文数据库,发掘文献中所蕴涵的丰富的信息资源,借用光盘、网络等介质进行保存和传播,从而达到保护和利用馆藏文献资源的目的。数字化也是促进馆藏文献保护与利用的另一种有效途径,特别是在网络环境下,馆藏文献数字化适应了公共图书馆数字化、信息化变革。一方面,数字化后的馆藏文献可以提供屏幕阅读、内容检索、远程全文传送、下载打印以及制作多媒体等多方面的服务,很好地弥补了纸质文献的不足,实现馆藏文献的研究价值。另一方面,通过馆藏文献数字化,减少了对文献原件的直接使用,有利于其长久保存,进一步实现馆藏文献的文物价值。公共图书馆对馆藏文献数字化以后,读者可通过网页浏览并在线阅读馆藏文本;可局部放大或跳跃查找数字馆藏,避免了翻阅纸质典籍带来的诸多不便,为文献浏览与阅读带来了一次革命。
3. 美国国会图书馆馆藏文献数字馆藏概况
美国国会图书馆(The Library of Congress, the United States)成立于1800年4月24日是美国四大官方图书馆和全球最大的图书馆之一,为美国政府行政、司法、立法等机构和世界各国图书馆服务,还向学者、研究人员、艺术家和科学家提供资料。美国国会图书馆也是世界上最早尝试数字建设的图书馆之一。随着数字化时代的到来,传统的馆藏文献查阅方式无法满足受众的需求。90年代以来,美国国会图书馆通过美利坚记忆项目(American Memory Project)、美国数字图书馆首创计划(DLI, Digital Library Initiative)、美国国家数字图书馆项目(NDLP, National Digital Library Program)等数字化项目对馆藏文献进行数字化征集、整理、利用和保存。在此期间,美国国会图书馆利用自身优势和现有途径,顺利地收集到数量众多、参考价值极高的历史档案、手稿、期刊、图书、地图、音像等文献。部分馆藏文献的历史超过250年,几乎涵盖所有语种。根据官网最新数据,目前美国国会图书馆数字馆藏超过1.75亿件物品,其中包括2549万本编目图书、超过1587万份非机密印刷馆藏资料。收录超过1.34亿件特殊馆藏资料,其中包括420万种音频资料、7700万份手稿、580万张地图、1750万张微缩资料、180万张乐谱、1520张照片、864,000张海报,印刷品和素描、200万张其他资料(包括机器可读资料) [12]。
4. 美国国会图书馆馆藏文献数字化保护实践
4.1. 制定数字馆藏方针,系统推进馆藏文献保护
1993年起,美国国会图书馆便着手发布馆藏数字化方针,每四年更新一次。在“1993~2000年战略规划”中决定加强图书馆保存工作,建设电子化图书馆。随后,美国国会图书馆提出建成“电子化图书馆”“完全拥有整合过的数字化资源”。在“2008~2013年战略规划”强调共同应对数字化、网络化与知识化带来的海量信息资源管理挑战[13];在“2011~2016年战略规划”中强调收集、保存全球知识馆藏及关于美国创造力的记录,并向读者开放获取,美国国会图书馆在此背景下开展了馆藏文献数字化工作[14];在“2016~2020年战略规划”中强调研发新的图书馆系统和书目检索系统,采用先进的保存技术手段,加快数字化进程,提升数字资源保障能力、战略保存能力及跨机构资源整合服务能力。提高数字化工作效率,增强馆藏文献数据的安全性和可靠性。美国国会图书馆通过“外引内建”的方式形成较为系统完善的政策体系,促进文献保存政策之间相互衔接和支撑。美国国会图书馆的馆藏数字化方针还体现了对版权和知识产权的尊重,通过明确的使用条款(480号公法),巧妙地平衡文献保护与公众教育之间的关系。数字化方针意在运用现代信息技术系统推进馆藏文献保护工作,将馆藏文献转变为数字格式,确保这些宝贵文献得以长期保存。
4.2. 建立馆藏文献识别码管理体系
1966年,美国图书馆协会(ALA)制定了MARC (Machine-Readable Cataloging)格式的文献保存标准,并广泛应用于美国国会图书馆的馆藏数字化工作中。MARC格式基于记录标识号字段(Leader)、结构体字段(Tag)、指示符字段(Indicators)、子字段标识符(Subfield Code)和内容字段(Subfield Content)等标记和字段系列标准,成为报刊、口述记录、照片、手稿、地图等馆藏文献资源数字化保存的机器可读格式。MARC格式中的每个字段都有固定的编码规则和格式要求,工作人员可以根据不同字段解码馆藏文献资源的类别、年代、来源、入藏时间等信息,准确记录、检索馆藏资源。美国国会图书馆利用射频识别(radio frequency identification, RFID)技术,可以准确、快速地对馆藏文献进行清点和整理,大大减少了人工整理工作量。通过以上馆藏技术,图书馆职员能随时查看文献本体或数字化数据所在位置,可以精确到秒查看文献流转各节点的信息。利用文献数字化身份识别码管理体系,美国国会图书馆将有效地管理馆藏文献和文献数据,促进图书馆馆藏数据的共享交流和文献资源的活化利用。
4.3. 建设开放友好的数字化平台
为了方便公众阅览和使用美国国会图书馆的馆藏文献,美国国会图书馆搭建了统一的平台。同时,拓展了文献馆藏数据库,将美利坚记忆项目(American Memory Project)、美国数字图书馆首创计划(DLI, Digital Library Initiative)、美国国家数字图书馆项目(NDLP, National Digital Library Program)等数字化项目生成的手稿也都纳入其中,实现了类型丰富的数字化手稿的统一在线展示。公众能够免费使用美国国会图书馆在线平台检索与浏览手稿。平台提供丰富的检索方式,方便公众通过关键词、日期、编号、标题、作者等手段检索手稿,以便高效地找到所需资源。在查看检索结果时,用户通过友好简洁的界面查看文献类型、原件来源并对其打印输出。而在阅览手稿数字化图像时,公众可以对图像进行放大缩小、上下翻页、全屏阅读等操作,获取所需信息。此外,平台还开放了手稿元数据与JPEG图像数据集,允许公众免费下载使用。通过使用统一开放的手稿数字平台,美国国会图书馆成功实现了其来源各异的数字化手稿的集中展示,增添了公众利用美国国会图书馆数字化手稿的机会,有效地推动了美国国会图书馆馆藏数字化手稿的传播与使用。
4.4. 开展馆际文献交流合作
为了形成完整专业的文献数据库,馆际合作与交流显得尤为重要且富有战略意义。美国国会图书馆积极开展与美国存取理事会、哥伦比亚大学、康奈尔大学、易摩锐大学、哈佛大学、美国国家档案与记录管理局等外部机构在文献数字化保存过程中的交流与合作,共同致力于打造文献数据库。例如美国国会图书馆为加强文献数字化合作交流在1995年成立“美国国家数字图书馆联盟”,并且获得1300万美元的国会拨款用于实现馆藏文献数字化,这一行动显著扩大了馆藏文献在现代社会的影响力。美国国会图书馆参与的“国会图书馆国际交流项目”(Library of Congress International Exchange Program),旨在促进国际图书馆之间的信息交流,通过文献和资料的交换,增强各国之间的文化联系。各国图书馆可以互相借阅馆藏和共享馆藏资源,提升各自服务能力,推动文献的数字化保护与利用。通过利用美国国会图书馆丰富的数字资源库,找寻相关馆藏文献,形成题录库、文摘库与全文导引,并汲取美国国会图书馆人员在虚拟专业库系统建设方面的经验,形成规范化与标准化的处理条例,完善馆藏文献检索体系。发挥美国国会图书馆馆员在文献保存方面的专业知识,强化文献资源数据库构建的相关质量控制,合理把握好数据源,打造高质量文献数据库。
5. 对我国图书馆馆藏文献保护的思考
习近平总书记在山东考察时强调:“要繁荣发展文化事业和文化产业,创新实施文化惠民工程,大力推进文化数字化,让社会主义先进文化为经济发展增动能增效益、为旅游休闲增内涵增魅力、为城乡社会增正气增活力”[15]。建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。重视和加强数字文化建设是习近平文化思想的重要组成部分,也是数字中国战略、国家文化数字化战略的重要内容。在此背景下,国家图书馆牵头建设的“中华古籍资源库”在线发布古籍资源超10.4万部(件),其中联合全国39家古籍存藏单位发布2.8万部(件),是目前古籍资源类型和品种最多的综合性资源共享平台[16]。1998年启动的“高等教育文献保障系统”CALIS (China Academic Library & Information System)是教育部“九五”、“十五”和“三期”“211工程”中投资建设的面向多所高校的公共服务基础设施,也是我国文献资源保障体系的重要组成部分。目前,该项目已完成25个特色库的验收,总数据量达280万条(篇);完成213个重点学科导航库建设,共收录6万多个较重要的学术网络;高校学位论文库已达9万余条[17]。中国图书馆在馆藏文献保持中已经取得了一定成效,但也存在文献资源活化不够、馆藏文献保存标准不统一、文献资源开发利用不足、文献社会服务途径较少等问题。本文将在加强馆藏文献保护顶层设计、制定文献馆藏标准、创新文化资源服务形式、打造高质量馆藏文献数字资源库方面,进一步分析美国国会图书馆对中国图书馆馆藏文献数字化的启示,以帮助中国图书馆更有效地开展馆藏文献的保护和利用工作。
5.1. 完善馆藏文献数字保护顶层设计
2023年中共中央、国务院印发《质量强国建设纲要》要求“推动图书馆、博物馆等公共文化场馆数字化发展,加快线上线下服务融合”[18]。同年中共中央、国务院印发《数字中国建设整体布局规划》提出打造自信繁荣的数字文化,推进文化数字化发展,深入实施国家文化数字化战略,建设国家文化大数据体系,形成中华文化数据库[19]。在国家文化数字保存规划的引领下,构建一套系统性和前瞻性的数字保存顶层设计显得尤为关键。通过深度融合信息技术与文化传承的核心理念,采用标准化、规范化的数据采集、处理、存储方式与访问机制,确保馆藏文献资源全面数字化转型。精准识别并优先保护濒危馆藏文献,利用大数据、云计算等先进技术优化资源调度与管理,同时建立多层次安全防护体系,来应对数字时代的信息安全挑战。数字化战略设计还需注重跨平台兼容性与互操作性,促进国际革命文献数字资源的共享与交流,共同推动全球革命文化资源的数字化保护与传承。数字保存顶层设计不仅限于技术创新和理念创新的实践,还包括对国家文化根脉的深刻致敬与面向未来的战略布局。
5.2. 加强馆藏文献数字化标准建设
我国馆藏文献浩如烟海,开发与保存单位数量众多,现阶段各文献保存单位并未就馆藏文献数字标准达成共识,在图书馆文献整理中出现多种互不兼容的数字化格式。比如常用的字符编码有ASCII码(美国标准信息交换码)和EBCDIC码(扩展的BCD交换码),字符编码要求数字资源在运用字符编码时要标明文档所用的编码方式以解释文档的代码[20]。文献保存数字化格式就包括PDF、TXT、DOC、PDG等,读者常常需要下载不同的阅读器解码馆藏文献。这一情况不利于馆藏文献的数字化浏览,为公共图书馆的馆藏文献数字化工作设置了障碍。面对馆藏文献保存弊端,为规范并促进我国数字资源的长期保存,发挥国家层面对行业的引领作用。2011年全国图书馆标准化技术委员会立项《图书馆数字资源长期保存元数据规范》(WH/ZI-2012),该标准采用PREMIS2.0,结合我国图书馆等文化行业机构对数字资源长期保存元数据描述、揭示及使用的实际需求,作出相应规定;2013年立项国家标准《图书馆数字资源长期保存信息包封装规范》。确定文献数字化保存的权威机构,建立文献数字化标准规范小组,统一发布文献保存权威标准。在此过程中,应动员中国公共图书馆积极参与标准制定,根据实际发展需求,结合国际标准制定统一、可通用、适应性强的行业标准[21]。通过明确存储格式和转化标准,减少重复工作和不必要的资源浪费。紧跟行业最新发展动态,推动馆藏文献数字化标准规范体系优化升级。数字化标准包括馆藏文献的分类法、著录规则、软件和数据库的使用、数字化加工标准、加工和利用平台等。统一的标准是实现馆藏文献数字化资源共享的基础,也是促进公共图书馆数字化建设进程的有力保障。
5.3. 拓宽参与主体推进馆藏文献数字化
当前馆藏文献数字化建设取得一定成效,多主体合作成为重要途径之一。我国政府部门要发挥引导作用,加强各文献保存部门之间的联系,消除合作壁垒。同时,图书馆可以与高校、博物馆、档案馆甚至一些资深收藏家合作,共同开展图书馆文献数字化项目,共享图书馆数字化成果。目前,在我国文化和旅游部官方网站上登记注册的文化遗产相关社会组织有中国华夏文化遗产基金会、中国古迹遗址保护协会、中国非物质文化遗产保护协会、中国古籍保护协会、东方华夏文化遗产保护中心等[22],这些社会组织应积极响应国家号召,提高社会责任感,主动参与图书馆开展的文化遗产数字化项目,形成保护合力,共同推动文化遗产的保护与传承[23]。在深化合作方面,数字馆藏建设需要由图书馆管理者或者管理途径来制定选书策略,然后通过流程确定哪些书籍已经被数字化,以及部分机构和供应商能够为哪些遗失的实体版本提供元数据来源以进行数字化。需要指出的是,多方参与者要各司其职,按照熟悉的方式完成自己的使命。未来的馆际合作要进一步强化各建设主体之间的沟通协作,鼓励建立良好的合作关系,共享所取得的文献研究知识成果,从而促进我国公共图书馆数字馆藏事业繁荣发展。
5.4. 创新馆藏文献展现形式
中国公共图书馆借助VR技术,将馆藏文献转化为数字化形式,三维数字化呈现与馆藏文献相关的信息,增进参观、阅读馆藏文献时的沉浸感。数字化技术助推馆藏文献全媒体平台数据资源的传播,通过馆藏文献资源虚拟沉浸体验空间的建构,可以有效解决传统文化观展时体验感、具身性欠缺的问题。借助数字孪生技术虚拟仿真场景的建构,营造出深度沉浸的虚拟体验空间,依托设备传输、XR技术及脑机接口等技术,创建用户虚拟数字仿真角色,将其全息投影至场馆数字空间,实现实时参与并体验文化叙事。借助VR、AR等技术手段与文化价值有机融合为公众提供全方位多感官的文化视听盛宴,向读者传递古籍文献背后的故事[24]。中国公共图书馆还应关注最新技术。AI大模型Sora作为新一代的感知生成技术,可以为公共图书馆馆藏文献服务带来创新。它会根据人类指令生成一分钟的视频模型,这让公共图书馆原本枯燥无味的馆藏文献文字讲解转换成了丰富生动的视觉故事。馆藏文献数字化表达和文物叙事趣味性呈现结合,改善了受众的视觉和感官体验。
6. 结语
数字化转型是公共图书馆现代化发展的必然趋势,馆藏文献数字化是保护文化遗产的重要路径。本文通过分析美国国会图书馆馆藏文献数字保护现状,发现其在馆藏文献数字化保护中具备的先进经验,美国国会图书馆数字馆藏文献保存举措可以为我国公共图书馆文献数字化保存工作提供借鉴。从我国公共图书馆馆藏文献数字化现实出发,本文从4个方面对我国文献数字化实践提出建议,以期不断提升我国文献数字化开发与保护的效率,探索出一条适合本国国情的馆藏文献保存道路。