赣南红色文献的档案整理与数字化传播研究——基于AI辅助的实践探索
A Study on the Archival Organization and Digital Dissemination of Red Literature in Southern Jiangxi —A Practical Exploration Based on AI Assistance
摘要: 赣南地区作为中国革命的重要策源地,拥有丰富的红色文献资源,具有重要的历史价值和文化意义。然而,当前这些文献普遍面临分散、难检索、保存环境差及信息化程度低等问题,影响其传承与传播。本文基于人工智能(AI)技术,探索其在红色文献档案整理与数字化传播中的应用路径,结合实际案例进行整理实践、平台展示与成效评估。研究发现,AI在文献识别、分类、元数据提取、摘要生成等方面能显著提高整理效率,并为构建红色文化传播新模式提供技术支持。文章提出“AI辅助 + 平台支撑 + 公众参与”的红色文献整理与传播范式,为区域红色资源的活化利用提供借鉴。
Abstract: As a key cradle of the Chinese revolution, the Gannan region possesses abundant red literature resources with significant historical and cultural value. However, these resources currently face challenges such as scattered storage, difficult retrieval, poor preservation conditions, and low levels of digitization, which hinder their inheritance and dissemination. This study explores the application of artificial intelligence (AI) technologies in the archival organization and digital dissemination of red literature, combining practical cases for organization practices, platform demonstrations, and effectiveness evaluations. The findings indicate that AI significantly enhances efficiency in literature recognition, classification, metadata extraction, and abstract generation, while providing technical support for constructing new models of red culture dissemination. The study proposes a paradigm of “AI assistance + platform support + public participation” for the organization and dissemination of red literature, offering a reference for the revitalization and utilization of regional red resources.
文章引用:高甜, 陈柱. 赣南红色文献的档案整理与数字化传播研究——基于AI辅助的实践探索[J]. 社会科学前沿, 2025, 14(9): 238-247. https://doi.org/10.12677/ass.2025.149800

1. 引言

1.1. 研究背景与意义

红色文献是中国共产党领导人民开展革命斗争的历史见证,记录了党和人民在不同历史阶段的重要实践与思想成果,具有独特的政治价值和文化意义。赣南地区作为中央苏区的核心区域,拥有丰富的红色历史资源,涵盖瑞金临时中央政府的创建、兴国模范苏区的建设、于都长征出发等重大历史事件。由此形成的红色文献种类繁多、载体多样,既包括纸本文献、音像资料,也涉及口述历史与民间档案。面对新时代对红色文化传承与弘扬的新要求,这些文献亟需系统整理、科学保存与创新传播,以更好地服务党史学习教育和公共文化建设。早在2002年,官建生就指出地方文献数字化是中国数字图书馆工程的基础,为后续红色文献的数字化提供了早期实践参考[1]。然而,目前赣南红色文献仍存在内容分散、编目缺失、信息检索困难、数字化程度低等问题,限制了其学术价值的挖掘与社会效益的发挥。随着人工智能技术的发展,为红色文献的高效整理与数字传播提供了全新契机。基于此背景,开展AI辅助下的赣南红色文献档案整理与数字化传播研究,不仅是地方文化资源开发的实际需要,也回应了国家在文化数字化、智慧档案建设等方面的战略导向,具有突出的理论价值和现实意义。

1.2. 研究现状

当前国内外在档案数字化和人工智能应用方面均已有一定研究基础。国外较早探索AI技术在文献管理中的应用,如通过OCR技术对古籍文本进行数字识别,通过语义分析构建知识图谱,实现文献内容的智能化挖掘与服务共享。在国内,随着《档案法》修订与“数字中国”建设的推进,文献档案的现代化管理逐渐受到重视。陈晓婷和黄诗晴基于信息空间理论探讨了文献遗产的数字化传播,为红色文献的传播模式提供了理论视角[2]。近年来,一些地区围绕古籍、民间文献及地方志等文化资源的数字化开展了诸多有益尝试。如山西省探索基于AI的中国古代文献整理流程[3],广东梅州聚焦红色文献编撰与数字记忆构建[4],云南则致力于少数民族历史档案的语义关联与知识组织[5]。此外,学界也尝试将元宇宙、虚拟现实等新兴技术引入红色资源服务平台建设之中,为红色文化教育提供沉浸式新路径[6]。尽管相关研究成果不断丰富,但当前针对赣南红色文献的专门研究仍较为薄弱,特别是在将AI技术与文献档案实践有效结合方面,仍缺乏系统探索和案例支撑。因此,有必要开展具有区域针对性和方法创新性的研究,填补赣南红色资源智能整理与传播模式构建的理论与实践空白。

1.3. 研究目的与方法

本研究旨在以赣南地区红色文献为研究对象,探讨人工智能辅助下文献档案整理与数字传播的有效路径,解决文献分散、整理低效、传播单一等现实问题。具体而言,研究一方面将梳理赣南红色文献的内容类别与资源分布,识别整理中的关键难点;另一方面,将选取具有代表性的AI工具,如Zotero、ChatGPT、Elicit、Tesseract OCR等,进行文献识别、元数据提取、摘要生成、语义分析等操作实验,构建“AI辅助 + 人工复核”的文献整理流程。同时,结合数字平台建设实践,尝试制作红色文献数字传播样例页面,分析不同传播载体的适配性与影响力。研究方法上将综合采用文献分析法、案例研究法、工具应用实验法与平台对比分析法,注重理论分析与实际操作相结合。通过研究,力求提出一套具备区域适应性、可复制性和推广性的红色文献智能整理与传播模型,为赣南乃至全国红色文化数字化提供思路和参考。

1.4. 理论基础

本研究在理论上综合运用多学科知识,以支持红色文献整理与传播路径的系统建构。首先,数字人文理论强调技术与人文学科的深度融合,提供了以AI技术赋能红色文献处理的整体视角。其次,知识组织理论与语义网络结构为文献分类、标注与内容关系建构提供了技术逻辑与方法依据,适用于构建具有语义关联性的红色文献数据库。传播学理论则从内容传播、用户接受与媒介特征等维度出发,为红色文化的数字展示、平台选择与互动设计提供了指导。此外,系统论与信息管理学中的流程优化、平台集成理念也有助于设计更为高效可行的技术路径。通过上述理论的交叉融合,本文不仅关注文献整理技术的可行性,更注重其在文化传播中的社会功能与价值实现,力求实现技术进步与文化传承的有机统一。

2. 赣南红色文献整理的现状与困境

赣南地区是中国共产党早期革命的重要策源地,红色文献资源丰富,类型多样,具有显著的地方特色和历史深度。自中央苏区建立以来,赣南留下了大量与党政军建设、群众动员、战斗历程等相关的文献档案。这些资源不仅在历史研究中占有重要地位,也为新时代红色文化传承提供了宝贵素材。然而,从当前文献整理与传播的整体情况来看,仍存在诸多现实问题,制约了其应有功能的充分发挥。

2.1. 文献类型与分布概况

赣南红色文献的内容十分广泛,既包括官方形成的革命文献,如中央苏区时期的政令、会议纪要、党内文件、报刊宣传等;也包括民间层面的文献资源,如烈士遗书、战士日记、群众来信、红军歌谣等。此外,近年来地方政府和党史研究机构也收集、整理了一批口述史资料和影像文献,进一步丰富了红色档案的表现形式。从载体上看,赣南红色文献涵盖纸质档案、照片、录音录像、实物铭文等多个媒介,形式多样,内容密集,具备高度的原始性与地方性。

据林虹妤的研究,赣南红色文献涵盖多种载体,分布于档案馆与民间收藏机构[7]。这些文献主要分布于赣州市及下辖各县(市、区)的档案馆、党史馆、博物馆、高校图书馆以及部分民间收藏机构之中。由于形成时期不同、归属单位分散,文献整理与保存工作存在标准不一、目录不清、数据库缺失等现象。部分重要文献尚未完成数字化编目,难以实现系统性调阅和广泛传播,形成资源“藏而不显”的不良局面。

2.2. 当前整理实践存在的问题

尽管赣南地区近年来已开展了一些红色文献的整理与数字化尝试,但总体而言,其文献整理实践仍面临多方面的瓶颈。首先,文献收集渠道不够畅通,许多文献仍散落于基层单位或私人手中,存在遗失和损毁风险。其次,文献整理主要依赖人工分类与录入,受限于专业人员数量与文献处理能力,整体进度缓慢,易出现内容遗漏、元数据缺失等问题。

再次,文献描述体系不统一,缺乏权威的分类标准和信息标注规范,不利于资源整合与跨平台利用。一些单位的文献管理系统仍停留在静态录入阶段,尚未引入语义搜索、内容关联等智能化功能,用户体验较差。此外,由于缺乏技术支撑,文献整理的过程往往缺乏灵活性与扩展性,难以应对大规模数据处理的需求。在实际工作中,不少机构更多依赖传统档案工作经验,尚未形成基于人工智能等新技术的标准化流程与操作机制。

2.3. 数字化能力与传播路径的短板

红色文献的数字化不仅是档案整理技术的升级,更是文化传播逻辑的重构。当前,赣南红色文献在数字化展示与传播方面仍处于较为初级的阶段。一方面,已有的数字平台数量有限,覆盖面不足,文献资源的聚合度不高;另一方面,平台功能单一,多为静态展示,缺乏用户参与机制与互动传播功能,不利于提升受众粘性与传播影响力。

在传播内容设计上,多数单位倾向于“文献堆砌式”呈现,缺乏深入挖掘和主题策划,难以激发公众的阅读兴趣。在媒介运用上,红色文献传播仍以官网、展板、汇编图册等传统形式为主,未能充分发挥新媒体、短视频、虚拟现实等多样化手段的潜力。尤其是在面向青少年群体和外地游客的红色教育传播中,内容表达方式缺乏时代感与参与感,影响了传播的广度与深度。

综合来看,赣南红色文献整理与传播工作仍存在“碎片化、低效率、缺平台、弱传播”的突出问题,急需在技术支持、标准建设与机制创新等方面实现突破。人工智能技术的发展为解决这些问题提供了可行的新路径,有望推动赣南红色文献从“静态保存”向“动态利用”转变,实现从“物理归档”向“知识共享”的跨越。

3. AI辅助下的文献整理实践探索

在传统文献整理模式中,人工识别、分类与归档长期是主要手段,尽管具备一定的准确性与专业性,但面对大批量、多样化的红色文献,人工整理的方式已难以满足高效性、标准化与可扩展性等现实需求。刘航提出的数字人文整理流程启发了本研究“AI辅助 + 人工校核”的结构化模式[8]。随着人工智能技术的快速发展,特别是在图文识别(OCR)、自然语言处理(NLP)、语义分析与知识抽取等方面的突破,为档案整理注入了新的可能。本研究以赣南红色文献为试点,尝试构建以AI工具为核心支撑的文献整理流程,并通过小规模操作实践,对工具适配性、流程可行性与整理成效进行初步评估。

3.1. OCR识别与文献数字化初处理

光学字符识别(Optical Character Recognition, OCR)技术是实现纸质文献数字化转化的基础步骤。在本研究中,我们采用开源OCR工具Tesseract对扫描后的红色文献图片进行批量识别实验。对于标准印刷体文献,OCR识别率普遍达到90%以上,识别速度较快,可有效输出纯文本格式,为后续信息提取提供数据基础。然而,对于早期印刷不清、页面污染严重或手写体内容较多的红色文献,OCR准确率明显下降,仍需人工辅助校对。通过实际操作发现,优化图像清晰度、调整页面结构(如去边框、调整对比度)有助于提升识别质量。因此,在OCR识别前应设立图像预处理环节,确保原始文献扫描件具备较高的可读性与结构规范性。

3.2. 元数据生成与语义分析应用

红色文献的核心价值在于其内容与语境的历史意义,要实现有效整理,必须建立结构化的元数据体系。在人工整理中,元数据录入常常面临主观性强、遗漏率高的问题。为此,本研究引入AI语言模型(如ChatGPT、Elicit)辅助完成文献的标题识别、时间标注、关键词提取、主题判断等元数据生成任务。徐新韵强调档案数字化的知识化处理,支持本研究通过AI生成元数据与语义分类[9]

以一份中央苏区会议纪要为例,通过对其正文输入模型,系统可自动生成包含“文献类型”“人物主体”“时间地点”“主要议题”“关键词”等字段的元数据摘要。这种处理方式不仅提升了信息提取的准确率,也节省了大量人力成本。更重要的是,AI工具具备一定的语义理解与上下文分析能力,能够在缺乏明确信息的情况下进行合理补全和判断,提高文献归档的系统性与逻辑性。

3.3. 文献分类与结构化流程构建

在完成初步识别与元数据提取后,文献的分类与整理是构建文献资源数据库的核心步骤。本研究尝试将AI模型用于文本语义聚类分析,结合人工设定的主题类别(如“红军长征”“党政建设”“群体动员”“革命人物”等),构建文献自动分类机制。通过关键词匹配与语义相关度计算,模型可自动将文献归入相应类别,并依据相似度打分辅助人工复核。

此外,研究还尝试建立初步的结构化整理流程,分为“图像采集–OCR识别–元数据生成–语义分类–人工校核–数据库录入”六大步骤,各环节均可通过AI工具进行部分或全部辅助,实现文献处理的半自动化。实际操作表明,该流程在面对内容较规范、文本清晰的红色文献时成效显著,在效率与准确性上均优于纯人工操作。

3.4. AI工具适配性与整理效率评估

为验证不同AI工具在文献整理任务中的适用性,本研究对几种常用工具进行了比较分析。OCR识别方面,Tesseract在简体中文文献中表现良好,处理速度快、扩展性强;语言模型方面,ChatGPT适用于内容摘要与语义理解,Elicit则更擅长结构化问题回答与批量问答生成;Zotero具备良好的文献管理与数据导出功能,适合建立可查询的元数据数据库。各类工具的组合使用可形成较完整的辅助体系。

在效率评估方面,以同样一批15份红色文献材料为例,AI辅助整理耗时约为人工操作的1/3,且信息提取的完整度更高。尤其在分类、关键词提取与摘要撰写等任务中,AI展现出显著优势。不过,对于术语密集、结构复杂或含有多语种内容的文献,AI处理仍需人工干预。

总的来看,AI工具的引入显著提升了文献整理的工作效率与标准化程度,同时为传统档案管理方式注入了技术活力。尽管当前AI在语境理解、个性化标注等方面尚存在一定局限,但其在红色文献初步整理与系统化归档中的应用前景值得持续关注与深入拓展。

3.5. 案例分析:以《寻乌调查》为例的AI辅助整理与传播实践

《寻乌调查》是1930年5月在江西省寻乌县开展的一次系统性社会调查,并于1931年2月整理成约八万字的调查文献。该文献内容涵盖政治、土地、商业及社会结构等多个方面,是中国早期农村社会研究的重要成果。本研究以《寻乌调查》节选为对象,探索AI在文献整理与传播中的应用(见图1)。首先,利用Tesseract OCR工具对原始扫描图像进行文字识别,印刷体文献识别准确率达95%,但部分影印质量不佳的页面需人工校对以修正约5%的误差,显著提升文字转化效率。其次,采用ChatGPT生成元数据与摘要,提取标题《寻乌县土地与阶级调查》、时间(1930年5月)、地点(江西寻乌县)、关键词(“土地革新”“阶级结构”“苏区建设”)等,生成120字左右的摘要,内容准确、结构完整,具备归档价值。进一步,通过AI模型进行语义分类,将节选归为“土地斗争与阶级结构”类别,人工复核确认分类准确,提升了文献归档的智能化水平。为增强传播效果,基于Wix平台设计了主题页面,集成原始文献与OCR文本对照、AI摘要与关键词展示、时间轴与地图标注、评论与投票等互动模块,融合多媒体元素,初步反馈显示对青年群体有较强吸引力。实验数据表明,OCR准确率95%,AI摘要关键词5个,人工校正比例控制在5%以内,分类结果与人工一致,验证了AI在语义判断的辅助价值。

Figure 1. The AI-assisted organization and dissemination flowchart of Xunwu Investigation

1. 《寻乌调查》AI辅助整理与传播流程图

本案例表明,AI工具在文献识别、信息提取与传播内容设计等方面具备良好适应性与实用性。OCR提升了文字转化效率,ChatGPT在元数据生成与语义归类中表现出较强能力。通过在传播样页中引入多元媒体与交互功能,可以强化信息呈现效果,激发受众参与热情,从而更好地增强红色文化的时代传播力。未来应进一步结合AI与数据库系统,构建更高效、更智能、更开放的红色文献整理与传播体系。

4. 红色文献的数字化传播机制研究

红色文献的数字化传播不仅是档案资源利用的延伸,更是红色文化“活起来、动起来、传出去”的关键环节。赣南红色文献内容深刻、情感真挚,具有鲜明的时代意义与教育价值。但若传播机制落后、表达方式陈旧,则难以激发公众的兴趣和参与,特别是在新媒体快速迭代的今天,传统的“静态上传、平铺直叙”传播模式,已无法满足多元化受众的内容消费需求。本章以赣南红色文献为切入点,从传播平台分析、内容表达设计到AI辅助传播实践等方面,探索提升红色文献传播效能的路径与方法。

4.1. 现有红色文化传播平台分析

目前,国内红色文化数字平台建设已取得一定成效,如“学习强国”平台开设了“红色档案”专栏,“国家哲学社会科学文献中心”“中国共产党历史展览馆”等也提供了部分红色资源数据库。这些平台在权威性、内容广度上具有明显优势,但也普遍存在资源更新缓慢、受众黏性不足、用户体验较差等问题。

辛莉研究了公共图书馆在红色文献传播中的作用,指出数字化平台需提升用户参与度[10]。赣南地区近年来也初步搭建了一些红色文化数字展示平台,如地方党史馆官网、“红色赣南”微信公众号等,但整体传播形态以公告式发布与专题汇编为主,缺乏互动功能,页面设计相对传统,难以吸引年轻群体持续关注。部分平台虽有多媒体元素嵌入,但内容割裂,未形成完整叙事链,用户无法建立清晰的知识地图。此外,红色文献传播尚未真正实现智能推荐、个性化推送与知识链接等功能,在“好内容如何有效触达”的问题上仍面临挑战。

4.2. 数字传播内容设计与样例开发

要实现红色文献的高质量传播,内容设计必须兼顾学术性与传播力,注重故事化表达与视听融合。本文以“赣南红色人物小传”为题,尝试构建主题微页面,选取若干具有代表性的文献条目(如烈士遗书、会议笔录、长征口述片段等),结合AI生成摘要、关键词与情感标签,重构叙述结构,使其更贴近公众阅读习惯。

内容层面,文献页面引入“时间轴 + 地理标注 + 人物关系图”的设计方式,突出事件的历史脉络与空间场景;视觉层面,采用Wix平台搭建响应式网页,将文字、图片、音频、视频等媒介融合,增强沉浸感与可视化表达;交互层面,通过评论区、投票功能、小测试等方式,激发用户参与热情。初步测试显示,该种形式更易引发青年用户的兴趣和传播意愿,有助于实现红色文化“由读到用、由感动到行动”的价值转化。

4.3. AI辅助下的传播策略与路径优化

人工智能技术不仅能用于文献整理,在内容传播中也展现出重要潜力。ChatGPT等语言生成模型可用于文献摘要生成、标题优化、宣传文案撰写,帮助提高内容吸引力与传播效率;图像识别工具可自动为历史图片生成描述,增强图文匹配度;语音合成技术可将烈士书信、会议纪要等文本转换为音频,拓展红色文化传播的听觉渠道。

基于AI的用户行为分析还能捕捉受众偏好,为红色文献推送机制提供数据支撑,实现“以用户为中心”的精准传播策略。例如通过分析用户点击路径与浏览停留时间,优化文献内容推荐逻辑,提升传播转化率。此外,AI还可用于监测传播过程中的反馈评论与公众情绪,辅助平台进行内容运营与风险防控。

在传播路径设计上,建议结合AI能力构建“多端联动、语义驱动、可视互动”的传播新生态。具体做法包括:打造聚合型红色资源数字平台,实现资源统筹管理;开发面向高校和青少年的“红色文献轻阅读”移动端小程序;利用短视频平台开展“AI讲红色故事”系列推广,将文献内容以智能主播或AI叙述方式展现,提升亲和力与话题性。

总体来看,AI辅助技术在红色文献的数字传播中具备广阔的应用前景,不仅可解决人工处理能力不足的问题,更可引导传播内容从“静态呈现”走向“动态互动”,从“被动接收”转向“主动参与”,推动赣南红色文化的创造性转化与创新性发展。

5. 实践反思与应用前景

5.1. AI工具在整理与传播中的优势与局限

在赣南红色文献的档案整理与数字化传播实践中,AI工具展现出显著的优势,同时也暴露出一定的局限性。优势主要体现在以下几个方面:首先,AI技术在OCR识别和文本处理方面大幅提升了文献数字化的效率,尤其对于保存状态不佳、字迹模糊的红色文献,OCR工具(如Tesseract或基于深度学习的商业OCR模型)能够快速完成文字提取,减少人工校对的工作量。其次,AI的自然语言处理(NLP)功能,如语义分析和关键词提取,支持元数据生成和文献分类,显著提高了整理的自动化程度。例如,通过ChatGPT或类似模型,可以快速生成文献摘要或关键词,辅助构建结构化档案数据库。此外,AI在传播环节的推荐算法和内容优化功能,能够根据用户兴趣精准推送红色文化内容,增强传播效果。

然而,局限性同样不容忽视。首先,AI工具对赣南红色文献的特殊性(如方言词汇、历史背景复杂性)识别能力有限,可能导致语义分析偏差或关键词提取不准确。其次,AI处理非标准化手写文献或破损文献时,准确率仍需人工辅助校对,增加了额外成本。此外,AI工具的部署和维护需要较高的技术门槛和硬件支持,对于地方档案机构而言,可能面临资金和人才短缺的制约。最后,AI生成的内容在文化敏感性方面可能存在偏差,需人工审查以确保红色文化的政治正确性和历史准确性。

5.2. 实践操作中的关键经验总结

通过本课题的实践探索,总结出以下关键经验:第一,工具选择需因地制宜。在赣南红色文献整理中,优先选择开源且易上手的AI工具(如Zotero用于文献管理、Tesseract用于OCR识别),以降低技术门槛和成本。第二,人工与AI协同至关重要。AI工具虽能提升效率,但在处理复杂历史文献时,需结合专业档案人员的知识背景进行结果校对和优化。第三,数字化传播需注重用户体验。在设计传播样例页面时,结合微信公众号或Wix等平台,注重内容的简洁性和互动性,以吸引年轻用户群体。第四,数据安全与伦理问题需提前考虑。在AI处理敏感红色文献时,应建立严格的数据加密和访问权限机制,避免信息泄露或不当使用。第五,跨学科合作是成功关键。联合档案学、计算机科学和传播学专家,能够更好优化AI工具的应用效果。

5.3. 对地方红色文献资源开发的启示

本课题的实践为地方红色文献资源的开发提供了以下启示:首先,技术赋能是未来方向。AI技术在文献整理与传播中的应用潜力巨大,地方档案机构应积极引入AI工具,结合地方特色制定数字化方案。其次,注重区域特色的传播策略。赣南红色文献蕴含丰富的革命历史内涵,应通过数字平台(如专题网站、短视频等)打造具有地方辨识度的文化IP,吸引更广泛受众。第三,推动资源共享与开放。通过构建区域红色文献数据库,并与全国性平台(如“红色文化资源库”)对接,实现资源整合与共享,提升赣南红色文化的传播影响力。第四,培养复合型人才。地方档案机构需加强AI技术与档案学知识的融合培训,培养既懂技术又熟悉红色文化的专业人才。最后,政策支持与资金投入不可或缺。地方政府应出台专项扶持政策,为AI辅助的红色文献整理与传播提供资金和技术保障。

6. 结论

本课题以赣南红色文献为研究对象,结合人工智能(AI)辅助技术,系统探索了档案整理与数字化传播的实践路径,旨在推动红色文化资源的保护、传承与活化利用。通过对赣南红色文献的全面调研,发现其作为中国革命重要策源地的历史遗产,涵盖了瑞金中央革命根据地、兴国模范苏区、于都长征出发地等关键历史节点的丰富文献资源,包括书信、手稿、报刊、宣传材料等多种载体。然而,受限于传统整理方式,这些文献面临分散存储、检索不便、保存环境恶劣和数字化程度低等问题,限制了其学术价值与社会影响力的发挥。AI技术的引入为解决这些问题提供了新路径。在文献整理中,OCR识别、自然语言处理(NLP)和元数据生成等AI工具显著提高了数字化效率,尤其在处理标准印刷文献时,展现出快速提取文本、自动生成摘要和关键词的优越性。然而,对于手写或破损文献,AI工具的识别精度仍需人工校对辅助,显示出技术应用的边界。在数字化传播方面,现有红色文化传播平台在内容呈现、用户互动和受众覆盖上存在不足,AI通过精准推荐算法和内容优化功能,能够有效提升赣南红色文献的传播效率,吸引更多年轻群体关注革命历史。研究还表明,档案学、传播学与AI技术的跨学科融合,不仅提升了整理与传播的效率,还为地方红色资源开发提供了可复制的实践范式,为全国类似区域的红色文化数字化工作提供了借鉴。

本研究的理论贡献在于将AI技术引入红色文献整理与传播领域,突破了传统档案学的单一研究视角,构建了档案学、数字人文与人工智能的交叉融合框架,为人文社会科学与新兴技术的结合提供了理论参考。通过引入AI工具如Zotero、Tesseract和ChatGPT,探索了“识别–提取–标注–关联”的全流程整理模式,丰富了数字档案管理的理论体系。实践贡献方面,本课题基于赣南红色文献的实际情况,构建了AI辅助的整理与传播流程框架,通过小规模实验验证了OCR识别、语义分析和传播样例设计的可行性,为赣南及其他革命老区的红色资源开发提供了可操作的实践范式。社会价值上,研究成果推动了赣南红色文化的数字化传播,助力革命精神的传承与弘扬,增强了青年群体的历史责任感与文化认同,为新时代红色资源开发提供了实践样本。然而,研究也存在不足。首先,研究对象局限于赣南地区,未能全面覆盖其他革命老区的红色文献资源,区域代表性有限。其次,受限于当前AI技术的成熟度,工具在处理非标准化手写文献或破损文献时,识别精度和语义分析能力仍需提升,依赖人工干预较多。此外,由于时间和资源限制,数字化传播样例的设计和测试规模较小,未能开展大规模用户测试,影响了成果在实际场景中的验证效果。传播平台的用户体验设计也需进一步结合地方文化特色进行优化。

基金项目

本文为2025年度赣州市社科规划课题“赣南红色文献的档案整理与数字化传播研究——基于AI辅助的实践探索”(项目编号:2025-NDTS08-1638)研究成果之一。

参考文献

[1] 官建生. 地方文献数字化: 中国数字图书馆工程的信息基础[J]. 大学图书情报学刊, 2002(2): 42-44.
[2] 陈晓婷, 黄诗晴. 信息空间理论下的文献遗产数字化传播研究[J]. 档案管理, 2024(2): 48-53.
[3] 冯玲萍. 地方文献档案利用的数字化传播与乡土文化建设[J]. 山西档案, 2025(2): 119-122.
[4] 李建伟. 数字人文视野下红色文献编撰整理与革命记忆建构研究——以广东梅州土地革命档案为例[J]. 图书馆杂志, 2021, 40(7): 89-96.
[5] 杜丽, 杨慧文. 中华民族共同体视域下滇西土司抗战历史档案文献整理发掘研究[J]. 云南档案, 2023(2): 47-50.
[6] 李卓异, 龙和平. 元宇宙视域下红色文献资源聚合服务模式研究[J]. 情报科学, 2024, 42(7): 97-104.
[7] 林虹妤. 赣南苏区红色档案资源开发利用现状及路径研究[J]. 档案学刊, 2022(6): 77-85.
[8] 刘航. 数字人文视域下中国古代档案文献的整理、数字化与学术价值发现[J]. 山西档案, 2025(2): 84-86.
[9] 徐新韵. 中国古代档案文献的整理、数字化与知识化研究[J]. 山西档案, 2024(7): 125-127, 158.
[10] 辛莉. 面向全生命周期的公共图书馆红色文献数字化建设研究[J]. 图书馆工作与研究, 2023(6): 42-48.