1. 前言
2024年10月,国家档案局令第22号公布《电子档案管理办法》自2024年11月1日起施行。《电子档案管理办法》出台是贯彻实施《中华人民共和国档案法》《中华人民共和国档案法实施条例》,确保电子档案管理工作依法依规开展的重要举措,标志着我国电子档案管理工作迈入新阶段。对推动档案事业创新发展,实现档案现代化,具有重要意义[1]。2021年1月1日起施行的《中华人民共和国档案法》第四十一条,国家推进档案信息资源共享服务平台建设,推动档案数字资源跨区域、跨部门共享利用[2]。2024年3月1日起施行的《中华人民共和国档案法实施条例》第四十四条,国家档案主管部门应当制定数据共享标准,提升档案信息共享服务水平,促进全国档案数字资源跨区域、跨层级、跨部门共享利用工作。县级以上地方档案主管部门应当推进本行政区域档案数字资源共享利用工作[3]。《电子档案管理办法》第三十四条,组织机构应当根据不同服务对象和利用范围,建立相应的网络档案数字资源利用服务平台。第三十五条,组织机构应当积极利用人工智能等信息技术,开展编研、展览和建设专题数据库等工作,不断开发档案数字资源。第三十六条,档案主管部门应当推动档案数字资源共享工作,促进跨区域、跨层级、跨部门共享利用[1]。这三条法规对档案信息资源的共享利用工作,从国家档案主管部门到县级以上地方档案主管部门,从建设平台到制定数据共享标准再到开发档案数字资源和促进跨部门共享利用,逐层递进,自上而下,都提出了原则性的规定。高等艺术院校艺术特色档案资源是指在艺术创作、演出、教育、研究等活动中直接形成的,具有保存价值的各类历史记录。艺术特色档案资源具有来源广泛性、载体多样性、内容丰富性、艺术完整性、艺术特殊性等特征,收集难度大,原始资料多,通过跨部门合作深度挖掘,才能实现资源的共享利用。
2. 艺术特色档案资源挖掘方式
艺术特色档案资源的传统获取渠道来源于高等艺术院校各部门在艺术创作、演出、教育、研究、文化交流等工作和活动中产生的各种艺术资料。档案馆获取途径单一,资源利用率不高,不具备独立建设艺术特色资源的优势。《电子档案管理办法》第十条,按照国家规定应当形成档案的机关、团体、企业事业单位和其他组织应履行下列职责:协调档案、文秘、业务、信息化、保密等职能部门共同推进电子档案管理,加强办公自动化、业务系统归档功能建设[1]。通过跨部门合作、主体转换、挖掘沟通渠道调整,构建特色资源、特色专业、特色人才正向循环影响的挖掘生态模式,是艺术特色资源挖掘工作的阶段性目标(见图1)。
Figure 1. Diagram of the positive feedback cycle of characteristic resources, characteristic specialties, and characteristic talents
图1. 特色资源、特色专业、特色人才正向循环生态示意图
2.1. 跨部门合作
艺术特色档案资源的收集挖掘开发利用,需要高等艺术院校多部门的合作,因为每个部门收集的艺术特色资源的侧重点不同,例如档案馆艺术特色资源收集的侧重点在于学校日常的行政办公和大型活动资料,图书馆艺术特色资源收集的侧重点在于学校重点学科、特色专业的各类文献资料,美术馆艺术特色资源收集的侧重点在于学校各画派的藏画藏品,音乐博物馆艺术特色资源收集的侧重点在于各民族的乐器、琴谱、乐谱、音乐文献资料等等。跨部门合作,加强各部门的参与度,有利于资源的整合共享,实现资源的整套性挖掘开发利用。可建立艺术特色档案资源管理委员会或者专门的团队,由档案馆和图书馆牵头建设艺术特色档案资源数据库,信息中心提供技术支持。鼓励全校多部门参与材料收集工作,档案馆负责整理、归档,图书馆为需求者提供利用,美术馆和音乐博物馆进行展览。可根据各部门的工作职责进行科学合理分工,使得艺术特色档案资源收集全面化,归档科学化,挖掘深入化,利用扩大化,展览特色化,实现价值最大化。
2.2. 主体转换
资源挖掘需求主体转变成以利用者为中心。艺术资源作为强应用型资源,其特色资源的挖掘工作应以受众需求为核心,侧重考察利用者的多元需求,从艺术教学、科研和学科发展为出发点,制定适应艺术高校发展需求的艺术特色档案资源挖掘战略。
2.3. 挖掘渠道
不同地区高等艺术院校特色专业和人才结构有较大差异,需要个性化定制挖掘路径,不断拓宽资源获取路径。
2.3.1. 增加需求者资源渠道
首先把包括教师、学生、工作人员等各类型各部门的需求者纳入资源挖掘队伍,把优质需求者资源纳入特色馆藏,例如真人图书馆资源、教师作品资源、毕业生作品资源等,丰富馆藏资源类型;其次,拓展校友资源渠道,利用校庆、专家研讨会、校友联谊活动等契机,挖掘校友资源,尤其是有一定社会地位的知名校友资源;此外,还要充分挖掘社会艺术团体、协会和各类型艺术相关组织的资源。
2.3.2. 深挖课堂资源渠道
首先是艺术特色专业课堂资源、第二课堂资源,以广泛开展的“图书馆讲坛”为例,根据研究热点和艺术研究风向,邀请艺术专家现场授课,搜集动态课堂资源。从反向观察角度,利用艺术特色资源针对性地提供课堂即时文献资料传递服务,能够实现图书馆与课堂的双向良性互动;其次,展览资源及各类型活动资源,做好展后资源的挖掘管理和后续使用,引入电子和实体双向标签融合管理;第三,空间资源,艺术院校发挥艺术设计优势,功能分区规划设计,打造特色空间资源,在特色资源挖掘中同步实现艺术空间教育职能。
2.3.3. 开拓网络资源渠道
首先,开展跨部门的艺术特色资源网络搜集工作,例如,校内与科研处共同开展科研项目知识挖掘管理工作,与图书馆共同管理资源数据和读者数据,与美术馆进行藏品的挖掘展览,与博物馆进行资源共建和共享,与信息中心共同建设管理数据平台;校外与相关文化单位、校企合作单位共同搜集管理网络特色资源;其次,可采用数据抓取与爬虫技术大规模获取互联网上的公开数据资源。通过编写爬虫程序,按照预设规则遍历网页、提取有价值信息,并将其结构化存储。利用搜索引擎、开放获取平台不定期挖掘艺术特色资源;最后,充分发挥和挖掘机构特色数据库资源,开展与机构合作的新途径。
2.4. 资源挖掘沟通方式
鼓励跨部门全员参与模式开展艺术特色资源挖掘沟通,构建网络化、双向、高频、即时性的沟通模式,在资源挖掘建设过程中保持立场、需求、目标、价值认知、感受等多维度的有效互动,及时交换信息。
1) 构建多渠道沟通方式,打通网络沟通渠道,充分利用资源数据库沟通平台以及各种渠道的互动模块进行沟通。
2) 进行资源挖掘方与被挖掘方的双向互动沟通方式,实现资源挖掘和利用的循环沟通,保障互利双赢局面。
3) 高频次沟通模式,尤其是决策关键期要利用高频次沟通模式开展对话,实现沟通过程的多元主体协同工作,确保资源挖掘路径的高效运转和快速推进。
4) 即时沟通模式,在资源挖掘的全过程进行理念引导、路径引导、实践引导以及最终的成果应用引导。
3. 艺术特色档案资源路径探索和数据库的建设
需求者对艺术特色档案资源质量和辨识度的挑剔角度,才是档案馆持续开展资源建设的可行性方向,高等艺术院校档案馆有必要持续优化资源挖掘路径,以需求带动发展,调整人力队伍建设,充分利用国家法规的推动力以及人工智能时代信息技术,跨部门搭建多功能开放式艺术特色档案资源共建共享数据库。
3.1. 路径探索和调整
1) 重新调配档案馆人才队伍。《电子档案管理办法》第四条,组织机构应当配备必要的设施设备,建立管理机制、制度规范、安全措施、人才队伍,满足电子档案管理需求[1]。资源挖掘路径的调整最根本的是人的调整,电子档案管理人员应当具备相应的专业知识和技能,在既定队伍下进行服务分工转型,重置服务结构,提高人才队伍的信息化技术水平,利用人工智能等信息技术开展特色资源建设挖掘工作,主动挖掘资源需求,将等待服务模式切换成主动服务模式。
2) 利用激励机制保障校内读者资源建设渠道持续生效[4],利用实践活动从内部驱动需求同时;利用有利条件从外部驱动需求,例如提高使用权限、开具证明、颁发证书等;利用团队氛围驱动,通过兴趣小组、研学团队、志愿团队宣传资源挖掘工作。
3) 利用网络交互平台资源和艺术家社交网络拓深挖掘渠道,挖掘独家特藏。利用人工智能技术优化信息氛围和艺术空间,多渠道打造艺术特色资源开放式实时共享空间。
4) 利用新平台、新技术挖掘校内资源。充分应用在线展览、论坛、研讨会、第二课堂、虚拟空间和创作空间资源[5],将需求者对图像、音像的敏感度和兴奋感同步转移到艺术特色资源挖掘工作,用新平台、新技术引导需求者参与档案馆的特色资源挖掘工作,线上平台挖掘管理、线下资源同步收集整理利用。
5) 编制自建艺术特色资源数据库管理使用准则,艺术特色档案资源的整理和归纳需要考虑数据的安全性,包括保证艺术特色档案资源的完整性、可靠性和可信度,要保障艺术特色资源知识产权,建设艺术特色资源版权保护中心,规范开放获取、交流、改编、整合权限,标准化管理版权、许可、协议等文件,从信息安全保障角度为资源挖掘工作加锁,确保艺术特色档案资源在传输、存储和访问过程中的安全。
6) 利用服务、挖掘实践、技能培训相结合的模式,开展个性化定制知识服务,在制度范围内探索可行的创收渠道,持续拓展行动空间和资源挖掘主动性。
3.2. 平台设计和搭建
目前主要依托数字资源管理系统进行艺术特色数字资源的挖掘和管理,系统可收集包括文本、图像、音频、视频等类型的资源,具备数字资源的采集、数据存储、资源分类标识、检索、资源共享和保护等功能,用于优化艺术品、文物、图片、视频等特色资源挖掘数据管理,平台系统化建设和管理。[6] (见图2)
3.2.1. 艺术特色资源挖掘管理平台主要功能
① 资源采集与整理,负责从各种渠道获取数字特色资源,并进行整理、归档、处置。
② 资源存储与管理,提供统一的资源存储库,支持对资源的存储、检索、分享和权限管理。
③ 资源编辑与加工,允许用户对资源进行编辑、修饰、裁剪等处理,以满足不同需求。
④ 资源分析与统计,通过数据分析技术,对资源的使用情况、流行趋势等进行统计和分析。
⑤ 用户管理与权限控制,设定不同用户的权限和角色,保障系统安全和合规性。
3.2.2. 艺术特色资源挖掘管理平台核心功能模块
① 资源管理模块。用于管理各类资源,包括文档、图片、视频等,提供上传、下载、查看、编辑等功能。具备非结构化数据、互联网开放资源集成功能,整合现有数字资源,实现资源汇聚、互联互通,智能化管理知识空间;
② 权限管理模块。用于管理用户的权限,包括用户角色设置、权限分配、访问控制等,确保系统安全稳定运行;
Figure 2. The module diagram of the characteristic resource mining management platform
图2. 特色资源挖掘管理平台模块示意图
③ 搜索与检索模块。提供快速准确的资源搜索和检索功能,支持关键词搜索、高级搜索等方式;
④ 统计与分析模块。对资源的使用情况进行统计与分析,生成报表和图表,帮助用户了解资源的利用情况;
⑤ 通知与提醒模块。及时向用户发送通知和提醒,包括系统消息、任务提醒等,保证用户及时获取重要信息;
⑥ 用户界面模块。提供友好的用户界面,包括页面设计、交互设计等,提供资源展示大屏、资源应用大屏、个性化大屏等界面,保证良好的用户体验;
⑦ 语义理解。通过NLP技术对用户的搜索关键词进行语义理解,识别用户真正的需求,精准打造更适应读者需求的个性化沟通细节语义空间;
⑧ 智能搜索。基于语义理解结果,采用智能搜索算法对系统中的资源进行智能匹配和排序,提供符合用户需求的搜索结果;
⑨ 个性化推荐。根据多因子推荐算法,综合访问记录、搜索记录、活跃资源和个人偏好等因素,利用推荐系统算法对用户进行个性化分析,进一步做好特色资源需求者画像工作,推荐相关资源或活动,实现资源找人,个性化资源智能推送。
3.2.3. 艺术特色资源挖掘管理平台的软件架构
艺术特色资源挖掘管理平台的软件架构一般采用分层架构或微服务架构,在编程技术方面的技术栈包括:
① 后端开发。后端开发可选择使用Java、Python、Node.js等语言开发的成熟稳定的开源框架,例如Spring Boot、Django等。人工智能应用集成使用百度、阿里云、腾讯及华为云等人工智能开放平台,开放平台提供多种方式的API接口调用和丰富的工具库,实现系统的NLP能力,满足各种文本交互智能需求。NLP技术在资源智能检索过程中的应用流程主要包括以下步骤(见图3):
Figure 3. Schematic diagram of the process of natural language processing query retrieval
图3. 自然语言处理查询检索流程示意图
文本解析:通过词法分析、句法分析等技术将用户的自然语言查询转化为计算机可以理解的结构化查询语言。
语义分析:在文本解析的基础上,进一步理解用户的意图和上下文,从而提供更准确的搜索结果。语义分析包括词义消歧、语义角色标注、情感分析等任务,可以帮助系统理解查询的真实含义。
信息抽取:从解析和语义分析后的文本中提取有用的信息,如实体、关系、事件等。这些信息可以用于后续的搜索和匹配操作。
命名实体识别:在文本中识别和分类专有名词,如人名、地名、机构名等。这有助于搜索引擎更好地理解用户的查询意图,并正确解析相关信息。
查询扩展:根据用户的查询意图和上下文,对原始查询进行扩展和重构,以获取更全面的搜索结果。这可以通过同义词替换、短语扩展、概念扩展等方式实现。
搜索结果排序:根据一定的算法和模型,对搜索结果进行排序,以将最相关、最有用的结果展示给用户。排序算法可以考虑多种因素,如查询与文档的匹配程度、文档的重要性、用户的个性化需求等。
② 前端开发:前端开发主要使用HTML、CSS、JavaScript等技术,常用的前端框架有React、Vue.js等;
③ 数据库。数据库可使用关系型数据库(MySQL、PostgreSQL),非关系型数据库(MongoDB、Redis);
④ 安全技术。系统安全方面需要采用加密技术、防火墙、身份认证等手段保障数据安全,与统一身份认证平台对接等;
⑤ 部署与运维。系统部署采用容器化技术(如Docker、Kubernetes),并结合自动化运维工具(如Jenkins、Ansible)进行持续集成与部署。
3.3. 智能化技术的运用
《电子档案管理办法》第六条,组织机构应当积极应用新一代信息技术,不断提升电子档案管理水平[1]。跨部门搭建多功能开放式艺术特色档案资源共建共享数据库,要积极运用新的智能化技术。
3.3.1. 运用智能化技术,实现特色档案资源的智能收集
利用网络爬虫技术,对学校官网、应用系统、二层机构的网站以及其他档案信息的关联网站或者系统,对文字、图片、音视频等全校的信息数据进行抓取,并对抓取的信息数据进行自动的清洗和处理,形成档案素材。通过自然语言处理(Natural Language Processing,简称NLP)技术,利用机器自动学习分类成果、分类特征表现、规则等,对分类数据优化调整,进而实现自动的分类模型,通过模型对新的档案数据类别进行预测。
3.3.2. 运用智能化技术,实现特色档案资源的智能整理
利用通过光学字符识别(Optical Character Recognition,简称OCR)技术和自然语言处理技术,自动识别和提取电子文档中的文本内容,并根据预定义的规则进行分类和归档,同时,利用机器学习算法,可以根据历史数据和用户反馈,自动学习并优化文档分类规则,提高分类的准确性和效率。通过优化机器学习模型,自动识别档案的类型、重要性等级,甚至预测其可能的利用需求,从而进行智能归档。通过自然语言分析算法,匹配查询同类档案之间的关联关系,形成“档案信息关系网”。基于档案的多个元数据维度标注信息,可针对档案数据生成“可视化知识图谱”,以图像为实体同时构建实例,直观展示全部档案数据之间的逻辑关系。
3.3.3. 运用智能化技术,实现特色档案资源的智能检索
根据用户的检索记录和行为习惯,结合指定词库,对检索热词词频进行排名,为用户提供个性化的档案资源推送服务,利用图表、时间线等可视化工具,直观展示档案资源,优化用户体验。提供多种检索方式,如人物检索、音视频检索、图片检索等。其中,人物检索可以通过搜索人名来检索出现在某张照片或视频档案中的人物资料;音视频检索则可将人类语音中的词汇内容转换为计算机可读的输入,并对语音信息进行文字的转写,实现对音视频内容的检索;图片检索则通过图形特征建模等手段将图像格式文件纳入可检索范围,支持对照片中的人物进行建模和定位。
4. 结束语
《电子档案管理办法》第六章对电子档案开放与利用进行了总括式和原则性的规定,给高等艺术院校艺术特色档案资源跨部门建设研究提供了宏观的指引,在此背景下,跨部门合作搭建艺术特色档案资源共建共享数据库,对艺术特色资源知识化管理,积极利用人工智能信息技术,能有效细分资源类型和区分需求者群体,精准锚定受众需求,更有利于挖掘高品质艺术特色资源,开展编研、展览和建设专题数据库,实现艺术特色档案价值,提升服务社会、教育教学、科研创新、文化传承的作用。
综上所述,为了推动高等艺术院校艺术特色档案资源的跨部门建设,我们必须积极创新档案工作的理念、方法和模式。首先,在理念上,要打破传统的思维定式,引入先进的档案管理理念,确保档案工作与时俱进。在方法上,应采用多样化的手段,结合实际情况灵活运用,以提高档案管理的效率和效果。在模式上,要探索建立适应新时代需求的档案管理模式,确保档案资源的科学管理和高效利用。其次,加强跨部门合作是关键所在。各部门之间应打破壁垒,建立紧密的合作机制,实现资源共享和信息互通,形成合力,共同推进艺术特色档案资源的建设。此外,充分利用数智科技赋能也是不可或缺的一环。通过引入大数据、人工智能等先进技术,对档案资源进行数字化处理和智能化管理,提升档案资源的利用价值和便捷性。
最后,加快全面数字转型和智能升级步伐,是确保艺术高校特色档案资源高质量发展的必由之路。通过全面推进数字化转型,实现档案资源的数字化存储、传输和利用,同时借助智能化手段,提升档案管理的智能化水平,从而为艺术高校的特色档案资源建设注入新的活力,实现其高质量发展目标。