基于非遗知识图谱的文旅研学路径研究
Research on Cultural Tourism Study Path Based on Intangible Cultural Heritage Knowledge Graph
DOI: 10.12677/hjdm.2025.152009, PDF, HTML, XML,   
作者: 张闫旭, 李征宇:沈阳建筑大学计算机科学与工程学院,辽宁 沈阳
关键词: 知识图谱非物质文化遗产文旅研学Knowledge Graph Intangible Cultural Heritage Cultural Tourism Research and Study
摘要: 科学技术的迅猛发展正在重塑文旅融合的生态格局。作为一种前沿的数字化技术手段,知识图谱在文旅融合中展现出独特的潜力。本文聚焦于内蒙古国家级非物质文化遗产及特色景点,旨在深入探讨知识图谱在研学实践中的应用价值及其初步实现路径。具体而言,通过综合运用数据采集、整理,知识表示及可视化展示等先进技术,实现对非遗资源与研学内容的深入挖掘与系统整合。通过促进文旅资源与非遗文化的精准匹配与高效利用,开辟一条促进文化传承与经济发展的新路径。对于研学领域以及区域经济的发展进行多重赋能。
Abstract: The rapid development of science and technology is reshaping the ecological pattern of cultural and tourism integration. As a cutting-edge digital technology, knowledge graph shows unique potential in the integration of culture and tourism. Focusing on Inner Mongolia’s national intangible cultural heritage and characteristic scenic spots, this paper aims to deeply explore the application value of knowledge graph in research and study practice and its preliminary realization path. Specifically, by comprehensively using advanced technologies such as data collection and collation, knowledge representation and visual display, the in-depth exploration and systematic integration of intangible cultural heritage resources and research and study content are realized. By promoting the precise matching and efficient utilization of cultural and tourism resources and intangible cultural heritage, a new path is opened up to promote cultural inheritance and economic development. It empowers multiple aspects of the research and study field as well as regional economic development.
文章引用:张闫旭, 李征宇. 基于非遗知识图谱的文旅研学路径研究[J]. 数据挖掘, 2025, 15(2): 107-116. https://doi.org/10.12677/hjdm.2025.152009

1. 引言

发展研学事业的政策自2013年提出以来,至2024年经历了多次关键性发布与调整,形成了显著的发展轨迹。在2022年国务院印发的《“十四五”旅游业发展规划》中,明确倡导了“以文塑旅,以旅彰文”的发展理念[1]。人们精神文化需求的日益增长,共同推动了研学教育从边缘向核心地位的转变。在这一过程中,对文化深度的追求成为了研学的重要特征。我国拥有丰富的非物质文化遗产资源,如何有效利用这些资源,通过更加全面、深入的方式,实现“知”与“行”的深度融合,是当前面临的重要课题。

本研究旨在通过知识图谱技术深入探索内蒙古地区国家级非物质文化遗产项目(以下简称“非遗项目”)与文旅融合的深厚内涵与独特价值,不仅促进研学的深度与广度发展,更致力于构建一个以非遗为核心的文化传承与创新体系,从而推动省级乃至更广泛区域内文化生态的升级与优化。

2. 研究现状

知识图谱的概念最早由计算机科学家John F. Sowa提出[2],他将知识图谱定义为一种表示方法,用于将现实世界中的实体、概念和关系进行结构化表示。随着语义网络和本体论的发展,知识图谱逐渐深化为以图形方式呈现知识之间关联关系的技术[3]。2012年Google推出知识图谱项目,使知识图谱进入大众视野。而认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义WEB、数据挖掘与机器学习等多种技术使知识图谱的研究和应用得到了快速发展。目前,知识图谱已经广泛应用于搜索引擎、智能问答、大数据分析与决策等领域,并且GPT系列模型也在一定程度上涵盖了知识图谱的概念。

知识图谱在文化遗产保护、教育旅游等领域展现出巨大潜力。通过构建知识图谱,可以将非遗的各类信息与当地文旅信息进行结构化表示和关联,形成系统化的知识资源。具体而言,2013年以前的非遗研究主要聚焦于理论类、定性化的研究,2013年以后逐渐将重点转向了活态传承和数字化保护的探索[4]。近三年来研究视角进一步拓宽开始倾向于探讨非遗的多维保护、文旅融合视角下非遗的创新与价值提升等问题[5]。例如,“河南非遗一张图”就是知识图谱在非遗与文旅融合的应用典范[6]。该项目通过整合河南省非遗资源,构建了全面的非遗知识图谱,并借助AIGC地图、AIGC百科等平台进行展示和传播。学生就可以通过研学旅行的方式,亲自参观非遗项目并借助知识图谱深入了解其文化内涵和传承方式。对于内蒙古地区的非遗研究,近年也逐渐将研究重点集中于非遗与自然环境、文化传统和社会关系的相互作用以及不同文化历程的兼容并蓄[7]

综上所述,本文拟定的研究方向与目前的研究热点契合度较高,不仅有助于非遗的保护和传承,也为研学旅行提供了丰富的知识支持,同时为区域文化生态和经济发展提供新思路。

3. 知识图谱构建

在知识图谱中,语义网络、RDF三元组、实体关系图共同支撑起了一个复杂而精细的信息架构[8]。这些形式不仅定义了知识的结构,还赋予了知识关联性和可查询性。其中,图模型作为知识图谱的逻辑表达方式,以其直观性与易理解性,成为人们最容易理解的一种知识表示。在这一模型中,“实体–关系–实体”三元组作为基本构建单元[9],通过明确实体间的联系与属性,构建起了一个个紧密相连的知识节点,组成一张庞大的知识网络。

本文聚焦于非遗与研学相关信息,深入剖析两者间的内在联系与知识构成,从非遗项目的文化底蕴出发,结合研学活动的实际需求,梳理知识建构的逻辑脉络。在构建知识图谱的过程中,采用自底向上的技术方式,即首先收集并整理大量分散的、碎片化的数据资源,然后通过数据清洗、实体识别、关系抽取等一系列技术手段,逐步构建起一个结构清晰、层次分明的知识体系[8]。构建框架见图1

Figure 1. Flowchart of knowledge map construction

1. 知识图谱构建流程图

3.1. 数据收集

数据采集是进行研究的关键环节,必须遵循多渠道、多层次的原则,最大限度地覆盖所有可能的数据来源,从而保障数据的全面性和准确性。采集数据主要包括结构化、半结构化、非结构化等类型,如表1所示:

Table 1. Table of data collection types

1. 数据采集类型表

数据类型

数据形式

数据处理难易度

结构化数据

结构完整的表格记录

格式固定、易于处理

半结构化数据

如XML、JSON等格式的文档

提取过程相对复杂

非结构化数据

如文本、图片、音频、视频等

内容繁杂,难以直接应用于分析

但无论哪种类型的数据都需要从数据源中获取实体、属性、关系等信息,构建实体–关系–属性或实体–关系–实体的三元组形式。数据源的知识抽取方式如图2所示。

Figure 2. Knowledge extraction method diagram

2. 知识抽取方式图

3.2. 初始知识图谱构建

3.2.1. 确定核心实体与关系

从结构化数据中可抽取关于内蒙古地区A级景点的核心信息。这些元实体包括景点的具体名称,作为识别不同景点的唯一标识;以及景点的等级,反映了其旅游价值和接待能力。同时,记录每个景点的地理位置信息,即经度和纬度,这些属性对于后续的地理空间分析、旅游路线规划等应用至关重要。

从非结构化数据中抽取了与研学活动紧密相关的元实体包括研学方式和研学主题。

3.2.2. 建立实体间关系

将研学方式与研学主题相关联,表明某种方式适用于某个或某些主题。将研学主题与景区类型相关联,表明某个景区适合作为某个或某些主题的研究对象或实践场所。

3.2.3. 元语义结构确定

根据上述数据方案,在不考虑非遗实体的情况下,依据其他具体元素进行数据整合与关联,确定了初步元数据的语义结构,明确知识图谱的实体、关系和属性,通过逻辑清晰的关系网络相互连接,构成了初始的节点–边–节三元组,具体如图3

图3可知,图谱的结构基本清晰,能够反映出研学方式、研学主题以及景区之间的主要关系。研学方式与研学主题之间的关联明确。同时,研学主题与景区之间的关联也建立了明确的实践场所对应关系,使得用户能够直观地了解到各个景区所承载的研学价值。

然而,图谱也存在一些不足之处。首先,部分关系表达可能略显简单,缺乏足够的细节描述,这可能导致用户在深入理解研学内容时遇到一定的困难。其次,图谱中某些节点的信息相对单一,缺乏足够的文化内涵输出,这在一定程度上影响了图谱的完整性和易读性,同时弱化了研学教育中的开展价值[10]

基于以上评估结果,提出相应的优化策略:引入非遗相关节点。

Figure 3. Initial meta-semantic structure diagram

3. 初始元语义结构图

3.3. 引入非遗相的知识图谱

3.3.1. 确定非遗实体

对于从半结构化数据中筛选出的内蒙古地区的106个国家级非遗项目,确定了非遗项目的名称、类别、保护单位、所属地市及相关传承省市等基本实体信息,还进一步细化了项目的公布时间、项目序号、类型以及相关的传承人等属性。对于所属地市、保护单位这两个特殊实体,我们还额外抽取了其经度和纬度信息,这样的附加属性使得非遗项目与地理位置之间的关联更加紧密。

3.3.2. 建立非遗与研学的关系

首先,通过非遗项目的类别匹配合理的研学方式,从而将非遗项目与研学主题相关联,表明非遗是研学的重要内容之一。

其次,在非遗项目与景区建立关联的过程中,地理位置的计算是关系抽取的关键,经纬度是经度与纬度的合称组成一个坐标系统,利用三维空间的球面来定义地球上的空间的球面坐标系统,能够标示地球上的任何一个位置。由Haversine公式[11]计算距离,公式见下:

C=2Rarcsin[ sin( latB-latA 2 )+cos( latB )cos( latA ) sin 2 ( lonBlonA 2 ) ] (1)

在式(1)中,latA是景区的经度,lonA是景区的纬度;latB是非遗项目保护单位的经度,lonB是非遗项目保护单位的纬度,R为地球半径。通过构建非遗项目保护单位与研学景区之间的地理维度关系,增加非遗项目对景区的赋能,将非遗元素融入研学知识图谱之中。

3.3.3. 元语义结构确定

最终,调整和完善图谱的布局设计、关系表达及信息呈现,以确保其能够精准反映研学活动的内涵与外延,满足实际应用的需求。最终元数据的语义结构如图4所示。

Figure 4. Final meta-semantic structure diagram

4. 最终元语义结构图

3.4. 知识存储

知识存储直接关系到知识的高效检索、组织与管理。本文采用了Gephi图数据库来展现知识图谱的图结构。Gephish是一款开源的复杂网络分析与可视化软件,拥有强大的图形渲染能力和灵活的交互界面,通过Gephi将知识图谱中的实体(节点)和关系(边)以图形化的方式展现出来,使得知识之间的层次结构和内在联系一目了然。

3.5. 知识图谱呈现

本文构建的内蒙研学知识图谱如下图5所示,从数据库信息面板中可以看到共构建了706个节点,

Figure 5. Presentation of knowledge graph

5. 知识图谱呈现图

以及2714个边。图5中,每一个圆圈代表一个节点也就是一个实体,每一条边代表两个节点之间的关系,不同类型的节点有不同颜色。通过这一知识图谱,我们不仅能够清晰地看到内蒙古其文化多元性的具体体现,还能深入探索不同领域知识之间的内在联系与相互影响。对于教育工作者、研究人员以及广大旅游爱好者而言,其能够帮助人们更加全面、深入地理解内蒙古。

对该图谱进行模块化统计分析后,得到的结果如图6所示。由图6可知,该图谱可划分为10个社区结构。从整体上看,模块化指数达到了0.531。最大的社区中大约包含140个节点,最小的社区中也有30个左右。

Figure 6. Modularization result diagram

6. 模块化结果图

4. 研学路径研究实例

在进行研学路径的深入研究与设计时,路径的优化是确保旅行效率和体验质量的关键。利用本研究构建的知识图谱作为核心工具,得以确保研学路径的科学性、系统性和个性化。

4.1. 基础路径规划算法

在路径规划的过程中,采用旅行商问题(Travelling Salesman Problem, TSP)的基础思想。作为一个经典的组合优化难题,其核心在于寻找一条经过所有指定节点且仅经过一次的最短路径,并最终返回到起始点[12]。这种思想在路径规划中得到了广泛的应用,尤其是在需要遍历多个地点并寻求最优行驶路线的场景中。将每个需要研学的景点视为TSP中的一个城市,通过计算它们之间的距离或成本来构建问题模型。在此基础上,利用TSP算法的核心策略,即寻找一条总成本最低的回路,来规划出最优的路径。

4.2. 研究实例

以“包头市”作为研学实例研究的起始城市,进行深入的路径设计实例分析。仅考虑省内研学方式,利用知识图谱可进行如下建构:

首先通过分区优先筛选重要节点,例如:景点、研学地市、非遗项目等。排除其他节点对研学计划的影响。

其次选择相关的邻居网络,保存邻域的深度 = 1。

然后令节点ID = “包头市”、深度 = 1筛选出自我网络得到的结果图如图7所示。

Figure 7. Results of research examples

7. 研究实例结果图

利用知识图谱对包头市及其研学资源进行了检索,明确了研学路径中的关键节点。由图7可知,若考虑跨市研学增加研学的丰富性,附近的地市可考虑呼和浩特市;有三个非遗项目可参与研学内容,丰富文化内涵;并且通过知识图谱的边际关系解析,目前共有59个景点可参与路径设计。

4.3. 研学路径设计

在确定研学路径节点的基础上进行路径规划。在规划时,特别考虑了研学的整体时间以及过程中内容的吸收效果,因此决定只包含五个精选的研学景点。

首先,生成了所有可能的五个景点组合,确保每个景点都能被纳入至少一条路径中,为后续的路径优化提供选择空间。然后,利用旅行商算法,根据各景点之间的实际距离,计算出了每一条路径的总长度[13]。最后,选取了前20个最短路径进行后续的评价和选择。

这些路径在保持较短旅行距离的同时,也充分考虑了研学内容的连贯性和丰富性。通过综合评价每条路径的其他因素,进一步筛选出最优的研学路径,为研学团队提供最佳的旅行选择。

4.4. 综合评价与筛选

在已经生成并筛选出20条研学路径的基础上,进一步构建最优路径评价框架,从这些候选路径中挑选出最为理想的选择。该评价框架需涵盖了多个关键维度,确保所选路径不仅能够有效提升研学活动的效率,还能充分保障参与者的体验质量和教育价值[14]。研学路径研究评价指标体系的框架如表2

首先,根据每条路径的总旅行时间进行了初步评估。通过对比不同路径所需的时间成本,我们可以直观地了解到哪些路径更为紧凑高效,有助于减少旅途中的疲劳感,为研学活动保留更多的精力。

其次,深入分析了每条路径所覆盖的研学景点及其特色。通过评估各景点的文化价值以及与实际研学目标的契合度,确保所选路径能够充分满足研学活动的核心需求。

此外,还特别关注了路径中的文化内涵。通过考察沿途的非遗项目赋能情况,为每条路径的内涵性进行打分,如包头市现有的三个国家级非遗项目有两项的保护单位距离“包头科学技术馆”较近,因此在研学到科技馆时,有非遗项目可以丰富研学内容,可以提高评分。

Table 2. Research path research evaluation index system table

2. 研学路径研究评价指标体系表

一级指标

二级指标

具体内容

研学内容科学性

内容丰富性

研学内容是否涵盖了多个学科领域,具有广泛的知识性和趣味性。

内容准确性

研学内容是否科学、准确,无错误或误导性信息。

内容实用性

研学内容是否贴近生活实际,具有实际应用价值。

研学路径合理性

路径连贯性

研学路径是否清晰、连贯,有助于学生逐步深入探究。

路径多样性

研学路径是否包含多种学习方式,如观察、实验、讨论等,以满足不同学生的学习需求。

路径灵活性

研学路径是否具有一定的灵活性,可根据实际情况进行调整和优化。

研学资源有效性

资源丰富性

研学资源是否丰富多样,能够满足不同学生的学习需求。

资源可持续性

研学资源是否具有可持续性,能够长期为研学活动提供支持。

研学文化内涵

非遗赋能

在研学过程中是否有非遗项目对活动内容进行赋能,对学生有思想上的影响。

4.5. 最优研学路径确定

经过综合评价和筛选,我们最终确定了三个最优的研学路径。这些路径在保持较短旅行距离和时间的同时,充分考虑了研学地点的丰富性和多样性,为研学团队提供了多样化的选择。具体路径如表3

Table 3. Research path results table

3. 研学路径结果表

索引

研学路径

优秀率

路线1

包头花舞人间旅游景区–美岱召旅游区–包头科学技术馆–赛汗塔拉城中草原–百灵那达慕园区旅游区

80%

路线2

包头市黄河谣文化旅游区–包头科学技术馆–南海湿地景区–包头古城文化旅游景区–戎王羊绒文化产业园旅游区

74%

路线3

包头花舞人间旅游景区–塞外桃园生态旅游区–包头科学技术馆–包头古城文化旅游景区–戎王羊绒文化产业园旅游区

73%

5. 结论

通过引入知识图谱技术,以期实现非遗文化和研学模式的深入融合。优化研学资源的配置效率以及文旅资源的整合和共享,为区域经济的发展提供新路径。主要表现为以下几个方面:

文化价值挖掘与阐释:运用多学科交叉的理论与方法,深入挖掘内蒙国家级非遗背后的文化意义、历史渊源及社会功能,阐释其在当代社会的独特价值,为文化研学的内容构建提供坚实的理论基础。

研学模式创新与优化:基于知识图谱等现代信息技术手段,创新研学模式,设计非遗融合线上线下、理论与实践相结合的多元化研学路径,提升研学活动的趣味性、互动性和实效性,促进学习者的深度参与和主动学习。

文化传承生态构建:通过本研究,促进非遗保护与传承的社会共识形成,构建政府、学界、业界及公众共同参与的非遗文化传承生态。推动非遗项目与学校教育、社区活动、旅游开发等深度融合,实现非遗文化的活态传承与创新发展。

文化升级与区域发展联动:以内蒙国家级非遗为引领,推动省级文化资源的整合与升级,形成具有地域特色的文化品牌和文化产业链。同时,探索非遗文化对区域经济发展的推动作用,实现文化繁荣与经济振兴的良性互动[15]

然而本研究仍存在一定局限,一方面,研究范围仅限于内蒙古国家级非遗项目以及A级景点,数据源的局限性可能导致研究结果难以全面反映更广泛区域的实际情况;另一方面,在关联实体关系时,采用的理想化情况与实际应用的契合度可能存在偏差,可能影响路径运用的准确性;此外,随着研学领域的不断发展,一些新的研学方式、主题可能尚未被纳入图谱,为未来研究预留了改进与拓展的空间。

致 谢

在此衷心感谢所有在我研究过程中提供无私指导和宝贵帮助的指导者们,赋予我转载和引用权的资料、图片、文献的作者们,是你们的支持让我的研究得以顺利进行,使我的研究能够站在巨人的肩膀上,看得更远,想得更深。也让我深刻体会到了科研的魅力和价值。未来,我将继续秉承感恩之心,勇往直前。

参考文献

[1] 国务院关于印发“十四五”旅游业发展规划的通知[J]. 中华人民共和国国务院公报, 2022(5): 28-46.
[2] 杨竹. 从C.S.Peirce的存在图表到JohnF.Sowa的概念图表的形成来看人工智能的应用和发展[J]. 计算机与现代化, 2002(5): 16-20.
[3] Singhal, A. (2012) Introducing the Knowledge Graph: Things, Not Strings.
https://blog.google/products/search/introducing-knowledge-graph-things-not/
[4] 刘晓平. 2003-2021年国内外非遗研究文献计量分析[J]. 重庆文理学院学报(社会科学版), 2023, 42(2): 41-54.
[5] 刘庆旭. 近三年国内非遗研究动态报告[J]. 非遗传承研究, 2024(3): 8-11.
[6] 郝晓静. 非遗档案数字化保护及传播策略——以“河南非遗一张图”建设为例[J]. 人文天下, 2023(8): 4-10.
[7] 姚琨. 内蒙古非物质文化研究热点与前沿——基于知识图谱可视化分析[J]. 中国高新科技, 2022(24): 151-152+155.
[8] 范青, 史中超, 谈国新. 非物质文化遗产的知识图谱构建[J]. 图书馆论坛, 2021, 41(10): 100-109.
[9] 刘峤, 李杨, 段宏, 等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3): 582-600.
[10] 张雪连. 新时期博物馆文物在研学教育中的运用[C]//河南省民办教育协会. 2024高等教育发展论坛暨思政研讨会论文集(上册). 2024: 250-251.
[11] 潘志宏, 万智萍, 谢海明. 跨平台框架下基于移动感知的智慧公交应用研究[J]. 计算机工程与应用, 2018, 54(19): 243-247+260.
[12] 柯贵青. 浅析用模拟退火算法求解旅行商问题[J]. 太原科技, 2008(6): 56-57.
[13] 王亚琼, 王莉, 韩露. 融合动态交通信息的路径规划算法研究[C]//西南财经大学信息技术应用研究所, 《计算机科学》杂志社. 2008中国信息技术与应用学术论坛论文集(二). 2008: 258-261.
[14] 吴绮云. 基于核心素养提升研学旅行学习素养的思路与策略[C]//广东教育学会. 广东教育学会2023年度学术讨论会论文集(六). 2023: 588-595.
[15] 曹晓雪. 文旅融合助推区域经济高质量发展[J]. 当代县域经济, 2024(6): 70-71.