1. 引言
我国旅游业处于供给侧转型的关键时期,旅游消费需求越来越多元,特别是在文化旅游方面,旅游者对文化旅游品质的追求在提升。旅游产品由供给方定义已经过时,旅游产品开始转向由需求方定义,由这些变化产生的一系列新发展要求是供给侧改革中亟待完善和解决的问题。从供给角度对文化旅游进行改革,有助于提升旅游产品品质和文化含量,满足旅游者多重多样的文化体验需求。
文化体验是旅游者文化旅游中重要的内容,是旅游者在旅游活动中对景点参观、了解历史文化、体验民俗风情和自然景观,从而对有形或无形的文化产品进行学习、探索和消费 [1]。如能对旅游者在景点的文化体验程度进行量化测度,得到旅游者文化体验度,可反映出旅游者对于景点文化体验的质量以及景点文化旅游供给水平。
对体验度进行研究的相关文献较少,测度方法多是从心理学角度进行。李普男等(2011)结合无锡影视主题公园调研数据和“期望–满足”模型,构建了涵盖文化氛围、旅游条件、服务、整体感等8个主因子的指标体系,对旅游体验质量进行综合评价,并计算出旅游体验度 [2];彭华明等(2015)基于用户期望与实际感知差距的认知心理差异模型,进行用户体验度量的度量 [3]。如何对体验程度进行评价和测度仍在探讨之中。
大运河流域内具备丰富且厚重的历史文化遗产。2017年6月,习近平总书记作出了要统筹保护好、传承好、利用好大运河资源的重要指示,为推进大运河文化带建设指明了方向。旅游在大运河文化发扬和传承方面扮演着重要角色。2019年,国务院办公厅先后于8月、12月印发了关于文化旅游和有关大运河旅游的意见。2021年8月,国家文化公园建设工作领导小组印发大运河国家文化公园建设保护规划。在国家对大运河保护和利用的新的历史机遇下,研究并推动大运河的文化与旅游的融合发展,对旅游转型升级和实现文化传承具有非常重要的意义。
近期国内对大运河旅游的研究以旅游者感知体验和文化旅游的开发利用现状为主 [4] - [9]。现有文献中,对大运河河北段相关研究较少,同时对景点文化供给和旅游者文化体验的相关研究有所欠缺,尤其在旅游者对景点文化供给的体验程度方面也缺乏探讨。
在对旅游者网络评论文本数据进行分析的过程中发现,景点官方介绍文本多是景观、历史等文化相关内容,旅游者评论文本内容是对景点文化体验的描述。可对文化景点官方介绍文本与旅游者评论文本进行对比,以此衡量旅游者对该景点文化的体验程度,但存在文本量较大,以及人工进行文本分析的主观性较强的问题,因此该研究提出了运用自然语言处理技术的基于网络文本的文化体验度计算方法,并选择大运河河北段主要文化景点进行实证研究,并对影响文化体验度的指标进行分析,旨在为大运河国家文化公园建设以及大运河景点文化供给、旅游者文化体验度的提升提出建议。
2. 研究框架
文化体验度是旅游者对于景点所供给文化的感知程度的量化测度,用来衡量旅游者对于景点文化体验的质量。在旅游文化体验的研究中,文化体验度可成为重要的评价指标,并应用于文化体验的提升。
该文中基于网络文本的文化体验度研究框架如图1所示。将景点官方介绍文本作为景点文化供给投射,将旅游者评论文本作为旅游者对于文化的体验感知,进行语义相似度对比,计算结果为基于网络文本所反映出的旅游者文化体验度。对各景点旅游者评论文本提取出关键词,并在对以往相关文献研究和文本实际体现内容的基础上,构建旅游文化体验度表征指标,对关键词按照不同指标进行归类,统计各文化体验度表征指标关键词数量。将景点文化体验度与各文化体验度表征指标关键词数量对照,分析各指标对于文化体验度提升的相关性。根据体验表征指标相关性计算结果,分析各指标间的相互影响关系,梳理文化体验度的提升路径,可结合景点文化供给情况等分析,提出景点文化体验度提升建议。
2.1. 语义相似度计算方法
文化体验度的测度运用自然语言处理技术,将景点官方介绍与旅游者评论文本进行语义相似度对比,该研究中使用Word2vec (Word to vector,词向量)模型 [10] 与余弦相似度算法 [11]。
对Word2vec模型训练的步骤分为语料库的获取、处理和基于语料库训练模型。为保证模型训练结果的精确度,选用相对大型的语料库进行训练,将语料库文件中的文章进行提取,并进行文本格式转换、语种转换等处理。随后对获得的文章进行分词,进行Word2vec模型训练,训练好的模型保存为模型文件,以备调用。
调用训练好的Word2vec模型文件,对文本进行语义相似度对比。语义相似度对比采用余弦相似度算法,将景点官方介绍文本与旅游者评论文本进行逐条文本语义相似度对比,因每个景点评论条数不同,在文化体验度比较时,取景点语义相似度平均值,该数值为文本的旅游者文化体验度的体现。
语义相似度是文本中关键词间的比较,旅游者评论中所提到关键词与景点官方介绍文本中的关键词相同或者语义越相近,对比文本的语义相似度越高,即旅游者评论文本反映出的对于景点文化供给的体验度越高,反之,旅游者评论中未提及官方介绍中的关键词或语义不相近,对比文本的语义相似度越低,即旅游者评论文本反映出的对于景点文化供给的体验度越低。
2.2. 文化体验度表征指标设计与提炼
由于文本相似度是将景点官方介绍与旅游者评论中的关键词进行相似度对比,旅游者评论文本参与到了文本相似度计算中,从该文本中提取到的关键词和文本相似度存在联系,因此在文化体验度表征指标中,可将关键词的数量分布情况作为旅游者体验特征进行研究。研究中的旅游者评论关键词采用TF-IDF (Term frequency-Inverse document frequency,词频逆文本频率)模型进行提取 [11]。
结合文献和旅游者评论文本中文化体验的实际内容,构建文化体验度表征指标,并将对旅游者评论提取的关键词归类到指标中,同时统计各指标中关键词数量。
研究旅游体验相关方面的文献较多,可为该研究中的旅游文化体验度表征指标构建提供理论支撑。国外学者Pine B J等(1998)将体验的划分为娱乐体验、教育体验、逃避体验和审美体验四种类型 [12],国内学者邹统钎(2003)在此理论基础上提出在旅游体验中还应该有移情体验 [13];胡道华等(2011)从旅游者旅游的体验过程,从景观质量、服务质量、环境质量三个方面构建旅游者感知评价模型,并对武汉木兰山景点进行分析 [14];任珮瑶等(2017)对云南省丽江束河古镇客栈、餐厅的游客留言文本内容进行编码,共得到个人情感、自然环境、文化氛围等7个范畴 [15];王蓉等(2019)对婺源的网上旅行游记内容进行分析编码归纳,发现婺源县乡村旅游体验包含自然风光、人文景观、建筑景观、居民生活风貌等27个要素指标 [16];刘海朦等(2021)基于具身理论,对中山大道历史文化区旅游网络文本进行分析,该街区旅游质量评价纬度分为身体体验、街区特征、街区接待和环境氛围 [17];李琳等(2021)基于体验经历理论,分析了11家生态旅游示范区网络游记,结果表明生态旅游旅游者理论上可获得审美、学习、娱乐、恢复、移情体验 [18]。
旅游体验相关文献中提到娱乐、教育、逃避、审美、移情五种体验类型,通过对各景点旅游者评论提取的关键词进行归纳,发现文化体验中包含审美体验、娱乐体验、教育体验、移情体验等内容,但是逃避体验的相关内容缺乏。文献中研究者还从景观、氛围、学习、情感等方面对旅游体验评价指标进行构建,可为旅游者文化体验度表征指标构建提供借鉴。
对该研究中旅游者评论文本中的关键词进行分析,可发现关键词主要分为对自然景观、人文景观、环境氛围、事物、文化、乡愁、往事、影视、诗词等与文化体验相关的描述。将旅游者评论关键词的分类分别对应到体验类型中,最终构建的旅游文化体验度表征指标的一级指标中包含审美体验、娱乐体验、教育体验、移情体验,二级指标为自然景观、人文景观、环境氛围、游览等,如表1所示。

Table 1. Cultural experience degree representation index
表1. 文化体验度表征指标
2.3. 文化体验度表征指标相关性分析
对各景点按照文化体验度进行排名,该数据为连续变量组成的等级资料,可以用Spearman等级相关系数来进行研究 [19]。分别计算各景点一级、二级指标关键词数量与各景点文化体验度之间的相关系数,得出显著水平p值以及相关系数r值,用于反映文化体验度与各级表征指标之间、各级指标之间的相关性。
对指标间相关性进行判断时,首先确认指标间显著性p值,如p值小于0.05,则指标间具有相关性,再根据相关系数r值判断相关性强弱,相关系数r值越大,相关性越强。根据指标间的相关情况,可确定对文化体验度提升相关的指标以及指标之间的相关性,相关性的强弱,可确定指标的重要程度。
2.4. 文化体验度提升路径思路
根据旅游者文化体验度表征指标显著性与相关性计算结果,分析各表征指标间的相互影响关系,梳理出对文化体验度进行提升的路径,可结合景点文化供给情况等分析,对该区域内景点文化体验供给进行完善。
各表征指标并非独立,而是可能互相影响,彼此存在一定联系。提升路径可以是灵活多角度的,文化体验度的提升路径可能出现以下几种情况:
1) 直接相关提升路径。对于文化体验度具有相关性的指标,可直接提升该指标,也可对与之相关的指标进行提升,进而影响到该指标,以此提高文化体验度:① 提升一、二级指标,直接影响文化体验度;② 提升一、二级指标的相关指标,一、二级指标受相关指标影响得到提升,进而对文化体验度产生影响。
2) 间接相关提升路径。如指标对文化体验度不具有相关性,可以通过指标间的相关性来间接对文化体验度进行提升:① 提升一级指标,对与其具有相关性的一级指标产生提升,进而影响文化体验度;② 提升一级指标,对与其相关的一级指标中具有相关性的二级指标产生提升,影响到与文化体验度相关的一、二级指标,可对文化体验度产生影响;③ 提升二级指标,同样也会通过相关性指标间的相互作用对文化体验度产生影响。
在对区域文化体验进行提升时,无论是选择直接相关还是间接相关的路径,都可通过指标相关性的强弱与实际情况选择优先提升的指标。
3. 实证研究
3.1. 研究对象与数据源
该研究选取大运河沧州段作为研究区域,该区域是大运河河北流域内文化遗产最为集中的河段,共有文化遗存176处,不仅包括位列世界文化遗产名录的连镇谢家坝,还包括吴桥杂技、沧州铁狮子等文化遗产。
该研究中采用的旅游景点数据来源于携程、马蜂窝、驴妈妈、途牛、去哪儿、猫途鹰、同程旅行、穷游网,涵盖了国内主流旅游网站,数据截止时间2021年3月1日,共获取数据记录4850条。官方数据来源于沧州市人民政府网站。
对沧州景点相关文本进行采集后,按照沧州境内大运河流经的县域,选取县域内包括吴桥杂技大世界、纪晓岚文化园、沧州铁狮子与旧城遗址公园在内的大运河沧州段21个景点,将景点官方介绍与旅游者评论文本进行研究。
3.2. 总体文化体验分析
对大运河沧州段21个景点按照文化体验度从高到低进行排名,结果如图2所示,结合各景点评论数量对该区域旅游者文化体验的情况进行分析。

Figure 2. Comparison of cultural experience degree and number of comments
图2. 文化体验度、评论数量比较
景点文化体验度最高值与最低值相差较明显,排名前三的景点分别为沧州博物馆、南皮石金刚、泊头清真寺,说明这几处景点的旅游者对景点所供给文化的感受程度相对较高。从评论数量方面看,各个景点评论数量相差较大,吴桥杂技大世界、沧州铁狮子与旧城遗址公园在评论数量上位居前两名,沧州规划馆、香涛公园、沧州名人植物园、清真南大寺等景点评论数量较少,反映了旅游者的文化偏好的同时也说明该区域景点开发的不均衡,大部分景点还没能引起旅游者足够的关注,景点知名度方面有待提升。
以21个景点各表征指标关键词数量为特征值,对旅游者景点文化体验情况进行分析。如图3所示,各景点的文化体验一级指标中审美体验涉及关键词数量普遍大于其他表征指标关键词数量。旅游者在沧州博物馆、铁钱库、沧州规划馆、清真南大寺等景点缺乏自然景观的体验,在沧州规划馆、沧州动物园、胜利公园等景点缺乏人文景观的体验。所有景点各指标相关旅游者体验并非全面,二级指标中的观赏演义体验只在狮城公园、沧州文庙、吴桥杂技大世界、沧州动物园中出现,该区域景点在娱乐体验供给方面有待提升。

Figure 3. Cultural experience keywords quantitative heat map
图3. 文化体验关键词数量热力图
3.3. 文化体验度表征指标相关性及提升路径
对21个景点各文化体验度表征指标关键词数量与文化体验度进行Spearman等级相关系数计算,结果如图4、图5所示。对指标间相关性进行分析,观察指标间显著性p值、相关性r值,判断指标间显著性以及相关性强弱。
审美体验受三个二级指标影响显著,p值小于0.05,自然景观与审美体验的相关系数为0.60,人文景观与审美体验的相关系数为0.73,环境氛围与审美体验的相关系数为0.86,环境氛围对审美体验的提升作用更大。二级指标之间的对比中,自然景观、人文景观分别与环境氛围的影响显示出显著性和相关性。自然景观与环境氛围的相关系数为0.49,人文景观与环境氛围的相关系数为0.67,人文景观对环境氛围的相关性较强。自然景观、人文景观和环境氛围分别对旅游者审美体验产生影响,同时,自然景观或人文景观的提升也可影响旅游者对环境氛围的体验,进而影响审美体验。
娱乐体验里的二级指标中游览、观赏演艺对其影响的p值小于0.05,具有显著性。游览与娱乐体验的相关系数为0.70,观赏演艺与娱乐体验的相关系数为0.51。旅游者游览、演艺供给体验的增加可提高旅游者对娱乐的体验。
认知事物和感知文化对教育体验的影响均具有显著性,认知事物与教育体验的相关系数为0.82,感知文化与教育体验的相关系数为0.93。认知事物与感知文化的相关系数为0.57,且影响显著。旅游者在景点认知事物或感知文化体验的增加,教育体验会随之提升。
乡愁、往事与影视、诗词对移情体验的影响均具有显著性,相关系数分别为1、0.64。旅游者产生的乡愁、往事的感受和影视、诗词的联想体验的增加可使移情体验显著提升,且乡愁、往事对移情体验提升作用最为明显。

Figure 4. Thermal map of significance p value of cultural experience degree representation index
图4. 文化体验度表征指标显著性p值热力图

Figure 5. Thermal map of correlation r value of cultural experience degree representation index
图5. 文化体验度表征指标相关性r值热力图
一级指标之间进行对比,除移情体验对审美体验、教育体验的p值大于0.05,不具有显著性之外,其他指标之间影响具有显著性。审美体验与娱乐体验的相关系数为0.59,审美体验与教育体验的相关系数为0.78,娱乐体验与教育体验的相关系数为0.49,娱乐体验与移情体验的相关系数为0.55。审美体验分别与娱乐体验、教育体验相关,娱乐体验分别与教育体验、移情体验相关。
二级指标体验内容的增加,对其对应的一级指标体验内容产生提升作用,也会对其他一级指标产生正向影响。旅游者对景点环境氛围的体验和教育体验中的认知事物、感知文化以及移情体验中的乡愁、往事的体验相关,与感知文化的相关性最强。娱乐体验中的游览也会对环境氛围造成影响,进而影响审美体验。景点自然景观、人文景观、环境氛围方面的提升,使得旅游者审美体验提升的同时,娱乐体验、教育体验、移情体验也会受到影响随之提升,反之,这三种体验的提升,也会提升旅游者的审美体验。另外,二级指标中的人文景观、环境氛围、感知文化对文化体验度具有相关性。
在该区域的相关性计算结果中,一级指标与文化体验度之间对比来看,审美体验、教育体验对文化体验度的p值小于0.05,影响均显著,且相关性较大。审美体验与文化体验度的相关系数为0.5,教育体验与文化体验度的相关系数为0.49。旅游者审美体验和教育体验的增加直接会对旅游者的文化体验提升产生作用,景点对这两种体验进行提升将有助于旅游者获得更好的文化体验。对于不能够直接对文化体验度提升产生作用的娱乐体验、移情体验,根据指标之间的相关性,对其二级指标中的游览、乡愁、往事等进行提升,也会对审美体验、教育体验产生正向影响,进而提升文化体验度。还可以直接对二级指标中的人文景观、环境氛围、感知文化提升,使其对文化体验度产生影响。
4. 结论与讨论
4.1. 结论
该研究运用自然语言处理技术,提出了基于景点官方介绍文本与旅游者评论文本进行文化体验度计算的方法,并对大运河沧州段21个主要文化景点进行研究,依据以往文献和旅游者评论文本实际内容构建文化体验度表征指标,从文本中提取关键词,并将关键词按照指标归类。对各景点按照文化体验度进行排名,旅游者体验角度对各文化体验度表征指标与文化体验度之间的相关性进行分析,梳理提升路径。结果表明,该区域旅游者审美体验和教育体验对旅游者文化体验度提升具有相关性。
4.2. 景点文化体验提升路径与供给建议
根据对数据的分析,围绕四个一级文化体验表征指标,通过表征指标之间相关性形成景点文化体验提升路径,并且对旅游者体验文本中反映出的供给不足的体验形式进行加强供给,对大运河沧州段景点的文化体验供给的提升提出建议。
1) 提升服务,完善审美体验。对于审美体验的完善,可根据相关性的强弱,依次从环境氛围、人文景观、自然景观入手,或结合实际情况选择重点提升指标。沧州博物馆、铁钱库、清真南大寺等景点可对自然景观风貌进行打造,沧州动物园、胜利公园等景点也要对人文景观进行提升,沧州规划馆二者都需进行加强。景点环境氛围包括景点环境、氛围以及接待服务水平等,加强自然或人文景观可使旅游者对景点环境、氛围的感受增强。环境氛围的提升,景点也可根据游览的娱乐体验与环境氛围的相关性,以提升游览体验为路径增强旅游者对环境氛围体验。根据各一级指标间的相关性,审美体验的提升也可从娱乐体验、教育体验两个方面入手。
2) 填补不足,开发娱乐体验。对景点的娱乐体验,对当前游客体验文本中所显示的该区域内旅游者体验中有待加强供给的观赏演艺体验。景点根据自身情况,开发具有当地特色的文化娱乐活动,如吴桥杂技节、文庙庙会等,提高景点可玩性和活动参与性,提升旅游者对文化的娱乐体验。另外,娱乐体验的提升,也可以从提高游客审美、教育体验的角度进行,如景点对周边道路、景观、接待能力等环境氛围的升级,可改善旅游者的游览体验,另外,景点对文化教育活动的开发可更多关注可参与性、娱乐性。
3) 挖掘文化,加强教育体验。教育体验与文化体验度提升直接相关,并且二级指标中的感知文化与文化体验度也直接相关,可着重提升。从人文景观和环境氛围进行提升,景点可因地制宜地对文化进行深入挖掘,进而对事物和文化全面和多角度的展示,打造人文景观和环境氛围,如纪晓岚文化园可进一步挖掘并展示纪晓岚的文学作品及逸闻、传说,增加文创内容,吴桥杂技大世界的杂技技艺可对旅游者进行体验式传播,使旅游者获得技艺、文学知识上的学习上以及历史、传统等文化熏陶,获得对景点相关事物、文化的更多更深层次的认知与感知。
4) 多重供给,提升移情体验。景点提升对移情体验表现出显著性的乡愁、往事以及影视、诗词体验的供给,可通过提升旅游者对自然、人文审美体验和对事物、文化教育体验多方面体验来实现,景点在供给中挖掘保留区域的原生、原貌,如景点对沧州承载大运河历史记忆的老街巷、老故事、老技艺进行挖掘,并创新性的开发,营造故乡、小时候等记忆的投射,延伸旅游者文化体验的广度、深度,使旅游者在旅游过程中获得情感转移感受。
4.3. 讨论
由于影响旅游者文化体验的因素较多、评价体系较复杂,基于网络文本进行文化体验度计算只能在一定程度上对文化体验进行反映,进行旅游者文化体验研究时,还需综合其他数据与方法。
该研究中文化体验度计算使用语义相似度方法,由于该方法不能解决一词多义以及不能区分和解决同义词、反义词等深层次语义问题,计算结果精确度有待进一步提升,未来研究中可使用基于深度学习的方法来对语义相似度进行计算。
基金项目
2022年河北师范大学大学生课外学术科技创新创业竞赛课题“基于网络文本的大运河沧州段旅游者文化体验度计算及提升”(BF202231017329)。
NOTES
*通讯作者。