摘要: 本研究基于大众点评和携程网中5615条来自浙江省乌镇的游客在线评论数据为对象,通过高频词分析、语义网络构建及游客月度情感变化分析等方法,系统探讨游客旅游意向要素与满意度特征。研究结果显示,游客满意度的构成可分为四个层面,具体包括古镇旅游资源、古镇旅游环境、景区配套设施与游客感知;在游客的情感评价中,游客月度情感变化揭示2月情感评分低谷与3月峰值的季节性波动;情感分布显示77.31%积极情绪,但11.71%消极反馈主要指向消费性价比与服务体验。据此提出季节性体验优化、文化资源活化、价值感知重构、体验质量管理四维优化建议,为江南古镇旅游管理提供参考。
                
 
              
                
                    Abstract: This study takes 5615 online reviews from tourists visiting Wuzhen, Zhejiang Province, collected from Dianping and Ctrip as the research object. Through methods such as high-frequency word analysis, semantic network construction, and analysis of tourists’ monthly emotional changes, it systematically explores the elements of tourists’ travel intentions and satisfaction characteristics. The research results show that the composition of tourists’ satisfaction can be divided into four levels, specifically including ancient town tourism resources, ancient town tourism environment, scenic area supporting facilities, and tourists’ perception. In the tourists’ emotional evaluation, the monthly emotional changes of tourists reveal the seasonal fluctuations of the emotional score low point in February and the peak in March. The emotional distribution shows that 77.31% are positive emotions, but 11.71% of negative feedback mainly points to the cost-performance ratio and service experience. Based on this, four-dimensional optimization suggestions of seasonal experience optimization, cultural resource activation, value perception reconstruction, and experience quality management are proposed, providing a reference for the tourism management of Jiangnan ancient towns.
                
                   
                  
    1. 引言
游客的旅游体验及其满意度,受到多方面因素的共同作用,包括旅游资源的多样性、旅游服务的质量高低以及基础设施的完备程度等。杨春梅等针对哈尔滨冰雪旅游的研究,通过网络文本分析识别出满意度的核心维度,揭示了冰雪旅游中满意度的影响因素及优化对策,为文化新形象在特定旅游场景中的应用提供了实证支持[1];敬峰瑞等对西溪湿地公园的研究,运用SNA等方法揭示了旅游体验要素的结构特征,发现自然景观作为核心要素的关键作用,丰富了满意度模型中要素维度的结构化研究[2];许明关于乌镇信息化服务体系的研究,通过问卷调查,利用IPA模型分析了指标满意度与重要性的差异性,其对服务质量与游客感知关系的探讨,进一步验证了满意度模型关联的普适性[3]。既有研究仍存在两方面的拓展空间,一方面,传统古镇满意度研究使用问卷调查法,难以捕捉游客自发表达的额外需求,另一方面,关于古镇旅游的研究中,时间维度对游客体验的影响常被简化处理。
本研究以乌镇为对象,基于5615条在线评论数据,避免了传统问卷调查的维度局限,验证了网络文本数据在捕捉游客隐性体验、月度情感变化方面的有效性,以期为旅游行业的发展与研究提供实用建议和新的视角。
2. 研究方法及工具
网络文本数据分析是一种利用了计算工具和算法从大量在线文本中提取信息的研究方法[4]。在网络文本的游客满意度研究中,常用的工具有ROST CM6、NVivo8、Python等。丛丽和吴必虎使用ROST CM6和NVivo8对成都大熊猫繁育研究基地的游客评论进行了分析,发现了游客满意度与熊猫接触程度密切相关[5];赵春艳和陈美爱等通过ROST CM6软件的“情感分析”功能,对搜集到的点评数据进行情感分析,得到游客情感分析结果[6]。
2.1. 数据来源
本研究的数据来源主要来自于两大旅游平台:大众点评和携程网。本研究利用Python编程,抓取了5615条关于乌镇的游客在线评论和相对应的用户评分数据。这些评论覆盖了2022年12月7日至2024年9月24日这一时间段,游客的反馈反映了真实的旅游体验和感受。
2.2. 数据预处理
本研究采用ROST CM6软件开展分析,原始数据分别经过文本去重、手工压缩去词、分词、去停用词预处理。
为精准量化游客情感倾向,人工标注标准基于评论核心语义:明确表达满意、推荐、愉悦体验的为“积极”;包含抱怨、不满、负面体验描述的为“消极”,对存在分歧的评论,通过小组讨论达成共识。最终从预处理后的评论中精筛2000条,其中积极、消极评论各1000条,以平衡样本分布,为后续月度情感变化分析提供标准化的星级量化数据。
3. 研究结果
3.1. 词频分析
数据进行预处理之后,再导入到ROST CM6软件中,利用“词频分析”功能统计词频,筛选出100个高频词汇,如表1。
通过表1可以知道,词汇的出现频率直接反映了游客对旅游目的地意象要素的关注程度与认知深度。“乌镇”以最高频率出现,显示出游客对这一目的地的浓厚兴趣和认同感;“西栅”和“东栅”分别位列第二和第五,乌镇的两大标志性景点引起游客的关注和热议;“景区”和“景色”则体现了乌镇独特的地理特征和自然美景;“门票”位列第六,反映了游客对门票价格及相关规定的讨论,表明了游客对消费的敏感度;“值得”和“体验”这两个高频词传达了游客对乌镇游玩经历的评价,普遍认为这次游览是一次值得的体验,充满了愉悦与满足感;“古镇”“江南水乡”准确概括了乌镇的景点形象。
Table 1. Statistics of frequent words in tourist reviews of Wuzhen
表1. 乌镇游客评论高频词统计
 
  
    | 排名 | 高频词 | 词频 | 排名 | 高频词 | 词频 | 排名 | 高频词 | 词频 | 
  
    | 1 | 乌镇 | 2919 | 35 | 排队 | 218 | 69 | 乌篷船 | 125 | 
  
    | 2 | 西栅 | 1248 | 36 | 白天 | 216 | 70 | 欣赏 | 124 | 
  
    | 3 | 景区 | 1120 | 37 | 管理 | 216 | 71 | 味道 | 124 | 
  
    | 4 | 古镇 | 922 | 38 | 历史 | 209 | 72 | 灯光 | 121 | 
  
    | 5 | 东栅 | 706 | 39 | 时间 | 206 | 73 | 好看 | 120 | 
  
    | 6 | 门票 | 685 | 40 | 酒店 | 204 | 74 | 店铺 | 119 | 
  
    | 7 | 值得 | 643 | 41 | 舒适 | 198 | 75 | 摇橹船 | 119 | 
  
    | 8 | 江南水乡 | 609 | 42 | 商业 | 190 | 76 | 游览 | 117 | 
  
    | 9 | 体验 | 591 | 43 | 天气 | 187 | 77 | 好玩 | 115 | 
  
    | 10 | 景色 | 564 | 44 | 美丽 | 186 | 78 | 南栅 | 114 | 
  
    | 11 | 江南 | 560 | 45 | 再来 | 184 | 79 | 氛围 | 113 | 
  
    | 12 | 夜景 | 538 | 46 | 打卡 | 177 | 80 | 性价比 | 110 | 
  
    | 13 | 人多 | 507 | 47 | 下午 | 166 | 81 | 期待 | 108 | 
  
    | 14 | 晚上 | 499 | 48 | 韵味 | 164 | 82 | 便宜 | 107 | 
  
    | 15 | 适合 | 427 | 49 | 建筑 | 163 | 83 | 戏剧节 | 105 | 
  
    | 16 | 建议 | 425 | 50 | 收费 | 160 | 84 | 享受 | 104 | 
  
    | 17 | 拍照 | 422 | 51 | 选择 | 157 | 85 | 节假日 | 104 | 
  
    | 18 | 风景 | 419 | 52 | 美食 | 155 | 86 | 独特 | 104 | 
  
    | 19 | 游玩 | 342 | 53 | 汉服 | 155 | 87 | 热闹 | 103 | 
  
    | 20 | 商业化 | 340 | 54 | 住宿 | 151 | 88 | 丰富 | 102 | 
  
    | 21 | 感受 | 339 | 55 | 游船 | 150 | 89 | 烟雨 | 96 | 
  
    | 22 | 方便 | 309 | 56 | 夜晚 | 149 | 90 | 联票 | 93 | 
  
    | 23 | 小桥流水 | 302 | 57 | 优美 | 148 | 91 | 宁静 | 91 | 
  
    | 24 | 地方 | 272 | 58 | 漂亮 | 147 | 92 | 早上 | 90 | 
  
    | 25 | 气息 | 271 | 59 | 古香古色 | 144 | 93 | 票价 | 90 | 
  
    | 26 | 景点 | 268 | 60 | 孩子 | 143 | 94 | 舒服 | 90 | 
  
    | 27 | 环境 | 266 | 61 | 整体 | 138 | 95 | 浓厚 | 87 | 
  
    | 28 | 小吃 | 259 | 62 | 免费 | 138 | 96 | 木心美术馆 | 85 | 
  
    | 29 | 坐船 | 256 | 63 | 第一次 | 136 | 97 | 停车 | 85 | 
  
    | 30 | 特色 | 255 | 64 | 干净 | 135 | 98 | 周末 | 85 | 
  
    | 31 | 水乡 | 250 | 65 | 不值 | 135 | 99 | 安静 | 83 | 
  
    | 32 | 服务 | 242 | 66 | 好吃 | 133 | 100 | 开心 | 82 | 
  
    | 33 | 民宿 | 240 | 67 | 小镇 | 132 |  |  |  | 
  
    | 34 | 文化 | 238 | 68 | 美景 | 126 |  |  |  | 
 3.2. 语义网络分析与词归类
Figure 1. Semantic network analysis diagram
图1. 语义网络分析图
Table 2. Classification of frequent words in tourist experience reviews of Wuzhen
表2. 乌镇游客游玩体验评论高频词分类
 
  
    | 高频词主类 | 高频词次类 | 高频词 | 
  
    | 旅游资源 | 自然景观 | 景区、景色、夜景、风景、美景 | 
  
    | 人文景观 | 西栅、古镇、东栅、地方、文化、历史、建筑、小镇、灯光、南栅、木心美术馆 | 
  
    | 美食 | 小吃、特色、美食、好吃、味道 | 
  
    | 旅游环境 | 地理区位 | 乌镇 | 
  
    | 环境氛围 | 气息、环境、天气、干净、氛围、热闹、丰富、烟雨、浓厚 | 
  
    | 政策环境 | 门票、收费、整体、免费、性价比、联票、票价 | 
  
    | 基础设施 | 购物体验 | 商业化、商业、店铺 | 
  
    | 娱乐体验 | 体验、拍照、游玩、坐船、时间、打卡、选择、汉服、游船、乌篷船、摇橹船、游览 | 
  
    | 公共服务 | 服务、管理、酒店、住宿、戏剧节、停车 | 
  
    | 游客感知 | 景点形象 | 江南水乡、江南、小桥流水、水乡、韵味、古香古色 | 
  
    | 游客感官 | 人多、适合、建议、感受、方便、排队、舒适、孩子、第一次、欣赏、期待、享受、独特、宁静、舒服、安静、开心 | 
  
    | 游客评价 | 值得、美丽、再来、优美、漂亮、不值、好看、好玩、便宜 | 
  
    | 游玩时间 | 晚上、白天、下午、夜晚、节假日、早上、周末 | 
 语义网络分析方法以高频词为节点,以高频词组合共同出现的次数为节点之间的关系,通过构建语义网络有向图分析高频词组合在文本中的语义[7]。本研究构建了语义网络图,如图1所示。为了更深入地理解游客的体验感知特点,对高频词汇进行进一步的归类和分析。魏亚洲等对兴坪古镇的文本分析,将高频词划分为旅游资源、基础设施与配套服务、旅游环境及活动四个主要类别,并细化为13个次级类目,以期全面反映游客的需求与期望[8]。蔡新元则对朱家角古镇进行网络语义分析,关注高频词的多维度特征,将其归类为区位特征、古镇地标、景观资源、运营与管理以及整体感知体验五个方面,体现了研究的细致性和系统性[9]。张春花等在对三河古镇的研究中,将高频词归类为景区区域位置、旅游吸引物、设施和环境四个维度,旨在揭示游客的选择因素与偏好[10]。基于此,本研究结果如表2所示。
通过图1可知,乌镇旅游相关的高频词汇被清晰且有条理地划分为“核心层–次级层–外围层”这一循序渐进的三个层次结构。核心层主要由“夜景”等关键词汇紧密围绕而成。次级层是对核心层的形象进一步丰富与拓展。这一层次涵盖了诸如“江南水乡”、“历史”、“文化”、“小桥流水”、“韵味”、“值得”以及“拍照”等词汇。外围层聚焦于乌镇旅游区的基础设施与服务,以及游客在旅行过程中的关注焦点。如“商业化”、“酒店”、“民宿”、“坐船”等词汇体现游客在游览乌镇后的真实体验。
从表2的数据可以看出,夜景在高频词汇中占据显著位置,这充分反映了游客对乌镇夜景的深刻印象。从词频数量来看,乌镇的人文景观累计词频数量是多于自然景观累计词频数量,这显示出游客对乌镇人文景观的感受更为深切。在文化景观中包含着“文化”、“历史”、“建筑”、“小镇”等高频词,表明作为一座历史悠久的古镇。游客们主要是通过游览小镇内的古建筑来体验和感知这份深厚的文化底蕴。在美食方面,其整体排名与词频数量表现并不突出,这似乎表明乌镇缺乏具有独特魅力的美食。游客们对乌镇的环境氛围表达了高度的满意,频繁使用了“干净”“热闹”“丰富”“烟雨”“环境”“天气”“氛围”“浓厚”等词汇来形容。这充分展现了乌镇在环境治理方面所取得的显著成效。而在政策环境上,“门票”“收费”“免费”“性价比”等词则较为突显。在基础设施的评价上,“拍照”“坐船”“打卡”“汉服”“游船”“乌篷船”“游览”等高频词,显示出这些项目是最受游客关注的旅游活动。此外,“商业化”“商业”“店铺”“服务”“酒店”“住宿”“停车”等词反映了游客在乌镇旅游时,对于购物环境、景点服务质量、住宿条件以及交通体验的深切关注。在景点形象方面,高频词包含了“江南水乡”“江南”“小桥流水”“水乡”“韵味”“古色古香”等词,生动地描绘了乌镇作为典型江南古镇的独特风貌和深厚文化底蕴。“人多”“排队”两词显得较为突出,揭示了在高客流量背景下的游客体验可能遭遇的挑战与不便。为了提升游客体验,景区可能需要采取更加有效的措施,如优化游览路线、提升接待能力等,以应对高人流量的压力。“方便”“舒适”“宁静”“开心”“值得”“美丽”“再来”等词表明了游客在乌镇旅游过程中感受到了高度的便利、舒适和愉悦。
3.3. 月度情感变化描述
爬虫评分易受复杂因素干扰,如部分消极评论仍给出高分,积极评论也存在类似异常,难以精准反映游客真实情感倾向。人工标注能更纯粹地体现各月份游客情感的整体倾向,最终得到情感标注评分如图2所示。
通过图2可知,2月评分相对较低,3月评分较高,这一波动与天气因素存在关联。在2月的198条有效在线评论中,37.8%提及“下雨”“冷”等天气相关词汇,其中不少伴随“游览时间短”“体验打折扣”等消极表述;3月的286条有效评论中,41.3%提到“回暖”“适合散步”等内容,其中不少关联“景色宜人”“玩得尽兴”等积极反馈。其他月份虽多数得分超过0.6,但彼此间仍有波动,可能受节日活动、景区管理措施、游客自身预期等多种因素综合影响,这些因素在不同时间节点的变化,导致了游客情感倾向的动态波动。
Figure 2. Monthly change chart of tourist satisfaction in Wuzhen
图2. 乌镇游客满意度月度变化图
3.4. 情感分析
游客满意度情感分析是对游客在旅游体验中形成的主观感受进行系统性评估的研究方法。其核心目标在于精准识别游客情感倾向,从而为提升旅游服务质量和消费体验提供决策依据。
基于数据构成特征,本研究采用多维度评价标准:将用户评分为4~5分定义为积极情绪,对应游客的满意体验;用户评分为3分为中性情绪,反映游客的折中评价;用户评分为0~2分则判定为消极情绪,表征游客的明确不满。这种量化分级与质性描述相结合的评估框架,既能保证情感判断的客观性,又可保留文本反馈的细节信息,形成多维度的满意度评估体系,如表3所示。
根据表3中的游客情感分析结果,游客对乌镇旅游的整体满意度较高。其中,情感趋势显示积极情绪的游客占多数,总数为4068条,比例为77.31%,表明大部分游客对景区的体验感到满意。在积极情绪的细分中,普遍满意的游客占比最高,达到33.20%,这表明他们的满意度并未达到高水平,值得深入探讨具体原因。中度满意的游客占24.31% (1279条),而高度满意的游客则占19.80%。这部分游客的正面体验可能与景区的特色活动和优质服务密切相关。
此外,有10.98%的游客反馈为中性情绪,反映出他们对某些方面没有明显的强烈感受。与此同时,11.71%的游客表达了消极情绪,这提示乌镇景区需要关注并改善相关问题。在消极情绪的分析中,一般不满的游客占9.31%,中度不满的游客占1.79%,而高度不满的游客仅占0.11%。
Table 3. Wuzhen tourist emotional distribution table
表3. 乌镇游客情感分布表
 
  
    | 情绪类型 | 数量(条) | 所占百分比 | 
  
    | 积极情绪 | 4068条 | 77.31% | 
  
    | 中性情绪 | 578条 | 10.98% | 
  
    | 消极情绪 | 616条 | 11.71% | 
  
    | 积极情绪分段 | 一般(0~10) | 1747条 | 33.20% | 
  
    | 中度(10~20) | 1279条 | 24.31% | 
  
    | 高度(20以上) | 1042条 | 19.80% | 
  
    | 消极情绪分段 | 一般(−10~0) | 490条 | 9.31% | 
  
    | 中度(−20~−10) | 94条 | 1.79% | 
  
    | 高度(−20以下) | 6条 | 0.11% | 
 4. 游客体验四维优化建议
4.1. 季节性体验优化
针对2月低谷,结合“文化”“历史”高频词,可以增设“江南民俗室内体验馆”,如设置酱鸭制作、灯彩技艺演示等互动项目,缓解天气对体验的影响;3月依托“景色”“拍照”需求,推荐沿西栅河道种植应季观赏植物,并设置“春分诗词打卡装置”,还可以联动民宿推出“春日摄影套餐”。
4.2. 文化资源活化
围绕“夜景”“建筑”高频词,可以开发“文学主题夜间游船”,每晚固定时间运行,途经茅盾故居时通过灯光投影重现《子夜》场景,并且搭配导游讲解;在乌镇东栅所有古建筑设置扫码点,通过3D动画演示“穿斗式”结构营造技艺,关联“木心美术馆”形成文化体验闭环。
4.3. 价值感知重构
针对11.71%消极情绪中指向消费性价比的反馈,建议基础票务实施弹性体系:日间票、暮色票、全域通票,并设置价格梯度;开展增值服务,可以嵌入“体验货币”概念,如购买通票赠送“20元体验币”,可抵扣乌篷船(词频为256)费用或汉服体验(词频为155)时长。
4.4. 体验质量管理
针对“排队”(词频为218)“服务”(词频为242)问题,建立每小时舆情监测机制,自动抓取“拥挤”“态度差”等关键词;旺季(如节假日,词频为104)增设15个移动售卖车,商业区推行“小程序静音叫号”系统,降低商业区噪音和平均排队时长;每周汇总投诉数据,对高频问题及时反馈整改方案。
5. 结论
本研究通过ROST CM6软件分析乌镇景区5615条在线游客评论,揭示了游客满意度的核心特征与影响机制,通过词频分析,研究筛选出100个高频词并归类,得出构成游客满意度的核心维度:古镇旅游资源层面聚焦“西栅夜景”“江南水乡文化”等人文景观;旅游环境层面涵盖“干净”“烟雨”等环境氛围评价与“门票”“性价比”等政策环境;配套设施层面关注“商业化”“乌篷船”“汉服体验”等购物与娱乐体验;游客感知层面则通过“值得”“排队”等词呈现主观评价。通过人工情感标注,发现月度情感呈现季节性波动,2月因37.8%评论提及“下雨”“寒冷”形成评分低谷,3月因41.3%评论反馈“回暖”“适宜游览”达至峰值。用户评分情感分布中,积极情绪占比为77.31%,中性情绪是10.98%,消极情绪是11.71%,研究验证了网络文本在捕捉游客隐性体验与动态情感上的有效性,所提四维优化建议可为乌镇及江南古镇旅游管理质量的提升、游客体验的优化提供参考。
基金项目
课题项目:2024年国家级大学生创新创业训练计划项目——智能时代下的生活质感:基于大数据技术的基础设施满意度及其影响因素的研究(248519021)。