1. 引言
“文化为魂,旅游为体”,文化是旅游的灵魂,旅游是文化发展的重要途径,旅游是对自然和人文的认知。自然景观只有和人文、历史相结合才能最大范围地展现出它的魅力。人文旅游景观就是将自然与文化特质、历史相结合的独特景观,而人文景观所创造的价值与魅力是否在游客游览过程中传递给了游客,以及游览过程中呈现的旅游形象是否良好尤为重要。
近年,很多学者基于网络文本挖掘方法研究旅游地形象。在国外,Jani等对桑给巴尔岛的帖子进行内容分析,发现目的地游前形象感知以功能性属性为主,游后以心理性属性为主 [1];Hunter通过网络数据研究首尔的目的地形象,并与官方宣传册中的形象对比,发现旅游者发布在网络上的信息能更有效地进行目的地营销 [2];Clarke等通过文本分析方法对游客在访问多伦多之前、期间和之后的推特内容进行解释、评估。发现目的地吸引力是认知成分中评论最多的成分 [3];国内学者主要从认知形象、情感形象、整体形象感知三个方面对旅游目的地形象研究。李萍等通过游客在线评论对北京市典型城市旅游社区进行质性评价,为社区旅游可持续发展提供对策和建议 [4];敖长林等采用TF-IDF和LDA文档主题生成模型对冰雪旅游景点评论文本分析,挖掘游客冰雪旅游形象 [5]。在文化与目的地形象方面,国外学者Hernández-Mogollón等评估了文化事件对目的地整体形象的影响,得到文化事件对目的地旅游形象的发展有助推作用,并且认知形象对整体形象的形成比情感形象的形成贡献更大 [6];Mariusz等考察了物质文化遗产元素对波兰四个大都市目的地形象的影响。研究表明,历史文化遗产比城市的当代和后工业设施在塑造城市形象上发挥的作用更大,被视为历史的城市比工业功能相关的城市更有吸引力 [7];国内学者主要对人文景点进行研究。何琼峰基于扎根理论研究了北京文化遗产对游客满意度的影响因素 [8];李婷等以携程旅行网的评论为研究素材,采用内容分析法、扎根理论法,对五台山游后认知形象和情感形象感知进行分析 [9];王鹏飞等运用内容分析法与扎根理论对嘉兴南湖红色旅游目的地的形象感知进行分析 [10]。
鉴于此,本文选取杭州西湖的钱王祠、岳王庙、郭庄、苏堤、雷峰塔和灵隐寺等6个人文景点,爬取携程网和大众点评上的评论文本,通过特征词词频、语义网络分析、情感分析研究游客对西湖人文景观的形象感知,从而为丰富游客游览体验、传递景点文化价值、提升旅游感知价值提供建议。
2. 数据来源和研究方法
2.1. 研究区域概况
景点的游览体验给予了游客对这个城市的印象,在一定程度上塑造了他们对这个城市的形象,而人文景观更能传递一个城市的文化。2011年,杭州西湖文化景观作为文化遗产被联合国教科文组织世界遗产委员会列入《世界遗产名录》,其丰富深厚的文化底蕴和文化史迹,吸引国内外的游客慕名而来。其中郭庄、钱王祠、苏堤、雷峰塔、岳王庙、灵隐寺,这6个人文景观景点发展程度高、人文历史浓厚、知名度高、游客较多,具有一定的代表性。
2.2. 文本数据来源与预处理
本文选取2016年到2021年8月期间,大众点评和携程网中游客对景点的评价文本数据,获取评论24,805条。对爬取的数据进行数据清洗,剔除重复、无关、无意义的评论以及景区或旅行社等广告评论,最后获得有效评论22,745条。并对有效评论进行预处理。
2.3. 研究方法
2.3.1. TF-IDF关键词提取
TF-IDF是用以评估一字词对一个文件集或一个语料库中的其中一份文件的重要程度。即如果某个单词在一篇文章中出现的频率TF高、在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力。
本研究将每个评论文本视为一个文档,每个景点视为一个语料库,使用TF-IDF算法对每个文档获取前的关键词,由此得到各个景点旅游形象感知的关键词。
2.3.2. 基于语义的情感词典情感分析
1) 词典构建
情感词典。以知网HowNet情感词典为基础,通过SO-PMI方法自定义情感词典。对积极情感倾向词和消极情感倾向词的分值设置分别为1分和−1分。
程度副词词典。以知网HowNet的程度副词词典为基础,将程度副词分成5个程度级别并赋予适当的权值。
否定词词典。否定词的作用是反转情感词原本的情感倾向,本研究通过搜集相关文献和资料,自建了适用于本研究的否定词词典,并对否定词都赋值为−1分。
2) 情感值计算规则
根据情感词词典,分别统计分句中消极情感词和积极情感词。以每个情感词为中心,搜寻周围修饰情感词的程度副词,根据其相应的权重进行赋值。搜寻周围修饰情感词的否定词,根据否定词数,设定权值,得到分句中情感得分。最后将该评论中每个分句的情感得分加起来,得到整条评论的总情感得分。评论总情感得分正数是“积极情绪”,总情感得分负数是“消极情绪”,总情感得分0是“中性情绪”。
3. 数据结果分析
3.1. 文本关键词词频分析
通过对6个景点的评论提取关键特征词,并对以上各景点的前60关键词进行分类汇总得到表1,可以看出TF-IDF提取的关键词反映了游客对各个景点旅游的认知形象感知和情感形象感知。

Table 1. Classification and comparison of high frequency words in tourist comments
表1. 游客评论高频词汇分类对比
根据表1,游客认知形象感知包括旅游资源与特色和景点的交通与服务。景点旅游资源与特色中的历史文化、风景和活动相关的特色高频词显示了景区的特色旅游要素和游客对其的关注度;景点旅游交通与服务影响游客的旅游体验主要包括景点门票,设施服务以及景点的交通。具体如下:
1) 景点的历史文化。6个人文景观以各自的历史文化为主题吸引游客。其中,游客对岳王庙和灵隐寺的的历史文化主题认知明确。“精忠报国、民族英雄、爱国主义、历史、爱国主义教育基地”等词反映了游客对岳王庙的认知以爱国、英雄为主,包括岳飞的历史故事、爱国主义教育基地等。同时,“教育、学习”也体现了游客对景点呈现的爱国教育氛围的认可;“寺庙、香火、祈福、拜佛、还愿、许愿、香火、烧香”等词反映了灵隐寺作为寺庙是祈福拜佛的地方,很多游客来灵隐寺许愿、还愿。“佛像、大雄宝殿、素面”说明游客来到灵隐寺也会了解灵隐寺的历史、建筑,体验灵隐寺的特色产品;游客对郭庄的认知是“私家园林、汾阳别墅”;对钱王祠的历史文化(“钱王、吴越国、祠堂”)关注度较高。雷峰塔的“白娘子、白蛇传、新白娘子传奇”说明雷峰塔的传奇故事给游客留下深刻印象。但对于雷峰塔的独特文化历史,例如地宫、有特色的雷峰塔的藏经以及塔内的一些文物等提到较少,可能由于游客对此兴趣不高。苏堤词频靠前的“苏东坡”体现了游客对苏堤的人文要素的认知,相对来说对苏堤的人文历史提到较少,说明景点对人文的展现也不多。
2) 景点建筑和风景特色。郭庄的“园林、亭台楼阁、假山、曲廊”说明游客对其独特的园林建筑风格关注度较高。钱王祠“五王殿、牌坊、建筑、八字墙”说明游客对钱王祠的古代特色建筑的关注。苏堤的“西湖、苏堤春晓、杨柳、松鼠、荷花”是景点中让游客印象深刻的特色景观,苏堤的高频词中与风景相关的更多,说明游客游览苏堤更多关注的是其风景。雷峰塔的“西湖、西湖全景、雷峰夕照”体现了雷峰塔上可以观看西湖全景、“木雕”体现了游客对塔内独特的建筑的关注。
3) 景点活动。在郭庄和钱王祠,很多游客主要是参观景点举办的各种花展(“花展、菊花展、月季花展”等),对景点开展的花展活动关注程度高。但根据了解钱王祠景区提供越剧、昆剧、评弹等演出,在高频词中没有出现,说明游客对景点的花展关注度大于历史文化相关的活动。另外,郭庄“茶室、喝茶”说明景点内有茶室;此外,灵隐寺有祈福活动、岳王庙有爱国教育活动。
4) 景点交通。大部分景点的高频词包含“公交车”,体现了景区的交通便利。去灵隐寺的游客相比其他景点选择打车的更多。
5) 景点门票。不同景点的门票优惠不一样。除了苏堤免费景点,其他景点都提到“门票”,说明游客对景点的门票关注度较高,门票的价格与实际游览体验带来的价值是否相符很重要。此外,郭庄、钱王祠、岳王庙都出现“公园卡”,说明景点可以通过公园卡进入。另外,灵隐寺有“寺庙卡”,雷峰塔景点有“学生优惠、联票”等。
6) 景点设施服务。景点提供讲解服务,其中灵隐寺和岳王庙提到讲解较多,游客对这两个景点的讲解需求更多。景点旅游设施为游客游览提供便利。雷峰塔的“电梯”方便游客登塔、苏堤提供了“观光车、游船”等交通工具游览景点。
游客的认知形象都以各自的历史文化或风景建筑为主。此外,在评论中还有其他一些具有相似性或地域上邻近的景区名称出现,如在苏堤的评论中出现“雷峰塔、岳王庙”。在郭庄中出现“苏州园林”。由此看出,游客通常会与相似的景区进行对比评价。
3.2. 基于语义网络的特征关联分析
本文通过文本特征提取游客评价词频分析后,得到了游客对景点的认知形象感知和情感形象感知,但无法看出这些因素之间的联系。因此通过语义网络分析找寻这些因素之间的关系。利用ROST Content Mining软件的社会网络与语义分析功能,分析评论文本中关键词的关联性。语义网络见图1~6。

Figure 1. Semantic network of tourist comments in Guozhuang
图1. 郭庄游客评论语义网络
由图1可见,郭庄关联着“拍照片–适合”、“园林–风景–好看”,说明景点的园林风景得到游客的认可,游客来此拍照。其次郭庄关联着“荷花展、花展、茶室”,以及喝茶–风景–好看–西湖”这一关联说明景区通过举办各种花展、开设茶室吸引游客,为游客提供欣赏西湖美景、喝茶聊天的场所,也是该景点不同于其他景点的地方。园林关联着“江南、古典、精致、建筑”这些词是游客对郭庄园林建筑的评价。此外,“公园卡–门票–免费”,表示景点通过公园卡可以免费参观,也说明景点对本地游客的宣传效果好。

Figure 2. Semantic network of tourist comments in Qianwang Temple
图2. 钱王祠游客评论语义网络
由图2可见,“钱王祠–建造–功绩–纪念–钱王–历史”体现了景点的历史背景。另外钱王祠关联着“建筑、塑像”等体现了钱王祠的历史底蕴;“钱王祠–举办–花展”、“公园卡–花展–门票–免费”关联体现了景点通过公园卡可以参观,景点举办的花展活动吸引了很多游客、但公园卡主要是月卡、年卡主要是本地人办理,即本地游客较多。另外“花展–好看”说明对景点举办的花展活动评价积极。

Figure 3. Semantic network of tourist comments in Sudi Causeway
图3. 苏堤游客评论语义网络

Figure 4. Semantic network of tourist comments in Leifeng Tower
图4. 雷峰塔游客评论语义网络
由图3可见,“苏堤–苏堤春晓–风景–苏东坡–西湖十景–美景–好看”这一关联说明游客对苏堤的景色评价,体现了对景色的肯定与赞美,以及将抽象的西湖文化具体化的“苏堤春晓”给游客留下深刻印象。其次是“苏东坡–疏浚西湖–淤泥–西湖”关联表现了苏堤的人文要素、历史背景。说明苏堤景色的吸引力大于苏堤的历史文化。同时苏堤也关联着“观光车、游船、步行”体现了游览方式的多样化与便利。“值得、舒服、免费”体现了游客对景点的评价较好。
由图4可见,雷峰塔关联着“美景、白娘子、故事”体现雷峰塔的景色与历史底蕴并存,白蛇传的传奇故事让游客慕名而来。雷峰塔也关联着“美景、雷峰夕照、西湖全景”,说明雷峰夕照作为西湖十景之一给游客留下了深刻印象,以及对景色的赞美。“雷峰塔–电梯–方便”体现了新建的雷峰塔的现代化与人性化,为游览带来便利。“风景–好看”等评价词语表达了游客对景色的认可和赞美。此外,雷峰塔也关联着“新白娘子传奇”,说明影视作品、民间故事,在一定程度上对景点的宣传有作用。雷峰塔关联的大多为风景相关的词语,说明传奇故事吸引游客来游览,但游览过程侧重于简单的排队登塔看景。

Figure 5. Semantic network of tourist comments in Yuewang Temple
图5. 岳王庙游客评论语义网络

Figure 6. Semantic network of tourist comments in Lingyin Temple
图6. 灵隐寺游客评论语义网络
由图5可见,岳王庙以“岳王庙、岳飞”为中心关联着“英雄、历史、报国、纪念、民族、故事、爱国”,充分体现了景点的爱国主义主题明确,游客对景点的认知明确、对景点的爱国氛围、历史价值的认可;此外,岳王庙关联着“值得、学习、瞻仰”表示游客来瞻仰民族英雄,学习爱国精神且体验值得。
由图6可见,灵隐寺以“灵隐寺–购买–寺庙–门票–飞来峰”为中心,由于灵隐寺景点在飞来峰景区内,去灵隐寺必须购买飞来峰的门票。“灵隐寺–香火–旺盛”体现了灵隐寺的宗教地位。另外灵隐寺关联着“祈福–寺庙–值得”、“风景-很好”说明游客来此大多为了祈福,体检较好,对景区的风景的认可。“灵隐寺–交通–方便”,景点虽然在西湖景区里面,这个关联说明景点的交通便利。此外,灵隐寺也关联着“佛教、建筑、素面”体现灵隐寺的宗教文化、建筑特色、特色产品也吸引着游客。
综合语义网络的特征关联分析可见,对于人文景观来说历史文化的体验和门票价格影响游客情感倾向。游客对雷峰塔、岳王庙和灵隐寺景点的历史文化更感兴趣,而对苏堤的景色、郭庄、钱王祠的花展更关注;郭庄、钱王祠开展的花展活动不定期举办,说明这2个景点的活动主要是针对本地游客,景点缺少对外地游客的活动。
3.3. 游客情感分析
为进一步了解游客对景点的情感形象,基于情感词典对游客评论进行情感分值计算,得到评论总情感得分在−16.75到+48.75之间。并对情感倾向的分级更能看出游客对这6个景点旅游的情感倾向,将对积极情感得分和消极情感得分分区间统计分析情感倾向。将积极情绪和消极情绪分别分为3个区间,情绪评分绝对值小于5为轻度情感倾向,绝对值小于10为中度情感倾向,绝对值大于等于10为高度情感倾向。具体结果如表2所示。

Table 2. Sentiment analysis of tourist comments
表2. 游客评论情感分析
由表2可见,6个景区的情感倾向总体为积极情绪。其中郭庄的积极情绪在六个景区内最高,达到91.87%,其次是钱王祠为87.99%;岳王庙和雷峰塔的评论消极情绪比例较高,分别为7.27%和8.23%。在积极情绪中,轻度情感倾向的评价最多,占各景区的积极情绪评论总数53.82%到77.35%之间,中度情感倾向和高度情感倾向的占比较小。高度情感倾向占比最小,其中郭庄为13.67%,岳王庙为4.62%。大多的积极情绪倾向不是太强烈,说明景点的旅游体验还有很大的进步空间。
在消极情绪中,轻度情感倾向的评价同样最多,在占比方面超过了积极情绪,都达到了95%以上,中度情感倾向和高度情感倾向的评价所占的比例较小。雷峰塔和灵隐寺的中度消极情绪相对较高,可能由于景点相对热门,游客较多影响旅游体验。差评的情感得分平均值为−1.58,这说明游客给出的差评情感倾向总体不是太强烈。
4. 结论与讨论
4.1. 结论
本文运用八抓鱼和python爬虫分别从携程网和大众点评获取游客评论数据,采用关键词词频、语义网络、情感分析对评论文本内容分析,分析了游客对西湖的6个人文景点的认知形象、情感形象,得到游客对旅游地的整体形象,主要为以下几个方面:1) 景点以各自特色的人文历史为主题吸引游客,且游客对这些特色历史文化有一定的了解与认知。游客游览景区目的明确,大多是为了解历史,感受独特文化。游客的游览总体体验较好,旅游情感形象积极;2) 景点的门票价格与体验价值是否相符、景点设施服务是否完善、景点的交通是否便利都会影响景点的旅游形象。3) 景点开展的活动对本地游客的宣传较到位。
存在的问题有:1) 景点文化建设不足,人文体现较少。例如,郭庄与钱王祠的游客更关注景点开展的花展活动而不是景点本身的历史文化;大多人去灵隐寺为了祈福,对佛教等文化并不关注;游客去苏堤主要关注其风景,很少关注苏堤的历史文化;2) 景点宣传不到位,知名度有待提升。根据景区评论数量来看,钱王祠的游客较少。3) 景点的设施和服务有待改进。存在一些设备坏了没有及时维修或更换、景点环境基础设施不够完善;景点服务中心服务不到位、服务人员态度较差的情况。
4.2. 讨论
总的来说,网络游客评论显示出游客对这6个景区旅游资源和人文价值认可与向往,同时也显现出一些问题。可从以下方面进行改进:
1) 凸显历史文化内涵,丰富旅游体验。应进一步挖掘景区历史文化内涵,努力打造特色,开展历史文化相关活动,提高景区知名度。例如,钱王祠可以通过宣传杭州历史,郭庄宣传其建筑特色;对于热门的景区,灵隐寺可以将佛教中国化,跟上当代中国的发展,将历史文化融入现代元素。雷峰塔可以丰富讲解方式,在排队过程中添加视频、增加互动等方式,加大宣传其中的文物等,从而更好地展现相应的人文历史价值。
2) 提升服务水平,完善配套设施。一方面努力提高工作人员素质,转变服务理念,提升服务水平;另一方面关注游客需求完善景区设施,对讲解服务体验进行跟踪、改进。考虑纸质电子并存,满足不同游客需求。在客流量较多时如何避免因游客过多影响游览体验。对于景区周围的交通,整合区域旅游资料、科学规划,提供良好便捷的交通;通过宣传教育,提高旅游地居民认识,营造良好的旅游环境和氛围,提升区域旅游竞争力。
3) 重视网络信息,提升景区影响力。游客到景点之前会关注、了解景点信息,而评论是其中重要的部分。一些负面评价不仅表现出对景区本身的评价,还会影响游客对景点的印象,或整个区域旅游环境的认知。景区应当关注最新评论,及时发现不足之处,对其改进。