1. 引言
旅游目的地形象Tourist destination image (TDI)是旅游学科的重要概念之一。1971年,Hunt [1] 提出旅游目的地概念。Baloglu等 [2] 提出了心理相关的TDI模型。Beerli等 [3] 完善了旅游认知分析,Russel等 [4] 提出了旅游情感分析方法。他们使TDI分析愈发科学规范。内容分析法 [5] 是TDI分析的重要手段,游记是内容分析法的主要资料之一,自然语言处理技术为互联网时代的海量网络游记分析提供了良好的技术支持。
目前,使用内容分析法进行TDI分析的研究备受关注,魏娇 [6] 分析了100篇济南游记,提出济南应以强带弱,提升服务质量等建议。李伟等 [7] 分析了292篇游记,发现了苏州古镇的商业化、旅游容量等问题。易婷婷 [8] 分析了80篇游记,发现西藏地区文化资源最为吸引游客等结论。方世敏等 [9] 分析了41篇游记,认为韶山的拥挤、代沟等现象需要关注。张力硕等 [10] 分析了52篇游记,得出游客对武汉的人文资源感受最深等结论。王峥 [11] 分析了366篇游记,发现河南旅游路线、商业化现象和气氛还有改进空间等结论。索志辉等 [12] 对开封网络评论进行了TDI分析。冯庆等 [13] 把目标定位于陕西的八大5A级风景区。Fakeye等 [14] 比较了重游次数与TDI的关系。Dimitrios等 [15] 检验了TDI认知模型。Joseph [16] 分析了TDI的影响因素。Tapachai等 [17] 从收益和价值角度进行TDI分析。Hsu等 [18] 通过访谈进行美国TDI分析。Choi等 [19] 根据多个旅游网站分析了澳门各地的TDI。Govers等 [20] 根据图片和文字进行了迪拜TDI分析。
但上述研究尚存不完善之处,如张力硕等 [10] 的研究中,樱花是武汉最显著的旅游形象符号之一,但樱花只在春季盛开。魏娇 [6] 的研究中,济南景点中泉水最受关注,但济南泉水喷涌现象以秋初为主。方世敏等 [9] 提出了韶山拥挤的原因部分出自节假日。那么韶山非节假日拥挤现象应有减轻,节假日应更严重。但以上信息却无法反应在结论中。这是因为传统的TDI分析是静态、综合的,无法体现旅游地的时令性特征,甚至将时令性特征视为整体特征,造成结论的偏差甚至错误。
季节与TDI关系深刻,对未来的旅游活动有长远的指导意义,被游客普遍参考,是重要的时令性外部条件之一。因此,本文基于13,033篇携程游记,根据季节的变化进行季节性TDI分析,本文选取四季皆宜而景色各有不同的云南作为分析对象,在传统TDI分析的基础上进一步分析并对比四季TDI,对游客出游和旅游地发展提出更准确全面的建议。
2. 研究方法
本文选取携程旅游网2015年至2019年共13,033篇游记进分析,使用中科院自然语言处理与信息检索共享平台Natural Language Processing & Information Retrieval Sharing Platform (NLPIR)分词系统进行分词,使用汉语言处理包Han Language Processing (HANLP)进行词性标注,使用GooSeeker进行词频分析和情感分析,数据处理流程见图1。本文尽量保持游记的原始内容,仅在高频词分析时删除了如下词:1) 代词;2) 连词;3) 无具体含义,仅形容程度或范围的词,如“很多”;4) 代表前往、观看,但既不体现旅游方式,又不包含感情倾向的词,如“前往”;5) 用于行文连贯的词,如“现在”。

Figure 1. Flowchart of travel data processing
图1. 游记数据处理流程图
根据Baloglu等 [2]、Beerli等 [3] 与Russel等 [4] 的研究,本文提出如下分析类目:1) 游客分析:本文主要针对游客的出游时长、同伴、旅游消费进行分析;2) 认知分析:本文根据高频词数据,对云南的旅游资源、旅游配套服务、社会环境与气氛进行分析,其中旅游配套服务包括餐饮、住宿、交通、旅游、购物、娱乐共6方面,社会环境与气氛除了传统的市容市政、居民素质与态度外,还分析了云南的旅游目的地节奏问题,共3方面;3) 情感分析:通过游记中的正面、中性、负面句进行情感分析。本文将分别分析并比较云南全年及四季TDI,得出综合结论并提出相关意见。
3. 结果分析
3.1. 游客分析
本文分析了13,033篇游记中游客全年与四季的出游时长、同伴、消费,并计算了具有给定特征的某季游客占全年游客的比例。结果如表1与图2、图3、图4所示。总体来说,云南游客具有以下特征:

Table 1. Statistics of tourist characteristics
表1. 游客特征统计表
1) 时长:出游时长总体较高,长期游客更倾向于在夏秋两季出游。由数据可知,出游时间2天~7天游客位列第一,8天以上位居第二,可见云南游客的出游时间普遍偏长,表明云南景区较为优秀,足以留住游客。从季节角度,春冬两季长期游客较少,夏秋两季反之。值得注意的是,长期游客具有更明显的季节偏向性。
2) 同伴:旅游同伴以朋友为主,基于亲情、爱情的出游缺乏吸引力;出游季节选择主要受假期影响,不同同伴的游客错峰出游现象明显。和朋友出游篇数明显高于其他选项,独自出游位居第二。这两者的数量大幅度超过基于亲情的出游,即父母和亲子出游频次之和,或基于爱情的出游,即情侣与夫妻之和。基于亲情、爱情出游者数量较少且两者差距不大,表明云南在亲情和爱情方面没有特别的吸引力。和子女、父母、情侣、夫妻这四种重要同伴的出游有两个明显特征:受到节假日影响,错峰出游。和子女出游以夏冬为主,对应寒暑假;和父母出游以冬为主,对应春节;情侣出游以夏秋为主,对应暑假与国庆;夫妻出游除集中于夏季外,还避开了上述三个季节,以春季为主。以上分布体现了明显的错峰现象。若根据节假日分析,情侣除了暑假出游,也可于寒假出游,但由于情侣与父母一般不同住同游,与夫妻出游相互冲突,因此寒假出游率反而较低。
3) 消费:消费在1001~5000元的人数居多,高消费游客更加偏爱夏季出行。消费在1001~5000元的游客位居第一,一方面,该现象是云南众多景点、出游时间较长、同伴较多导致的,表明云南对游客有较强的吸引力。另一方面,该现象同样意味着云南旅游价格可能偏高。在消费方面,同样存在消费越高则季节倾向越明显的现象。其中高消费游客倾向于夏秋出行。值得注意的是,鉴于冬季的低占比,吸引高消费游客的并非寒暑假或春节,更可能是夏季的凉爽气候和时令性景观。
因此,在游客分析角度,云南四季的形象词条如下:春:短期出游,爱情,低消费;夏:长期出游,亲情、爱情,高消费;秋:长期出游,爱情,高消费;冬:短期出游,亲情,低消费。综上,云南季节可基本分为夏秋、春冬两部分,若认为时间长、消费高、与重要的同行者出游对游客更有意义,则游客更喜欢于夏秋两季进行意义重大的出行,且意义越重大,季节倾向越明显。
3.2. 认知分析
本文分析了云南全年与四季排名前100的高频词,结果见表2,未上榜者以“/”表示。图5为云南四季高频词云图,中部为全年高频词,四周分别为春夏秋冬高频词。

Table 2. Top-100 high frequency words for the whole year and the four seasons
表2. 全年与四季排名前100高频词表

Figure 5. Top-100 high frequency words cloud graph for the whole year and the four seasons
图5. 全年与四季前100高频词云图
3.2.1. 旅游资源
根据高频词,云南旅游资源有如下特征:
1) 云南的旅游资源极为丰富,广受欢迎。高频词中,地区共6处,景点共18处,场所共15处,合计39处。说明云南旅游资源非常丰富。
2) 云南水景大受欢迎,山景较少被游客提及。18个景点中,包括具备多种性质的景点在内,水景,即湖泊、河流、湿地、峡谷等景点共8处,山景,即山脉、峡谷、特殊地貌等景点共5处,人文景点共7处。结合排名分析,可见水景在云南广受欢迎,山景较少被人提及。
3) 夏季旅游以水景和人文景观为主;冬季以山景为主。水景和人文景观总在夏季更受欢迎,山景则在冬季更受欢迎。
3.2.2. 旅游配套服务
本文从食住行游购娱六个角度分析旅游配套服务。
1) 餐饮:云南餐饮风味优美,广受欢迎,以春季为最。6个餐饮相关词全部倾向于春季,没有一个倾向于秋季。在六要素中,除占比极高的旅游要素外,餐饮关键词数量与排名偏高,没有负面词汇,可见云南餐饮广受欢迎。
2) 住宿:特色客栈与酒店兼顾旅游和住宿需要,住宿行业根植于旅游业蓬勃发展。相较餐饮服务,住宿关键词数量略少、排名略高,表明住宿与餐饮同样具有较高的关注度。住宿高频词中,同样与旅游相关的“客栈”、“酒店”排名靠前,与旅游关系较少的“房间”、“住宿”则相反,体现了云南住宿地与旅游的息息相关。值得注意的是,没有任何一个住宿词倾向于春季。
3) 交通:跨省交通以飞机为主,省内交通中,独有的索道广受欢迎。交通词汇共8个。其中“机场”词频高于“火车”,“飞机”高于“火车站”,说明飞机是云南跨省交通的最主要途径。在省内交通中,除了“司机”、“徒步”分别体现乘车、步行外,“索道”一词排名相当靠前,这一兼具旅游功能的特色交通方式占据了重要的地位。
4) 旅游:旅游资源高度丰富,少数民族特色文化具有深厚内涵。除旅游资源分析中的39个词属于旅游范畴外,还包含旅游相关词23个,合计高达62个,另有民族相关词共4个,可见云南的旅游资源丰富。云南四季均具有较多时令性景观,如春季的“梯田”,夏季的“草原”、秋季的“高原”、冬季的“温泉”等场所独具特色。
5) 购物:购物受到关注较少,相关产业有待加强。与购物和价格相关的词汇较少,没有特定的购物地和特色产品,只有“老板”、“价格”、“门票”三个宽泛词汇。经分析,老板以客栈、酒店、餐厅老板为主,其它老板以贵金属业为主,可能高昂的价格是云南购物欠发达的原因之一。
6) 娱乐:丽江酒吧一枝独秀,景区表演涵盖广泛。与娱乐相关的词汇有2个。“酒吧”是丽江的特色,这一具有现代气息的娱乐场所在云南独树一帜。“表演”一词涵盖广泛,经上下文分析,以歌舞、戏剧、动物表演为主。
3.2.3. 社会环境与气氛
1) 市容市政:社会氛围与旅游氛围高度结合,游客赞不绝口。氛围词汇共8个,这些词富有人情味与烟火气,独具民族特色,表现了亲近自然、向往自由的氛围。同时体现了云南社会机能和旅游机能的高度融合的特点。游客评价词共10个。除“一般”外均为赞美词,游客对云南给予了高度评价。
2) 居民素质与态度:
a) 商家态度亲切、热情好客、富有人情味。涉及商户的仅有“老板”一词,评价以正面居多,上下文以闲聊、请老板帮忙为主。说明云南的社会氛围是非常热情友善、有人情味的。
b) 不合理收费的现象确实存在,刻板印象也根深蒂固。除涉及价格的“价格”“门票”外,“司机”一词也值得关注。这些词上下文频繁出现胡乱定价、中途涨价、强行收费等行为。同时“事先谈好价格”等防备性语句频现,意味着部分游客已经对不合理收费产生防备心理。
3) 旅游目的地节奏:时间紧张,路途遥远,游客旅游节奏紧凑。高频词中,一个特殊的现象值得引起关注:有关时间的词汇数量较多,共有7个。上下文中,游客时有表示车程过长,游览时间过短,行程匆忙。前文分析,云南游客消费较高、耗时较长,因此可能对旅游更加重视。同时云南旅游业发达,过于规范化的旅游服务可能加重了旅程的仓促。
3.2.4. 总结
综上,基于认知分析的云南四季形象关键词如下:春季:餐饮、梯田、码头;夏季:水景、人文景观、住宿、公园、草原;秋季:住宿、公园、高原;冬季:山景、梯田、城市、民族、温泉。
可见,云南夏季以水景和人文景观为主,冬季以山景为主,四季各有特色服务与场所。总体上,云南的水景更受欢迎,餐饮与住宿业较为发达,购物与娱乐业反之。云南的社会氛围充满旅游气息,人民热情好客,但依然存在不合理收费等现象,旅游节奏紧张的现象值得关注。
3.3. 情感分析
本文分析了全部游记共782,924句的感情倾向,结果如表3,其中占比指当前季节该倾向语句占全年的比例。
数据显示,13,033篇游记中,正面评价远多于负面评价,春夏两季好评相对较少,秋冬两季较多。其中夏冬两季的情感倾向需要重点关注。根据上文分析,夏季的水景和人文景观广受关注,此外夏季的旅行意义更加重大,同时受到基于亲情、爱情游客的青睐,其好评度却低于预期值。冬季以山景为主,它的游客更为一般化,好评率却较高。因此优化水景与人文景观服务,完善云南亲情、爱情特色旅游可能是改善这一现象的有效方式。

Table 3. Sentiment tendency analysis of yunnan travel notes
表3. 云南游记情感倾向分析表
4. 总结与建议
总体来说,云南的旅游资源非常丰富,山、水、人文景观兼备,水景最受关注,餐饮、住宿业发达而娱乐、购物相对薄弱。社会氛围富有人情味,独具民族特色。云南游客旅行时间长、消费高,对云南的总体印象以积极为主,而云南的问题主要集中在收费不合理和旅游时间仓促两方面。从时令角度,云南春冬以短期、低消费旅游为主,夏秋以长期、高消费旅游为主,出游同伴主要与节假日相关。夏季水景和人文景观备受关注,是唯一一个同时吸引爱情和亲情游客的景点,正面评价却略有不足。以山景为主的冬季广受好评。
本文综合考虑各项结论,试图基于本文的研究成果,对云南的发展提出建议,现总结如下:1) 开拓亲情、爱情主题旅游;2) 以完善水景和人文景观为核心,开发云南四季时令性旅游资源;3) 促进娱乐与购物产业发展;4) 整顿社会氛围与扭转刻板观念并重;5) 旅游时间仓促的现象需提起重视。
值得注意的是,本文的部分结论触及到了传统观念所忽略的领域,与人们对云南的一般印象相比,开拓了新的视角,各个结论相互联系、互为补充。这些结论无疑是最具有价值的。它们可以从全新的角度优化游客的旅游体验,触及云南形象的盲点,进一步丰富云南文化内涵。
基金项目
云南省科技厅面上项目(202001BB050063);云南省教育厅科学研究基金项目(2019J0008,2020J0002);中国博士后科学基金会面上资助项目(2018M631627);泰安市科技创新发展项目(政策引导类) (2020NS297);泰山学院引进人才科研启动基金项目(Y-01-2020006)。
NOTES
*通讯作者。