基于百度指数的北京市高A旅游景区网络关注度研究
Research on the Network Attention of the High-Grade Scenic Spots in Beijing Based on Baidu Index
DOI: 10.12677/SA.2021.104061, PDF, HTML, XML, 下载: 306  浏览: 453  科研立项经费支持
作者: 李静静, 李志新*, 张 悦:河北工程大学,数理科学与工程学院,河北 邯郸
关键词: 互联网+旅游高A旅游景区百度指数网络关注度北京市Internet + Tourism High-Grade Scenic Spots Baidu Index Network Attention Beijing
摘要: “互联网+旅游”背景下旅游网络关注度为了解景区旅游需求时空变化提供了重要的切入点。基于百度指数数据分享平台,通过获取2011~2020年北京市68家高A旅游景区的网络搜索数据,借助Python和ArcGIS软件,运用年际变动指数、季节性强度指数和地理集中指数对其进行时间和空间上的特征分析。研究发现:1) 北京市5A高等级景区和1A初等级景区数量较少,“中间大,两头小”的纺锤体结构仍有优化改进的空间。2) 旅游景区网络关注度呈现出旺季较长、平季和淡季较短的特征,并且月度特征由“双峰”向“多峰”转变,高峰出现在4月、8月和10月,与实际旅游流基本吻合。3) 节假日期间网络关注度呈现先升后降趋势,并且随着年份由倒“U”型转变为倒“V”型,其中“五一”关注度高峰出现在4月29~30日,具有明显的前兆效应,“十一”关注度高峰出现在10月2~3日,与实际旅游流趋于一致。4) 全国31个省市对北京高A景区关注度存在明显差异,表现为“近高远低、东高西低”的空间分布特征,主要是地理空间距离和社会经济发展水平综合影响的结果。
Abstract: The tourism network concern degree under the background of “Internet +Tourism” provides an important breakthrough point for understanding the temporal and spatial changes of tourist demand in scenic spots. Based on the Baidu index data sharing platform, this paper obtains the online search data of 68 High-grade scenic spots in Beijing from 2011 to 2020, and uses Python and ArcGIS software to analyze their temporal and spatial characteristics by using the interannual variation index, seasonal intensity index and geographic concentration index. The results show that: 1) The number of 5A scenic spots and 1A scenic spots in Beijing is small, and the spindle structure of “big in the middle, small at both ends” still has room for optimization and improvement. 2) The network attention of scenic spots shows the characteristics of longer peak season, shorter average season and off-season, and the monthly characteristics change from “double peak” to “multi peak”. The peak appears in April, August and October, which is basically consistent with the actual tourism flow. 3) During the holidays, the network attention shows a trend of first rising and then falling, and changes from inverted “U” type to inverted “V” type with the year. The peak of attention on the “May Day” appears from April 29 to 30, which has obvious precursor effect. The peak of attention on the “National Day” appears from October 2 to 3, which is consistent with the actual tourism flow. 4) There are obvious differences in the attention of 31 provinces and cities to Beijing high-grade scenic spots, which shows the spatial distribution characteristics of “near high and far low, east high and west low”, mainly due to the comprehensive influence of geographical spatial distance and the level of social and economic development.
文章引用:李静静, 李志新, 张悦. 基于百度指数的北京市高A旅游景区网络关注度研究[J]. 统计学与应用, 2021, 10(4): 593-609. https://doi.org/10.12677/SA.2021.104061

1. 引言

随着社会经济和互联网技术的快速发展,大数据在这个发展过程中应运而生,同时大数据的快速发展也推动了互联网的发展。截至2020年12月,我国网民规模达到9.89亿,互联网普及率达到70.4% [1]。旅游业已成为全球经济中发展势头最强劲和规模最大的产业之一,也是我国经济发展的支柱产业之一,同时也能带动其他产业的发展。在此背景下,“互联网+旅游”不断迸发出新的火花,旅游信息的传播不再受到时空限制,人们以搜索引擎为平台,以网络搜索关键词为钥匙,在互联网中寻找旅游信息。充分利用大数据,获得有价值信息是当前旅游产业的一次重大机遇,而北京市历史悠久、文化灿烂,是全球拥有世界文化遗产数最多的城市,每年吸引着大量国内外游客慕名参观,其中5A和4A级旅游景区的世界知名度比较高,一定程度上代表着北京市旅游发展的前沿水平。因此,研究北京市高A旅游景区网络关注度时空分布特征,可以及时掌握游客的旅游需求变化,为景区应对旅游高峰提供科学依据,对促进旅游产业高质量、可持续发展具有重要现实意义。

在国内现有文献中,2008年李山等 [2] 利用百度指数数据,对中国第一批66个5A级景区2006年9月~2017年9月网络关注度展开统计分析,研究发现网络关注度是其现实游客量的前兆。2013年黄先开等 [3] 运用计量经济学探究了百度关键词与北京故宫实际游客量之间的关系,并建立了自回归分布滞后模型,增强了预测的时效性。2019年刘嘉毅等 [4] 对“天价虾”事件网络关注度的时空演变特征进行了分析。2020年许艳等 [5] 结合区域经济差异测算指标,对2013~2017年中国大陆31个省市对乌镇景区的网络关注度进行研究,结果表明网络发达程度、地理空间距离、气候舒适度等是影响时空差异的主要因素。在国外现有文献中,2009年Zheng X.等 [6] 指出用户输入搜索引擎的关键词可以在一定程度上反映旅游目的地的形象,此外在关于一个特定城市的搜索中,旅游搜索的比例与该城市的“旅游”水平有关,旅行者搜索的关键词反映了他们对城市及其竞争对手的了解。2013年Bing P. [7] 深入研究了搜索引擎的排名和网络点击量的关系,在排名靠前的搜索引擎中,关于旅游目的地信息的网络点击量也呈现出较高的趋势。点击量与搜索引擎排名有着同样的变动趋势,因此在互联网背景下,需要对旅游要素进行整合,创造新的营销手段。

2. 研究目的及意义

本文的研究目的是在“互联网+旅游”背景下,从网络搜索视角出发,利用百度指数衡量北京市旅游网络关注度,丰富网络搜索在旅游需求中的应用,研究结果有助于旅游景区正确选择营销推广时段和目标投放地区,避免盲目的、无序的客源市场开发,为北京市旅游景区网络营销、旅游市场开发和旅游景区游客预警管理提供实证依据,从而更好的推动北京市旅游景区的可持续发展和互联网与旅游的深度融合发展。

3. 研究设计

3.1. 网络关注度

随着大数据时代的到来,越来越多的人依赖于互联网获取旅游相关信息。网络关注度即事物在网络空间受到关注的程度。人们通过网络搜索引擎快捷方便的搜索所需的各类信息,于是网络搜索关键词和浏览痕迹都被搜索引擎记录下来,由此生成了海量的网络搜索数据。网络搜索数据潜在的反映出人们的意愿,比如在网络上搜索“北京旅游”,这意味着他近期或者不久的将来有去北京旅游的想法或者是他身边的亲人和朋友有这个意向需要帮忙查询相关信息,为外出旅游做好准备。通过统计这些数据,可以分析出在一定时段内人们对旅游信息的关注程度。旅游景区网络关注度是游客通过互联网辅助决策形成的,贯穿于游客旅游的整个过程,即:出行前,游客在网上搜索旅游路线、景区、天气等信息;旅游中,游客随时查询交通路线、住宿地址等信息;结束后,游客在论坛、贴吧等网络社交媒体上分享旅游感受,其后出行的游客又可以通过搜索引擎检索到这类信息,成为他们制定旅游计划的依据。

目前,在中国搜索引擎行业中,百度是国内使用率最高的搜索引擎,《2019年中国网民搜索引擎使用情况研究报告》显示,百度搜索品牌的渗透率达到了90.9%,受到国内用户的青睐 [8]。根据Statcounter网站流量检测机构的统计数据,过去几年里百度搜索所占市场份额始终位列第一,百度在中国搜索引擎的市场份额中占比74.37%,用户规模最大,远远领先于搜狗(13.7%)和谷歌(3.66%)。2006年,百度推出了以百度海量网民行为数据为基础的数据分享平台——百度指数,包括“趋势研究”、“需求图谱”和“人群画像”三个模块。它以关键词为统计对象,计算出各个关键词在百度网页搜索中搜索频次的加权,通过曲线图的形式展示关键词的持续变化情况,可以较为准确全面地反映游客对旅游景区的网络关注度,具有较好的代表性。

本文采用百度指数来衡量北京市A级旅游景区网络关注度,从而研究北京市高A旅游景区网络关注度的时空分布特征。

3.2. 数据来源

旅游景区网络关注度数据来源于百度指数平台提供的关键词搜索指数,数据获取包括景区确定、关键词确定。

3.2.1. 景区确定

按照《旅游景区质量等级的划分与评定》中的划分标准,将旅游景区从高到低依次分为5A、4A、3A、2A和1A五个等级,其中5A级是中国旅游景区最高评定标准,代表着世界级旅游精品景区等级,具有国际市场的高知名度;4A级旅游景区在全国范围内知名度较高,具有较高的资源吸引力和市场吸引力;3A级景区周边省市具有一定的市场吸引力。通过百度指数平台,对北京市227家A级景区关键词进行搜索汇总,发现3A级以上景区网络关注度占比达到80.87%,3A级景区网络关注度占比14.98%,2A级景区网络关注度占比仅为4.15%,见图1。考虑到北京市A级旅游景区数量众多,5A和4A级旅游景区的世界知名度比较高,是国内外游客聚集相对较高的景区,也是我国旅游景区的中坚力量,而3A级及以下旅游景区关注度占比不大,绝大多数景区知名度不太高。

因此,本文选取9家5A级旅游景区和72家4A级旅游景区代表北京市旅游发展的前沿水平,对其进行网络关注度统计,在一定程度上可以体现北京市旅游景区的整体趋势。

Figure 1. Proportion of network attention of A-grade scenic spots in Beijing

图1. 北京市A级旅游景区网络关注度占比

3.2.2. 关键词确定

搜索关键词的确定是网络关注度研究的关键环节,然而目前关于搜索关键词的选择方法研究还没有统一的标准,主要方法有:技术取词法、直接取词法、范围取词法。考虑到本文研究对象是北京市5A级和4A级旅游景区,有确定的景区名称,因此,采用直接取词法。将81家高A旅游景区的全称作为关键词,获得自2011年1月1日至2020年12月31日的百度指数日搜索量。在搜索过程中,会出现以下几种情况:第一种是关键词未被收录即将景区全称输入百度指数搜索栏无结果;第二种是关键词指代不明即其他地方有与北京市相同名字的景区。

对于第一种情况,可能是游客搜索行为导致的,大部分网络用户对景区搜索时会输入简写名称进行搜索,因此,对景区全称进行增删修改,选择整体搜索量最高的词语作为最终该景区的关键词,若多次尝试都显示未被收录,认为该关键词为无效搜索,将其剔除。如将“圣莲山旅游度假区”作为关键词进行百度指数搜索,结果显示关键词“圣莲山旅游度假区”未被收录,将“圣莲山”和“圣莲山风景区”作为搜索关键词,结果均会显示搜索量的变动趋势,但发现关键词“圣莲山风景区”对应的百度指数日搜索量要比关键词“圣莲山”高得多,因此考虑选择对百度指数日搜索量更高的关键词进行搜索。

对于第二种情况,在景区全称前加上“北京”或“北京市”作为前缀,若显示趋势图,则将其作为最终关键词,否则将其剔除。如在百度搜索引擎输入“云居寺”,同时有“西安云居寺”和“北京云居寺”,所以通过对比,将“北京云居寺”作为关键词进行百度指数搜索,结果显示搜索量的变动趋势,认为有效。

整个搜索过程,可以发现“小汤山现代农业示范园区”、“仙居谷风景区”、“北京张裕爱菲堡国际酒庄”、“世界葡萄博览中心景区”、“龙潭公园”、“中国园林博物馆”、“谷山村景区”和“北京世园景区”八个旅游景区的所有关键词均显示未被收录,而“八奇洞风景区”、“顺义国际鲜花港”、“乐多港假日广场”、“京东石林峡”和“南宫旅游景区”五个旅游景区的关键词搜索量大部分为零值,因此,将这13家旅游景区予以剔除,最终获得68家A级旅游景区,其中5A级景区9家,4A级景区59家,见表1

Table 1. Baidu Index search keywords of high-grade scenic spots in Beijing

表1. 北京市高A景区的百度指数搜索关键词

3.3. 研究方法

3.3.1. 年际变动指数

年际变动指数用来反映网络关注度年际差异的相对值,将历年网络关注度的平均值作为基准数,然后用此基准数去除各年的网络关注度,计算公式如下:

Y i = X i i = 1 n X i n (1)

式中, Y i 表示年际变动指数, X i 表示第i年景区网络关注度,n表示年度数。 Y i 越接近于100%,表明网络关注度的年际变动强度越小,关注度越稳定;反之, Y i 值过大或过小,越远离于100%,则表明网络关注度的变动强度越大,关注度越不稳定。

3.3.2. 季节性强度指数

季节性强度指数用来反映网络关注度的时间集中程度,计算公式如下:

R = i = 1 12 ( X i 8.33 ) 2 / 12 (2)

式中: X i 表示第i月网络关注度占全年总关注度的比重,8.33是全年总关注度的平均值即将100%平均分配到12个月所得到的比重。R值越大,表明网络关注度的季节性差异越明显,分布越集中,淡旺季之间的差异就越大;R值越接近于零,表明网络关注度的季节性变动越小,全年分布越均匀。

3.3.3. 地理集中指数

地理集中指数用来衡量旅游流空间分布结构,计算公式如下:

G = 100 × i = 1 n ( P i / P ) 2 (3)

式中: P i 表示第i个地区的网络关注度,P表示所有地区的关注度总量,n表示地区数。地理集中指数取值范围为[0, 100],当各地区平均分时地理集中指数为18。G值越大,表明网络关注度空间分布越集中;G值越小,表明网络关注度空间分布越分散。

4. 北京市A级旅游景区总体发展情况

北京市地处中国华北平原北端,东与天津市毗连,其余均与河北省相邻,分为首都功能核心区、城市功能拓展区、城市发展新区、生态涵养发展区四大功能区,共辖16个区。对北京市2001年至2020年4个时间段A级旅游景区数量进行统计,发现A级旅游景区总体数量呈现逐年上升趋势,由2001年的47家增加到2020年的227家,年均增长率达到8.64%,见表2。2001年北京市产生首批A级旅游景区47家,2007年首批入选故宫、天坛、颐和园、八达岭长城4家5A级景区,此后相继增加5家5A级景区。截至2020年底北京市A级旅游景区数量已经达到227家,其中5A级景区9家,4A级景区72家,3A级景区115家,2A级景区31家,1A级景区0家。综合景区等级和数量来看,3A级景区所占比例最大,其次是4A和2A级景区,而5A高等级景区和1A初等级景区数量较少,意味着这种“中间大–两头小”的纺锤体结构仍有优化改进的空间。

从不同等级旅游景区发展情况来看:3A级和4A级旅游景区增加数量最多,分别从2001年4家和17家增加到2019年115家和72家,年均增长率分别高达19.34%和1.82%。5A级旅游景区增长缓慢,2007年故宫博物院、天坛公园、颐和园、八达岭长城成为北京市首批5A级景区,此后十三陵、慕田峪长城、恭王府、奥林匹克公园相继入围5A级景区,2020年圆明园从4A级景区升级正式成为5A级景区。

Table 2. Statistics of different stages of A-grade scenic spots in Beijing

表2. 北京市A级旅游景区不同阶段统计

5. 北京市高A旅游景区网络关注度的时间分布特征

5.1. 年际特征

通过百度指数平台,获取2011年至2020年全国31个省、自治区、直辖市对北京市68家高A旅游景区的百度指数日搜索量,计算北京市高A旅游景区每天的网络关注度总和,按照对应年份得到当年的网络关注度总量和年增长率,见图2。可以看出,北京市高A旅游景区网络关注度总体上呈现出先增后减的趋势,并且变化幅度大小不一,从2011年开始网络关注度逐年增长,2014年网络关注度有较大幅度增长,年增长率达到17.77%,2015年和2016年网络关注度保持低速增长,分别为9.48%和8.44%,并且在2016年网络关注度达到顶值,从2017年开始网络关注度开始有所回落,2018年网络关注度年增长率为−12.45%,2019年年增长率稍有改善,但仍为负值。由于近几年市面上众多搜索引擎产品可供用户自由选择,一定程度上对百度引擎形成了冲击,并且抖音、快手等短视频的出现和微博、今日头条等自媒体的崛起,导致百度搜索在信息上的优势流失,使得总体网络关注度有所下降。2019年12月爆发新型冠状病毒疫情,对国内各地旅游业产生深远影响,直到2020年夏季旅游市场开始逐步恢复,导致2020年一整年的总体网络关注度仅为472,161,负增长31.12%,达到近十年最低值。

Figure 2. Annual changes of the network attention of high-grade scenic spots in Beijing (2011~2020)

图2. 2011~2020年北京市高A景区网络关注度年度变化

为了进一步研究网络关注度的年际特征,本文使用年际变动指数来衡量。运用公式(1),通过计算得出北京市高A旅游景区网络关注度的年际变动指数,具体结果见表3。可以看到,网络关注度的年际变动指数逐年攀升,从2011年的64.25%增加到2013年的87.79%,随后逐渐远离且大于100%,年际变动指数在2016年更是达到了128.82%,表明全国对北京市景区网络关注度的年际变化幅度较大,总体不够稳定。但2016年之后,网络关注度的年际变动指数呈现快速下降趋势,到2019年网络关注度的年际变动指数数值为105.85%,最为接近100%,表明全国对北京市高A级旅游景区网络关注度的年际变化强度较小,网络关注度较为稳定,有利于北京市各个旅游景区的长期均衡发展。值得注意的是,2020年年际变动指数直降为80.73%,可见旅游因为疫情备受冲击,可以说2020年是旅游业最艰难的一年,经历了从“熬过去”到“活下来”的过程,未来需要在疫情常态化的大背景下,通过线上平台或网红景点带动当地旅游经济复苏。

Table 3. Inter annual variation index of scenic spots network attention in Beijing (2011~2020)

表3. 北京2011~2020年景区网络关注度年际变动

5.2. 季节特征

通过百度指数平台获取的网络关注度是虚拟旅游流,但在一定程度上可以反映现实旅游流,本文参考旅游客流季节划分标准 [9],统计全国对北京市高A旅游景区对应年份的月度网络关注度,将当月网络关注度高于年内网络关注度的月份划分为旺季,当月网络关注度介于年内网络关注度80%至100%之间的月份划分为平季,当月网络关注度低于年内网络关注度80%的月份划分为淡季。通过计算得到

Table 4. Distribution of the network attention in low and peak seasons of high-grade scenic spots in Beijing

表4. 北京市高A旅游景区网络关注度淡旺季分布

北京市高A旅游景区网络关注度历年淡旺季分布情况,见表4。对比可以发现,2011年至2020年这十年间全国对北京市高A旅游景区网络关注度情况表现为:虽然各年淡旺季分布存在些许差异,但旺季主要集中于每年的4月至10月,平季多出现在6月和11月,淡季分布在12月和次年1月。总体而言,北京市高A旅游景区网络关注度在淡旺季分布上表现为旺季较长、平季和淡季较短的特征。

根据气象划分法,可将一年分为四个季节,每三月为一个季度,即3月至5月为春季,6月至8月为夏季,9月至11月为秋季,12月至2月为冬季。将2011年至2020年北京市高A旅游景区网络关注度按照季节进行统计,得到春季网络关注度年平均值为53,856,夏季网络关注度年平均值为56,575,秋季网络关注度年平均值为49,855,冬季网络关注度年平均值为34600,四个季节网络关注度占比分别为27.63%、29.03%、25.58%和17.75%,全国对北京高A旅游景区网络关注度在夏季比例最高,春季次之,冬季为一年中网络关注度最低的季节。

5.3. 月际特征

统计全国对北京市高A旅游景区在2011年至2020年每个月的网络关注度总和,进而得到对应年份的月度网络关注度,其变化趋势如图3所示。通过对比2011年至2020年折线图,可以看出北京市高A旅游景区每年的网络关注度变化走向具有较大的相似性。在2011年至2013年这三年间全国对北京高A景区网络关注度呈现出“双峰”特征,其中每年的4月和10月为网络关注度的峰值,11月至次年的2月为网络关注度的低谷,每年的7月和8月网络关注度有凸起趋势。在2014年至2017年这四年间全国对北京高A景区网络关注度呈现出较为明显的“三峰”特征,除了每年4月和10月外,网络关注度在8月形成一个新的峰值,表明人们在暑期外出旅游的需求越来越大。在2018年至2020年这三年间全国对北京高A景区网络关注度呈现出“四峰”的特征,在每年的2月也形成一个新的峰值,2019年数值表现最为明显,表明人们经过寒冷的冬季对外出有着迫切的需求。

Figure 3. Monthly changes in network attention of scenic spots (2011~2020)

图3. 2011~2020年景区网络关注度月度变化

纵观这十年间的网络关注度变化,可以看到最高值几乎都出现在4月份,主要是因为气候舒适和接下来“五一”节假日的来临,旅游需求迅速升高,人们选择外出踏春游玩,形成了高峰区,而每年的最低值均出现在12月或1月,主要是因为进入冬季,天气寒冷,不适宜开展外出旅游活动,人们旅游需求较弱,形成了低谷区,但同时网络关注度变化由“双峰”向“多峰”转变,反映出景区的季节影响在逐渐缩小。2020年的2月没有表现向上凸起,反倒向下凹进,是因为2019年爆发的疫情使得短时间内外出成为困难,相应的网络关注度不高。

为了进一步研究网络关注度的月际特征,本文使用季节性强度指数来衡量。运用公式(2),计算出历年季节性强度指数,结果见表5,可以看到2011年至2020年北京市高A级旅游景区网络关注度的季节强度指数分别为1.94、1.98、2.05、1.98、1.95、1.83、1.59、1.67、1.65和2.23,呈现出先增长、后下降的变化趋势,表明全年各月高A景区网络关注度存在较强的时间差异,季节波动性较为明显,但这种差异自2013年开始逐年递减。2011年至2013年季节性强度指数持续上涨,表明全国对北京市高A旅游景区网络关注度年内各月分布差异越来越大,季节性差异越来越明显,而2014年至2019年季节性强度指数开始下降,表明全国对北京市高A景区旅游需求年内各月分布逐渐趋于均匀,网络关注度具有季节性差异变小的趋势。2020年季节性强度指数增加,主要是受到新冠疫情的影响,在夏季外出旅游和冬季外出旅游形成鲜明的对比。

Table 5. Seasonal intensity index of scenic spots network attention (2011~2020)

表5. 2011~2020年景区网络关注度季节性强度指数

5.4. 周内特征

根据百度指数平台,获取全国对北京市高A旅游景区在2011年1月1日至2020年12月31日的日网络搜索量,按星期计算网络关注的平均值并绘制周内网络关注度的分布情况,见图4。可以看出,北京市高A旅游景区网络关注度总体上呈现“周末高,工作日低”的特征,具体表现为星期一至星期二景区网络关注度稍有回落,星期二至星期六逐渐上升,在星期五这天增速达到了5.73%,周内最大峰值出现在星期六,之后开始迅速下降,在周日这天降幅达到了6.05%,并在星期一触底出现周内网络关注度最小值。这一特征与旅游人数工作日较少、周末较多的现状较为相符,在周末外出旅游前,游客会通过网络搜索相关旅游信息,从而制定旅游计划,一般来说提前1至3天,也就是星期四和星期五存在较高的网络关注度,星期六达到了关注的峰值,星期日由于在旅途中而对景区的网络关注度开始下降。

Figure 4. Weekly distribution of network attention of high-grade scenic spots in Beijing

图4. 北京市高A景区网络关注度周内分布

5.5. 节假日特征

根据国务院发布的《全国年节及纪念日放假办法》,目前我国现行的法定节假日有七个,分别是春节、国庆节两个黄金周和元旦、清明节、劳动节、端午节、中秋节五个小长假。在节假日期间,人们外出旅游的意愿更为强烈,相应的景区网络关注度在节假日年后会出现较大波动,由于季节因素的影响,在“五一”劳动节和“十一”国庆节出游的人群最为明显,是游客聚集的高峰期,具有很强的代表性。因此,本文选择“五一”和“十一”这两个节假日,对北京市高A旅游景区网络关注度特征进行分析。考虑到每年具体放假日期不一样,为了确保研究时间段在节假日范围内,对北京市68家高A旅游景区2011年至2020年“五一”劳动节和“十一”国庆节假期前后的逐日搜索量进行统计,时间从节假日前一周到节假日结束后两天,见图5

Figure 5. Daily network attention during the May Day and the National Day

图5. “五一”和“十一”节假日前后逐日网络关注度

可以看出,在这十年间“五一”和“十一”节假日期间的景区网络关注度由2011年至2013年的倒“U”型逐渐变化成2014年至2020年的倒“V”型,表明北京市高A旅游景区网络关注度越来越向节假日集中,节假日与非节假日的差距越来越大。北京市高A景区历年网络关注度在“五一”前后的变化趋势基本一致,大部分年份在节假日前一至两天达到峰值,在节假日期间开始下降并在节后趋于稳定,具有明显的前兆效应,这与人们在外出旅游前搜索旅游信息的行为特征一致。从“十一”前开始全国对北京市高A旅游景区的网络关注度持续上升,并在10月2日和10月3日这两天达到峰值,之后网络关注度开始下降并在节日后趋于稳定。两者不同的是,“五一”网络关注度峰值出现在节假日开始前,而“十一”网络关注度峰值出现在节假日期间的前几天,这可能是“十一”假期时间相对较长,人们分流外出旅游造成的。

6. 北京市高A旅游景区网络关注度的空间分布特征

通过百度指数平台获取2011年至2020年全国除港澳台外31个省市对北京市高A旅游景区的百度指数,得到相应年份各省市对北京市高A旅游景区的网络关注度总和的排名情况。由表6可以发现,除少数地区的网络关注度位序存在显著跳跃现象,总体上全国各地对北京高A景区网络关注度位序相对稳定。由于研究景点全部位于北京市,北京市始终位于地区网络关注度排行榜的首位,2017年网络关注度为12,587,004,达到十年间地区网络关注度的峰值,而河北省具有明显的可达性,网络关注度仅次于北京市。广东、河北、河南、江苏、山东、上海、天津、浙江等地区网络关注度排名靠前,其中河北、河南、山东等地区位于北京周边,空间距离有较大优势,广东、江苏、上海等地区虽然距离北京较远,但经济发展较好,旅游消费能力和旅游动机较强,一直保持着较高的网络关注度。西部地区游客对北京市旅游景区关注度明显偏低,其中海南、宁夏、青海、西藏这四个地区的网络关注度排名基本维持在28、29、30、31,还有甘肃、贵州、新疆等地区由于经济发展落后,人口基数小,互联网普及率相对较低,距离目的地北京市较远,网络关注度排名靠后。

Table 6. The network attention and ranking of high-grade scenic spots in Beijing by regions

表6. 各地区对北京高A旅游景区网络关注度及排名

为了进一步研究网络关注度的空间特征,本文使用地理集中指数来衡量。运用公式(3),计算出历年地理集中指数,结果见表7。当网络关注度在全国31个省市平均分布时,地理集中指数理想数值为18,由表7可以看出,总体上地理集中指数呈现先增后减的趋势,但变化幅度不大,其中2011年至2013年地理集中指数下降,表明全国各地区网络关注度的集中程度在降低,北京市旅游景区的影响力在不断蔓延,2014年至2015年地理集中指数上升,地区分布较为集中,受到互联网各大搜索引擎和旅游网站热帖文章的影响,北京市旅游景区名声增加,网络关注度上升,造成空间分布上的不均衡。2016年后又开始逐年下降,数值较为接近18,表明全国31个关注北京高A旅游景区的地区分布较为分散,越来越趋于稳定,空间分布在不断优化。

Table 7. Geographic concentration index of scenic spots network attention (2011~2020)

表7. 2011~2020年景区网络关注度地理集中指数

运用ArcGIS软件,根据数据进行分级得到图6。由于不同省市对北京市高A旅游景区的网络关注度不同,各省市在图中呈现出的颜色存在较大差异,表明北京市高A旅游景区整体网络关注度空间分布不均匀,大致以北京市为中心,向外逐渐扩散,呈现“近高远低、东高西低”的特点,这说明北京市高A旅游景区的旅游市场在不断的扩大,也印证了北京市高A旅游景区网络关注度总体逐年增长,受搜索引擎的分流和疫情的冲击造成2017年关注度后有所回落。

Figure 6. Spatial distribution of the network attention of high-grade scenic spots in Beijing (2011~2020)

图6. 2011~2020年北京市高A旅游景区网络关注度空间分布

7. 结论

本文利用百度指数数据平台,针对北京市高A旅游景区,主要得出以下结论:从年度来看,旅游景区的网络关注度由快速增长阶段到平稳增长阶段,逐渐趋于稳定态势;从季度来看,夏季关注度最高,冬季关注度最低,且旺季较长、平季和淡季较短;从月度来看,网络关注度由“双峰”向“多峰”转变,高峰期出现在每年的4月、8月和10月,与实际旅游流相吻合;从周度来看,网络关注度在周六到达顶峰,周二降到谷底;节假日期间是游客聚集的高峰期,呈现先升后降趋势,“五一”网络关注度峰值出现在4月29日至30日,具有明显的先兆效应,而“十一”网络关注度峰值出现在节假日开始的前两天,前兆效应不明显。从空间来看,受经济发展和距离衰减规律的影响,网络关注度呈现“近高远低且东高西低”的特点,主要集中在北京市、河北省、广州市等发达地区。

通过对北京市高A旅游景区时空特征的分析,为游客外出旅行提供了良好的参考,同时对北京市旅游流的预测和旅游市场开发营销具有一定的参考意义。但本文仅以北京市68家高A旅游景区为例,并不能完全反映北京市的旅游需求,因此分析的结论还不够全面,今后还应该开展影响网络关注度的相关因素和实际旅游人数预测等方面的研究。

基金项目

河北省自然科学基金资助项目(项目编号:A2019402043);河北省高等学校科学技术研究资助项目(项目编号:QN2019064)。

NOTES

*通讯作者。

参考文献

[1] 中国互联网络中心. 第47次中国互联网发展状况统计报告电子文档[EB/OL]. http://cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/202102/P020210203334633480104.pdf, 2021-02-03.
[2] 李山, 邱荣旭, 陈玲. 基于百度指数的旅游景区络空间关注度: 时间分布及其前兆效应[J]. 地理与地理信息科学, 2008(6): 102-107.
[3] 黄先开, 张丽峰, 丁于思. 百度指数与旅游景区游客量的关系及预测研究——以北京故宫为例[J]. 旅游学刊, 2013, 28(11): 93-100.
[4] 刘嘉毅, 陈玲, 陈玉萍. 旅游舆情网络关注度时空演变特征与影响因素[J]. 地域研究与开发, 2019, 38(1): 88-94.
[5] 许艳, 陆林, 赵海溶. 乌镇景区网络关注度动态演变与空间差异分析[J]. 经济地理, 2020, 40(7): 200-210.
[6] Zheng, X. and Bing, P. (2009) Travel Queries on Cities in the United States: Implications for Search Engine Marketing for Tourist Destinations. Tourism Management, 32, 88-97.
https://doi.org/10.1016/j.tourman.2009.12.004
[7] Pan, B. (2015) The Power of Search Engine Ranking for Tourist Destinations. Tourism Management, 47, 79-87.
https://doi.org/10.1016/j.tourman.2014.08.015
[8] 中国互联网信息中心. 2019年中国网民搜索行为调查报告[R]. 2019.
[9] 卢松, 陆林, 王莉, 王咏, 梁栋栋, 杨钊. 古村落旅游客流时间分布特征及其影响因素研究——以世界文化遗产西递、宏村为例[J]. 地理科学, 2004(2): 250-256.