1. 引言
在全球经济波动与互联网技术深化的双重驱动下,共享经济得以快速兴起并深度发展。在线短租平台作为共享经济在住宿领域的具体应用,实现了爆发式增长。2023年度中国在线短租市场规模已突破857.59亿元[1],房源覆盖范围不断拓展,非标住宿产品愈发受到市场青睐。
然而,与传统住宿业相比,短租产品具有更高的不确定性和体验属性。短租产品缺乏传统酒店业通过标准化的产品供应、专业化的客户服务以及品牌化的信誉认知所形成的保障[2],平台的房源分布分散、装修风格各异、服务标准缺乏统一规范。同时,住宿体验高度依赖房东个人服务能力与房源实际状况,这使得交易双方面临更为严重的信息不对称问题,容易使用户产生不信任感,而不信任正是阻碍房客参与共享住宿的主要因素之一[3]。在此背景下,在线评论(ElectronicWord-of-Mouth, eWOM)成为用户感知服务质量、降低决策风险的关键途径,与平台生成的内容相比,其更有可能被视为是值得信赖的[4] [5]。但口碑本身可能存在噪音和失真,用户仅通过平台展示的图片、文字描述等信息判断房源质量,容易对房源的真实情况产生误判。因此,探究短租平台在线口碑的内容构成、信号有效性及其影响因素,对于理解共享经济下的消费决策、提升平台信息中介效率具有重要的理论与现实意义。
本研究基于信号理论,以国内领先的短租平台“途家民宿”为案例,聚焦南京市四个典型功能区域的用户评论数据,系统探究以下三个核心问题:
RQ1 (信号内容):短租用户的评论聚焦于哪些核心体验维度?
RQ2 (信号有效性):评论文本的情感倾向与星级评分之间是否存在系统性偏差?其表现形式和成因是什么?
RQ3 (信号情境性):不同功能区域的用户其关注点和情感表达是否存在系统性差异?
三个问题层层递进,构成“内容–效度–情境”的完整研究链条,通过对上述问题的探讨,本研究旨在从网络营销的维度,为短租平台优化口碑传播效果、房东优化实践提供理论指导与实证支持。
2. 文献综述与理论基础
2.1. 短租平台电子口碑的特性与影响
口碑(WOM)反映了消费者对产品的满意度,对未来消费者的购买决策具有重要参考意义[6]。互联网时代的自媒体评价反馈系统对于口碑传播[7]及品牌建设[8]发挥着举足轻重的作用。电子口碑(eWOM)是以互联网为媒介的关于企业、商家、品牌、服务和产品等为对象的各类评分、评论、图片和视频等形式的信息。随着在线短租内容社区属性的加强,用户生成内容[9]和房东营销者生成内容[10]等对用户感知乃至预定意愿的影响路径是研究热点之一。其中,由于产品的非标准化特性,消费者无法通过统一的服务标准预判体验质量,因此更加依赖其他用户的真实评价。徐薇薇的研究表明,在这种体验型消费中,负面电子口碑往往比正面评价更具影响力[11]。李竞欣进一步强调,短租平台的电子口碑更注重房东与房客之间的互动和个性化体验,而非传统酒店的制度化保障,这种差异使得短租平台的口碑更具人际信任色彩[12]。
从影响机制来看,电子口碑通过情感与认知双重路径影响消费者决策。消费者会根据自身感知传播口碑[13],富含真实细节的入住体验描述容易引发潜在用户的情感共鸣,从而增强其预订意愿。同时,在线口碑能够反映用户对产品的情感倾向与认可,可通过在线评论情感量化[14]。这一机制为本研究分析评论文本的情感倾向、信号一致性及其区域差异提供了方法指导和理论依据,也揭示了在线口碑作为网络营销核心要素的双重驱动路径。
2.2. 信号理论及其在短租平台的应用
在线市场中,买卖双方的信息不对称性是影响交易效率和消费者信任的核心问题。信号理论(SignalingTheory)源于经济学和信息学,由Spence于1973年首次提出[15]。该理论的核心观点是:在信息不对称的环境中,拥有信息优势的一方可以通过发送特定信号来向信息劣势方传递其质量信息,从而减少不确定性,增强信任,促进交易。信号理论致力于解决买卖双方存在的信息不对称[16],如何解读信号以推断产品质量,是信号理论研究中的焦点[17]。
信号的有效性取决于其可靠性和成本。高质量信号通常需要卖方投入较高成本,而低质量卖方难以模仿这些成本,从而形成一种“分离均衡”。在短租平台中,虽然关于房东和租赁房间的真实信息不能直接被观察,但客人可以参照平台商家属性推断服务质量。
短租平台是信号理论的典型应用场景,其核心信号包括星级评分、评论文本、标签以及房东认证。本研究将信号理论作为核心框架,旨在检验短租平台中评分与文本评论这两种关键信号的内容、效价及其一致性,深化对口碑信号传递机制的理解。
3. 研究设计
3.1. 数据获取与预处理
本研究的数据来源于途家民宿平台南京市范围内的房源用户评论。为捕捉不同消费场景下的口碑特征,选取了四个典型功能区作为研究范围:新街口商圈、钟山风景区、南京南站、仙林大学城,其功能分别为商业消费、旅游观光、交通中转、校园周边。四区域功能无重叠、需求无交叉,完整覆盖了南京短租市场的核心用户类型。
数据爬取的时间窗口为2022年7月至2025年8月。针对四大区域内途家平台显示的300个有效房源,爬取其在该时间窗口内的全部用户评论,最终获得有效评论7566条,其中新街口2705条、钟山1949条、南站1495条、仙林1417条。采集字段包括用户昵称、评论日期、评分、评论内容、是否为优质点评、房东是否回复等。
采集数据完毕后,对原始评论数据进行了预处理。首先清洗并剔除了重复、空白与无意义符号评论;随后采用Jieba工具进行分词;最后使用哈尔滨工程大学停用词表过滤虚词和常见词,为后续研究提供高质量结构化语料。
3.2. 研究方法
本研究采用定量与定性相结合的混合研究方法。
1. LDA主题模型:采用隐含狄利克雷分布模型从非结构化文本中提取用户关注的核心维度。通过比较不同主题数量下的困惑度与一致性分数,如表1所示,确定最佳主题数为7。
Table 1. Coherence score table
表1. 一致性分数表
主题数(K) |
3 |
4 |
5 |
6 |
7 |
8 |
一致性分数 |
0.5417 |
0.5451 |
0.5314 |
0.5653 |
0.5743 |
0.5507 |
2. 情感分析:由于评论情感得分能够更加细粒度地刻画网络口碑[18],本研究采用基于预训练语言模型BERT的情感分析方法。使用在中文评论数据上微调过的BERT模型对每条评论进行情感分析,得到0~1之间的连续情感值。
3. 统计分析:使用斯皮尔曼等级相关系数分析评分与情感值的一致性;采用方差分析(ANOVA)检验不同区域间情感均值的差异;运用卡方检验和T检验对比优质点评与普通评论的差异。
4. 数据分析与发现
4.1. 描述性统计分析
如表2所示,整体来看,四个区域的平均评分均高于4.83分,整体满意度较高。其中新街口商圈得分最高,仙林大学城相对较低。在评论内容质量方面,新街口商圈表现突出,平均评论长度达53.92字,优质点评占比2.3%。南京南站的平均评论长度最短,优质点评占比也较低。在房东互动方面,钟山风景区和仙林大学城的房东回复率远高于新街口商圈。
Table 2. Regional comparison
表2. 区域对比
区域 |
评论数量 |
平均评分 |
平均评论长度(字) |
优质点评占比 |
房东回复率 |
新街口商圈 |
2705 |
4.905 |
53.92 |
2.3% |
33.8% |
钟山风景区 |
1949 |
4.851 |
45.56 |
0.7% |
74.9% |
南京南站 |
1495 |
4.889 |
38.00 |
0.7% |
49.1% |
仙林大学城 |
1417 |
4.832 |
39.78 |
0.8% |
77.1% |
总计 |
7566 |
4.874 |
45.97 |
1.3% |
55.5% |
4.2. RQ1分析:用户感知维度挖掘
通过LDA主题模型,从评论文本中识别出7个用户关注的核心体验维度,结果见表3:
Table 3. Result table of LDA topic model
表3. LDA主题模型结果表
编号 |
主题命名 |
核心关键词 |
主题解读 |
主题1 |
设施与用品体验 |
空调、洗衣机、马桶、
卫生间、拖鞋、一次性 |
用户重点关注房源的硬件设施的使用体验,涉及设备的齐全度、功能性及卫生状况 |
主题2 |
住宿选择与推荐意向 |
、民宿、酒店、推荐、
下次、朋友、选择 |
用户表达自身的住宿决策行为,常与其他住宿类型对比,并明确流露出再次入住或向他人推荐的意愿 |
主题3 |
核心服务质量感知 |
服务、卫生、环境、
热情、齐全、前台 |
用户从宏观层面评价房源的综合服务质量,是最为核心的体验维度,涵盖了软性的服务态度与硬性的卫生、
环境等 |
主题4 |
整体感受与情感体验 |
体验、舒适、温馨、感、
宽敞明亮、柔 |
用户描述住宿带来的整体主观感受和情感体验,强调舒适性、温馨感和细节设计带来的积极情绪 |
主题5 |
房源真实性及美观度 |
便利、图片、第一眼、
房屋、惊喜、装修、风格 |
用户关注房源描述与现实的一致性,以及房源的设计装修风格。 |
主题6 |
地理位置与周边
便利性 |
离、地铁站、很近、位置、
出行、交通、吃、周边、景点 |
用户聚焦于房源的地理位置属性,尤其关注其与关键
节点的接近程度,以及周边餐饮、景点等配套的便利性 |
主题7 |
性价比与功能性评价 |
性价比、价格、环境、
卫生、隔音、实惠、总体 |
用户采用概括性语言对房源进行整体评价,核心围绕所支付“价格”与所获得的“环境”、“卫生”等综合
体验是否匹配,即性价比 |
4.3. RQ2分析:口碑信号一致性检验
4.3.1. 评分与情感的相关性
经过情感值离散化阈值敏感性分析,选择0.4和0.6作为情感界限,基于此,评分与情感值相关性如表4所示,评分与情感值在整体上呈现中等正相关,说明口碑信号存在基础一致性:评分越高,文本情感倾向越积极。但相关系数仅为中等水平,表明两者并非完全一致,存在偏差空间。分区域来看,仙林大学城一致性最强,新街口商圈最弱。
Table 4. Spearman’s rank correlation coefficient table between rating and sentiment
表4. 评分–情感斯皮尔曼等级相关系数表
分析维度 |
相关系数 |
p值 |
样本量 |
关联强度判定 |
整体评论 |
0.253 |
<0.01 |
7566 |
中等正相关 |
新街口 |
0.221 |
<0.01 |
2705 |
弱正相关 |
钟山风景区 |
0.268 |
<0.01 |
1949 |
中等正相关 |
南京南站 |
0.245 |
<0.01 |
1495 |
中等正相关 |
仙林大学城 |
0.298 |
<0.01 |
1417 |
中等正相关 |
4.3.2. “评分–情感”悖论识别与分析
1. 悖论样本分布
研究设定了悖论样本的识别标准:“高分低情”(评分 ≥ 4且情感值 < 0.4)和“低分高情”(评分 ≤ 2且情感值 > 0.6)。经筛选与核对,如表5所示,共识别出140条悖论样本,其中“高分低情”122条,“低分高情”18条,区域分布以钟山风景区、新街口为主。
Table 5. Overall distribution of rating-sentiment paradox samples
表5. 评分–情感悖论样本总体分布
悖论类型 |
数量(条) |
占总体比例 |
主要区域分布(数量/占比) |
高分低情 |
122 |
1.61% |
钟山(42/34.4%)、新街口(38/31.1%) |
低分高情 |
18 |
0.24% |
钟山(7/38.9%)、南京南站(5/27.8%) |
合计 |
140 |
1.85% |
- |
2. 悖论成因编码与量化分布
通过三级内容编码,提取出如表6和表7所示的5大类成因。
Table 6. Causes of the “high-score low-sentiment” paradox
表6. “高分低情”悖论成因
核心范畴 |
子范畴 |
初始概念举例 |
服务补救与响应 |
补偿与解决 |
提供实质性补偿 |
|
问题即时解决 |
态度与沟通 |
服务态度获认可 |
对比参照效应 |
横向对比 |
替代选择更劣 |
|
未达宣传预期 |
纵向对比 |
既往体验更差 |
平台与操作设计 |
系统预设 |
默认高分机制 |
操作路径 |
评分修改困难 |
Table 7. Causes of the “low-score high-sentiment” paradox
表7. “低分高情”悖论成因
核心范畴 |
子范畴 |
初始概念举例 |
评价者动机与心理 |
利他警示 |
低分警示问题 |
客观补偿 |
文本肯定优点 |
共情体谅 |
体谅经营困境 |
服务补救与响应 |
态度与沟通 |
服务态度获认可 |
编码分析表明,这些悖论现象背后蕴含着复杂的用户心理与情境因素。“高分低情”源于用户以更差体验为参照的相对满意效应、因服务补救与响应而宽容瑕疵、或迫于平台与操作设计的被动选择;而“低分高情”则多出于评价者动机与心理,或源于服务态度补偿,导致评分与文本情感倾向出现背离。
4.3.3. 优质点评的信号有效性验证
研究将平台认证的优质点评与普通评论进行对比。独立样本T检验和卡方检验结果显示,优质点评在平均评论长度、图片包含率上均显著高于普通评论。这表明优质点评作为高成本信号,整体具有更高的内容完整性。然而,平台现有筛选机制过度依赖长度 + 图片的标准,忽视了用户的情感表达,未能有效识别情感与评分的一致性,导致部分失真信号被标记为“优质点评”。
因此,平台在利用口碑进行营销推广时,需审慎处理评分与文本的复合信号,优化算法以识别并抑制失真信号,维护营销信息的真实性。
4.4. RQ3分析:区域差异性分析
4.4.1. 主题分布区域差异
各区域用户关注的主题存在显著差异,是其功能定位与群体特征的映射。
Table 8. Details of topic distribution proportion in each region (Unit: %)
表8. 各区域主题分布占比详情(单位:%)
区域 |
设施与
用品体验 |
住宿选择与
推荐意向 |
核心服务
质量感知 |
整体感受与
情感体验 |
房源真实性
及美观度 |
地理位置与
周边便利性 |
性价比与 功能性评价 |
新街口 |
7.70 |
12.26 |
25.37 |
5.12 |
11.40 |
25.04 |
13.12 |
钟山 |
7.09 |
11.50 |
34.38 |
6.93 |
3.67 |
18.74 |
17.69 |
南京南站 |
6.13 |
12.82 |
30.27 |
5.11 |
8.66 |
20.99 |
16.02 |
仙林大学城 |
8.92 |
9.00 |
37.34 |
5.76 |
4.96 |
15.04 |
18.99 |
如表8所示,不同功能区域用户的关注点存在显著差异,深刻反映了其独特的消费场景与用户群体特征。新街口商圈用户高度重视服务品质与交通效率双重优先的决策特征;钟山风景区用户除关注基础服务外,最注重住宿体验的情感维度与整体舒适性;南京南站用户强调功能性与效率,关注入住流程的便捷性;而仙林大学城用户则表现出明显的实用主义倾向,将核心服务质量与性价比作为最重要的评价标准。该差异化格局表明,短租口碑的形成与区域功能定位及用户需求结构存在紧密的共生关系。这一发现凸显了标准化营销策略的局限性,强调了基于区域功能实施差异化营销对于提升获客效率的重要性。
4.4.2. 情感均值区域差异
方差分析表明,不同区域评论的情感值存在差异。如表9所示,南京南站地区的情感均值最高,这可能与中转旅客停留时间短、评价场景相对简单有关;而钟山景区的情感均值相对最低,或反映出景区游客对住宿体验的期望与实际感受存在较大落差。
Table 9. Significance test table of differences in average sentiment values of accommodation reviews in different regions
表9. 不同区域住宿评论情感均值差异显著性检验表
区域 |
样本量 |
情感值均值 |
标准差 |
方差分析结果 |
新街口 |
2705 |
0.965 |
0.22 |
F = 32.18 p < 0.001 |
钟山(景区) |
1949 |
0.951 |
0.17 |
南京南站 |
1495 |
0.967 |
0.18 |
仙林大学城 |
1417 |
0.957 |
0.16 |
5. 研究结论与启示
5.1. 研究结论
首先,在信号内容层面,短租口碑传递了多维复合的质量信号。用户评价不仅涵盖卫生、服务、设施、位置等基础功能型信号,也深度融合了情感体验、性价比判断和推荐意愿等中高阶体验型信号,呈现出实用与情感并重的复合特征。
其次,在信号有效性层面,“评分–情感”悖论揭示了数字口碑信号的复杂性与系统性偏差。评分与文本情感虽总体正相关,但存在1.85%的“评分–情感”悖论。这种偏差并非随机噪声,而是由服务补救、对比参照、共情体谅等情境化、心理化因素等非质量因素系统性地造成,揭示了信号的失真,展现了在线评价行为的复杂性。
再者,在信号情境性层面,区域功能是口碑信号的关键调节变量。口碑特征具有显著的区域情境依赖性,不同功能区域的消费场景塑造了差异化的用户需求与口碑表达模式。商圈重效率与品质,景区重情感与体验,交通枢纽重便捷与选择,学区重实用与性价比。区域功能是理解短租口碑的关键情境变量。
5.2. 管理启示
对平台而言,制定网络营销策略应致力于提升口碑系统的智能化与精细化水平。首要任务是优化口碑筛选机制,引入情感与评分一致性校验,以识别并过滤失真信号,确保优质口碑的真实性与可信度。其次,需构建动态的结构化标签体系,利用文本挖掘技术提取评论中的关键体验标签,从而降低用户决策成本。最后,应实施区域差异化的精准营销策略,针对不同功能区的需求特质动态调整展示与排序逻辑,以实现供需的精准匹配与营销资源的高效配置。
对房东而言,管理策略应聚焦于服务的标准化与差异化相结合。一方面,必须优先夯实卫生、设施和响应速度等基础服务,尤其是在注重功能与效率的区域;另一方面,应根据房源所在区域的功能定位实施体验增值,例如在景区与商圈注重情感化设计与互动,以契合用户的情感预期。此外,需高度重视评分与情感矛盾的悖论评论,对其反映的设施细节缺陷进行针对性改进,并以共情态度回应其中隐含的体谅情绪,将其转化为修复信任与提升服务的契机。
5.3. 研究创新与展望
在理论层面,本研究深化了信号理论在数字平台情境下的应用。通过揭示“评分–情感”悖论及其成因,挑战了经典信号理论对信号一致性的理想化假设,提出了“信号的情境性失真”这一新概念;同时,证实了区域功能是塑造口碑信号的关键情境变量,从而将分析框架从“发送与接收”的二元关系拓展至“发送、情境与接收”的三元互动关系,增强了对服务口碑形成机制的理论解释力。
在实践层面,本研究提供了一套融合LDA主题模型与BERT情感分析的可复现方法论工具包,为平台与房东进行精细化的口碑诊断提供了技术路径。与此同时,研究所揭示的七大核心体验维度,为服务改进提供了清晰的着力点;对“评分–情感”悖论的剖析,为平台甄别失真信号、优化推荐算法提供了关键依据;进而,所发现的区域差异化规律为实施精准营销与运营策略奠定了实证基础。
然而,本研究存在一定局限性,其一,数据源自单一平台单一城市,结论普适性有待验证;其二,基于词典的情感分析工具对短租领域特定词汇的适应性不足;其三,采用截面数据,未能揭示口碑的动态演变。未来研究可从以下方面深入:第一,构建综合口碑信号模型,将用户上传图片的情感色彩、平台生成标签的准确性、房东回复的及时性与情感倾向等变量纳入分析框架;第二,采用纵向追踪设计,探究口碑信号随时间的动态演变规律及房东信誉的累积效应;第三,开展跨平台比较研究,检验不同平台机制对口碑信号有效性的调节作用,从而提高口碑信号模型的解释力与实践指导价值。
附录1. 数据分析具体步骤
1. 数据采集
(1) 采集工具:八爪鱼采集器。
(2) 采集对象:途家民宿平台公开的房源评论信息。
(3) 采集范围:江苏省南京市新街口商圈、钟山风景区、南京南站、仙林大学城四个功能区。
(4) 采集时间窗口:2022年7月1日至2025年8月31日。
(5) 采集字段:共采集11个字段,包括用户昵称、评论日期、评论内容、评分、是否优质点评、关键词、房东回复内容、房东是否回复等。
(6) 采集总量:爬取后经过初步筛选获得有效数据记录7566条。
2. 数据清洗与预处理
为确保后续文本挖掘的质量,对原始数据执行了以下标准化清洗流程:
(1) 去重处理:基于评论内容、用户昵称和评论日期生成唯一标识符,剔除完全重复的记录。
(2) 无效评论过滤:剔除内容为空白、纯符号或长度小于5个字符的评论。
(3) 文本规范化:统一文本编码为UTF-8,将全角字符转换为半角字符,移除无关的超链接、特殊表情符号和,并标准化日期与时间格式。
(4) 中文文本分词与去停用词:首先使用Python Jieba分词库进行精确模式分词,再使用哈尔滨工业大学停用词表进行筛选。
3. LDA主题分析
为深入挖掘评论文本中的用户关注维度,本研究采用了隐含狄利克雷分布(LDA)主题模型。
(1) 语料构建:将清洗分词后的每条评论转换为词袋模型,并构建词典与文档–词项矩阵。
(2) 模型训练:采用Gibbs抽样算法进行参数估计。为确定最佳主题数K,计算了主题数从3到8的一致性分数(Coherence Score)。结果显示,当K = 7时,一致性分数最高,表明模型具有最佳的语义一致性与主题区分度。
4. 评分–情感一致性分析
为检验口碑信号的有效性,本研究对数值型评分与文本情感倾向进行了一致性分析,具体步骤如下:
(1) 情感分析模型:采用基于Transformer架构的预训练模型RoBERTa-wwm-ext,并在中文评论情感分析任务上进行微调,为每条评论计算一个0到1之间的连续情感分值,分值越高代表情感越积极。
(2) 悖论样本识别:为识别评分与情感不一致的评论,设定了以下阈值:“高分低情”——评分 ≥ 4 且情感值 < 0.4;“低分高情”——评分 ≤ 2且情感值 > 0.6通过对全部评论进行遍历与筛选,共识别出条有效悖论样本。
(3) 内容编码与成因分析:对上述悖论样本进行系统的质性内容分析。基于扎根理论,通过开放式编码、轴心编码和选择性编码的三级流程,归纳出“心理参照效应”、“平台机制影响”、“服务交互因素”、“情境调节因素”和“认知偏差”5大类共12小类的系统性成因。
(4) 统计检验:综合运用斯皮尔曼等级相关、卡方检验、T检验及方差分析(ANOVA)等方法,分别对评分与情感值的一致性、悖论样本成因的主题分布差异以及不同组别间的情感均值差异进行了统计检验。
附件2. 数据分析结果
1. LDA主题高频词
Table A1. Facility and supplies experience
表A1. 设施与用品体验
关键词 |
设施 |
房间 |
还有 |
空调 |
洗衣机 |
一次性 |
拖鞋 |
用 |
没 |
冰箱 |
老板 |
卫生间 |
马桶 |
喜欢 |
东西 |
权重 |
3.84 |
2.46 |
1.4 |
1.52 |
1.3 |
1.2 |
1.11 |
1.06 |
1.04 |
0.99 |
0.93 |
0.90 |
0.86 |
0.82 |
0.76 |
Table A2. Accommodation selection and recommendation intention
表A2. 住宿选择与推荐意向
关键词 |
住 |
我们 |
南京 |
酒店 |
入住 |
民宿 |
这家 |
房间 |
下次 |
推荐 |
玩 |
适合 |
朋友 |
选择 |
喜欢 |
权重 |
3.89 |
2.93 |
2.51 |
2.27 |
2.09 |
2.01 |
1.64 |
1.17 |
1.06 |
0.81 |
0.80 |
0.77 |
0.76 |
0.74 |
0.73 |
Table A3. Perception of core service quality
表A3. 核心服务质量感知
关键词 |
房间 |
服务 |
卫生 |
环境 |
设施 |
热情 |
齐全 |
满意 |
前台 |
老板 |
不错 |
入住 |
房东 |
不足 |
态度 |
权重 |
8.85 |
7.03 |
6.54 |
5.12 |
4.66 |
4.32 |
3.71 |
2.99 |
2.68 |
2.34 |
2.32 |
2.28 |
2.08 |
1.98 |
1.97 |
Table A4. Overall perception and emotional experience
表A4. 整体感受与情感体验
关键词 |
体验 |
酒店 |
舒适 |
温馨 |
入住 |
房间 |
这家 |
床品 |
强烈推荐 |
住宿 |
开心 |
感 |
服务 |
印象 |
细节 |
权重 |
5.49 |
4.33 |
4.23 |
2.44 |
2.43 |
2.22 |
2.21 |
1.87 |
1.67 |
1.65 |
1.52 |
1.34 |
1.28 |
1.25 |
1.23 |
Table A5. Authenticity and aesthetics of listed properties
表A5. 房源真实性及美观度
关键词 |
房间 |
差异 |
风格 |
设施 |
好看 |
民宿 |
周边 |
感 |
进入 |
第一眼 |
入住 |
房屋 |
图片 |
装修 |
很大 |
权重 |
7.13 |
6.31 |
5.72 |
3.89 |
3.61 |
3.39 |
2.42 |
2.15 |
2.13 |
2.08 |
2.03 |
2.00 |
1.95 |
1.90 |
1.67 |
Table A6. Location and surrounding convenience
表A6. 地理位置与周边便利性
关键词 |
离 |
地铁站 |
房间 |
楼下 |
很近 |
地铁 |
位置 |
出行 |
南京 |
距离 |
交通 |
还有 |
吃 |
周边 |
便利 |
权重 |
4.77 |
3.86 |
2.86 |
2.32 |
1.95 |
1.92 |
1.55 |
1.48 |
1.40 |
1.25 |
1.21 |
1.20 |
1.10 |
1.07 |
1.06 |
Table A7. Cost-effectiveness and functional evaluation
表A7. 性价比与功能性评价
关键词 |
不错 |
不贵 |
房间 |
环境 |
性价比 |
价格 |
位置 |
卫生 |
隔音 |
整体 |
实惠 |
有点 |
很大 |
床 |
总体 |
权重 |
13.26 |
5.80 |
4.53 |
3.30 |
2.88 |
2.48 |
2.15 |
2.13 |
1.60 |
1.45 |
1.34 |
1.32 |
1.20 |
1.20 |
1.19 |
2. 情感值离散化阈值敏感性分析结果
为确定连续情感值转换位离散标签的最佳阈值,本研究测试了三种阈值划分方案,其中方案2保持较高敏感性和平均特异性,且悖论样本占比适中,综合性能最优,故选取方案2。
Table A8. Sensitivity analysis of sentiment value discretization thresholds
表A8. 情感值离散化阈值敏感性分析
方案 |
阈值设定 |
悖论样本数量 |
悖论样本占比 |
平均敏感性 |
平均特异性 |
方案1 |
<0.3; 0.3~0.7; >0.7 |
63 |
0.83% |
0.985 |
0.865 |
方案2 |
<0.4; 0.4~0.6; >0.7 |
48 |
0.63% |
0.992 |
0.885 |
方案3 |
<0.5; 0.5; >0.5 |
35 |
0.46% |
0.975 |
0.905 |