基于LDA主题模型的景点在线评论文本挖掘分析——以携程旅行南浔古镇景点评论为例
Text Mining Analysis of Online Reviews of Scenic Spots Based on LDA Topic Model—Taking Ctrip Nanxun Ancient Town Scenic Spot Review as an Example
DOI: 10.12677/ecl.2025.1461926, PDF,   
作者: 张清露, 张馨尹:浙江理工大学启新学院,浙江 杭州;宋瑾钰*:浙江理工大学计算机科学与技术学院(人工智能学院),浙江 杭州
关键词: 南浔古镇在线评论情感分析行为分析Nanxun Ancient Town Online Review Emotion Analysis Behavior Analysis
摘要: 互联网的快速发展给各大景区带来机遇的同时,也带来了挑战。很多人在互联网上进行景点评论搜索并根据景区评论选择目的地。通过分析游客的评论,旅游景区可以更好地找到景区存在的问题,以便提出相应的解决方案,从而提升游客的满意度和旅游体验。本文利用爬虫技术对携程旅行上南浔古镇景点的用户评论进行爬取,利用LDA主题模型、SnowNLP情感分析和TF-IDF特征提取技术,对爬取的评论数据进行了全面分析,深入探讨景区评论中消费者的满意度及情感分布,了解消费者对旅游景区的核心需求,为景区改善服务提供了数据支撑。
Abstract: The rapid development of the Internet has brought both opportunities and challenges to major scenic spots. Many people search scenic spot reviews on the Internet and choose destinations according to the reviews. By analyzing tourists’ comments, tourist attractions can better find problems existing in scenic spots, so as to propose corresponding solutions, thus improving tourists’ satisfaction and travel experience. This paper uses crawler technology to crawl the user reviews of scenic spots in Nanxun Ancient Town on Ctrip, and uses LDA theme model, SnowNLP sentiment analysis and TF-IDF feature extraction technology to conduct a comprehensive analysis of the crawled review data, deeply explore the satisfaction and emotional distribution of consumers in scenic spot reviews and understand the core needs of consumers for tourist attractions. It provides data support for the service improvement of scenic spots.
文章引用:张清露, 张馨尹, 宋瑾钰. 基于LDA主题模型的景点在线评论文本挖掘分析——以携程旅行南浔古镇景点评论为例[J]. 电子商务评论, 2025, 14(6): 1783-1793. https://doi.org/10.12677/ecl.2025.1461926

参考文献

[1] 中华人民共和国文化与旅游部. 2024年国庆节假期文化和旅游市场情况[EB/OL]. (2024-10-08)
https://www.gov.cn/lianbo/bumen/202410/content_6978757.htm, 2024-10-24.
[2] 蔡颖. 基于Python的文本数据处理研究[J]. 软件, 2023, 44(5): 179-183.
[3] 秦春秀, 祝婷, 赵捧未, 张毅. 自然语言语义分析研究进展[J]. 图书情报工作, 2014, 58(22): 130-137.
[4] 苏宇. 网络爬虫的行政法规制[J]. 政法论坛, 2021, 39(6): 41-53.
[5] 窦欣怡. 基于LDA主题模型的商品在线评论文本挖掘分析[J]. 电子商务评论, 2024, 13(3): 8710-8718.
[6] 倪超, 吴伟敏. 消费者购买教育机器人满意度影响因素研究——基于LDA和IPA的在线评论分析[J]. 电子商务评论, 2024, 13(3): 8245-8254.
[7] 王轶群, 陈成鑫. 基于LDA的欧盟信息迷雾政策报告主题挖掘与治理研究[J]. 图书情报工作, 2025, 69(5): 94-106.
[8] 徐远廷, 徐嘉, 沈晓芳. 基于LDA主题模型的智慧体育发展现状分析及热点研究[J]. 冰雪体育创新研究, 2025, 6(2): 104-107.
[9] 姚正旺, 梁利, 史江兰, 等. 西江千户苗寨景点评论分析[J]. 电子商务评论, 2024, 13(3): 8988-8999.
[10] 朱登赟, 万福成, 国旗, 等. 针对北京旅游景点的评论文本情感标注数据集[J/OL]. 中国科学数据(中英文网络版): 1-10. 2025-03-07. [Google Scholar] [CrossRef