基于BERTopic的无人配送公众认知主题挖掘与演化分析
Public Perception of Unmanned Delivery: Topic Mining and Evolutionary Analysis Using BERTopic
DOI: 10.12677/mm.2026.162034, PDF, HTML, XML,    科研立项经费支持
作者: 杨文清:湖北汽车工业学院汽车商学院,湖北 十堰;陈静远:湖北汽车工业学院数字经济学院,湖北 十堰
关键词: 无人配送末端物流BERTopic模型公众认知主题演化Unmanned Delivery Last-Mile Logistics BERTopic Model Public Perception Topic Evolution
摘要: 在新质生产力加速重构物流产业格局的背景下,把握公众对无人配送技术的深层认知结构与演化规律,对于推动人工智能与现代物流的深度融合具有重要意义。本研究整合抖音与微博评论数据,采用基于Transformer的BERTopic动态主题模型解构公众认知与演化特征。研究结果显示,模型识别出语音技术、生鲜运输等核心议题,并通过层次聚类将其整合为经济效益与社会伦理、配送场景与服务质量、技术本体感知与创新评价、环境交互与安全适应四大维度。演化路径上,揭示了议题从技术储备与舆论平稳期、示范场景先行与应用探索期、路权开放与商业化探索调整期,向新质生产力爆发期跃迁的范式转移规律。本研究结论可为无人配送的技术范式迭代、场景生态构建及产业政策优化提供数据驱动的实证支撑。
Abstract: Against the backdrop of new quality productive forces accelerating the reshaping of the logistics industry landscape, understanding the deep cognitive structure and evolutionary patterns of public perception regarding unmanned delivery technology is crucial for promoting the deep integration of artificial intelligence and modern logistics. This study integrates comment data from Douyin and Weibo platforms and employs the Transformer-based BERTopic dynamic topic model to deconstruct the characteristics of public perception and its evolution. The results indicate that the model identifies core topics such as voice technology and fresh food transportation. Through hierarchical clustering, these topics are synthesized into four dimensions: Economic Benefits and Social Ethics, Delivery Scenarios and Service Quality, Technological Ontology Perception and Innovation Evaluation, and Environmental Interaction and Safety Adaptation. Regarding the evolutionary path, the study reveals a paradigm shift where topics transition from the “Technical Reserve and Public Opinion Stability Period,” through the “Demonstration Scenario Precedence and Application Exploration Period” and the “Right-of-Way Opening and Commercial Exploration Adjustment Period,” ultimately leaping toward the “New Quality Productive Forces Outbreak Period.” The findings provide data-driven empirical support for the technological paradigm iteration, scenario ecosystem construction, and industrial policy optimization of unmanned delivery.
文章引用:杨文清, 陈静远. 基于BERTopic的无人配送公众认知主题挖掘与演化分析[J]. 现代管理, 2026, 16(2): 45-53. https://doi.org/10.12677/mm.2026.162034

1. 引言

当前,作为代表先进生产力演进方向的新质态,新质生产力正通过颠覆性技术创新与生产要素的创新性配置,重塑现代物流产业的运行机理与价值创造体系,成为推动行业从规模扩张向内涵式发展转型的内生动力。据国家统计局数据显示,2024年我国社会物流总额达360.6万亿元,同比增长5.8% [1]。末端配送作为物流体系微循环的关键环节,直接影响系统整体效率与客户满意度[2]。面对人力成本攀升、传统效率瓶颈及政策红利驱动,无人配送车与配送无人机等自动化装备已成为破解“最后一公里”难题的核心路径[3]

根据现有研究,关于无人配送的研究已形成较为完善的体系,主要涵盖算法优化、场景协同与用户采纳三个层面。在算法优化与场景应用层面,现有研究聚焦于破解配送效率瓶颈。学者们通过混合整数规划、改进野狗算法及双目标优化模型,深入探讨了医疗、生鲜及城乡物流等多元场景下的路径求解问题[4]-[6],并证实了“车–机–人”协同配送模式在降本增效、低碳环保及应对突发公共卫生事件中的显著优势[7]-[9]。在用户行为与接受意愿层面,随着应用的落地,需求侧研究逐渐增多。部分学者基于技术接受模型(TAM)及其扩展理论,验证了性别差异、环保动机、服务体验及疫情背景下的无接触需求对无人配送接受意愿的显著影响[10] [11]

然而,现有研究仍存在视角局限与方法论缺口。第一,现有研究多侧重于技术供给侧的可行性与最优解探讨,对于社会需求侧的关注相对滞后;第二,既有用户研究多依赖静态问卷或小样本实验,数据获取具有滞后性,难以精准捕捉公众在新质生产力加速渗透背景下,对无人配送从技术猎奇向服务落地转化过程中的真实痛点与认知演变。这种基于真实用户反馈的动态视角缺失,制约了对技术落地过程中社会反馈机制的深层理解。

基于此,为进一步探究新质生产力视域下的技术扩散规律,本研究整合抖音与微博平台评论数据,采用基于Transformer的BERTopic动态主题模型,解构公众关注的核心主题特征及演化趋势,进而揭示无人配送应用场景的多元化格局及其演进路径。研究结论将为技术范式迭代、商业场景拓扑及产业政策优化提供数据驱动的实证支撑,从而驱动人工智能与现代物流产业的深度融合与高质量发展。

2. 数据采集与研究方法

2.1. 数据获取

本研究选取抖音与新浪微博作为数据来源,这两个平台是国内具有代表性的社交媒体,汇集了海量用户生成内容。在抖音上,用户主要通过短视频进行信息传播与互动,其内容呈现形式直观易懂且传播速度快;新浪微博则以文字、图片等多种形式为主,信息更新频繁,话题扩散能力强。研究通过采集两平台上与无人配送相关的用户公开内容,选择“自动驾驶小车”“无人快递”“自动送货车”“京东/顺丰无人车”“快递机器人”“无人机配送”“小蛮驴”“机器人配送”等为关键词,通过数据采集技术获取抖音和新浪微博网站上与关键词相关的信息与数据,收集用户评论数据,共获取265,754条有效数据,数据采集时间从2020年1月1日~2025年10月1日。

2.2. 数据预处理

文本数据清洗和预处理,主要包括去除停用词、特殊符号、数字等,将文本转化为词条形式,构建自定义词典。本研究对数据采集技术获取到的数据进行预处理,使用re、jieba等库对文本进行清洗、分词等操作,文本清洗主要去掉网址、@用户、表情包。使用jieba库进行分析,停用词库采用哈工大停用词表,基于词性筛选,只保留名词等关键单词,去除单个字,对同义词进行归并处理,超短文本过滤,删除预处理后词语数少于1的文本。获得评论文本语料库共123,269条有效评论。

2.3. BERTopic主题建模

BERTopic是一种融合预训练语言模型与聚类算法的主题建模方法[12]。相较于传统的LDA模型,BERTopic主题建模在短文本处理和语义捕捉方面展现出显著优势,具有主题解释性强、语义识别精准以及模型适配灵活等特点。本研究构建的BERTopic模型主要步骤有:词嵌入(Transformer)、降维(UMAP)、聚类(HDBSCAN)以及主题表示(c-Tf-IDF)。技术路线图详见图1

Figure 1. Technical roadmap

1. 技术路线图

(1) 词嵌入(Transformer):采用预训练Sentence-BERT模型[13]生成文本的高维向量表示,以完成词嵌入并保留原始语义。

(2) 降维(UMAP):选择BERTopic默认的UMAP降维方法[14]对高维的文档语义向量进行降维。此步骤旨在保持高维空间中样本的局部结构特性,同时增强后续聚类步骤中类团的紧致度。

(3) 聚类(HDBSCAN):基于降维后的数据,采用HDBSCAN聚类算法[15]识别文档中的潜在主题结构,确保识别出的主题具有足够的文档支撑。

(4) 主题表示(c-Tf-IDF):使用c-TF-IDF算法计算主题词权重,确保提取的主题词具有高区分度。

3. BERTopic主题模型分析

3.1. 基于BERTopic的研究主题分析

基于Grootendorst [16]的相关研究成果,本研究对模型参数进行了多轮调试与最优性验证。在参数设定上,将UMAP算法的邻近样本点数量(n_neighbors)设定为15,嵌入数据的降维空间维数(n_components)设定为5;在HDBSCAN聚类环节,设置主题最小样本量阈值(min_topic_size)为300,以确保生成的主题具有足够的普遍性和代表性。

主题提取阶段,将主题特征词筛选数量(top_n_words)设定为10。初步建模完成后,结合领域专业知识对结果进行人工校验与语义分析,将表述高度重合或核心内涵一致的冗余主题进行合并优化,最终确定了29个核心主题。

3.2. 无人配送主题词分析

本研究基于BERTopic模型提取了文档数量最多的前8个显著主题(Topic 0~Topic 7),并输出每个主题下c-TF-IDF值(词权重)最高的Top 5关键词。各主题关键词的权重分布,如图2所示。

Figure 2. Topic feature words and probability distribution

2. 主题特征词及概率分布

根据特征词的组合含义,本研究对各主题进行了命名与解析,具体如下:

Topic 0“智能化服务”:该主题反映了公众对无人配送设备智能化水平的核心关切。关键词“智障”权重最高(1.58),显著高于同组最低词“电费”(0.48),表明用户对系统在避障、交互等场景中的行为合理性存在明显质疑。典型评论如:“自动驾驶明显还不够智能,右边有人跑过来时不会提前防御性减速,只会在触发后急刹车”,反映出当前技术在情境感知与类人决策方面尚未满足公众预期。“人工”“欢迎”等词则指向具体的人机交互节点,凸显用户对拟人化服务能力的关注。

Topic 1“语音技术”:该主题聚焦于听觉维度的交互体验。关键词“声音”具有显著的代表性,权重高达1.16,而具体的“语音”一词权重为0.61。结合“好听”、“说话”、“精灵”等词,可以看出在语音技术的应用中,用户高度关注配送机器人的语音提示清晰度、音色亲和力以及语音助手的指令响应能力。

Topic 2“生鲜运输”:本主题揭示了无人配送车在货物安全方面的技术验证标准。关键词“鸡蛋”以1.40的高权重占据核心地位,同组的“炒鸡蛋”权重为0.45。有用户评论称:“连生鸡蛋都能稳稳送到,一个没碎,这减震是真的牛”,这是因为在生鲜运输的行业测试与演示中,常以运送鸡蛋不破作为典型案例,以此来验证底盘系统的减震性能与行驶平稳性。

Topic 3“物流操作”:该主题描述了配送最后一百米的物理交互细节。关键词“把手”的权重最高(1.09),主要涉及用户如何开启货箱;“卸货”权重为0.48。结合“平台”、“不用”等词,反映了从通过APP平台操作到实际接触车体把手取货这一完整的物流操作作业流。

Topic 4“机器人应用”:该主题涵盖了“机器人”、“人形”、“酒店”、“送餐”等词。其中最高权重词“机器人”仅为0.34,最低词“发明”为0.22。该组关键词权重普遍较低且分布平均,说明机器人应用这一主题涉及的概念较为宽泛,主要指向酒店、餐厅等室内的商业服务应用场景。

Topic 5“无人化值守”:关键词“无人”(权重0.92)与“看守”(权重0.49)、“值守”、“岗亭”共同构成了该主题。这强调了无人技术在替代人力进行长时间安防巡逻或定点看守方面的功能属性,突出了无人化值守在特定场景下的替代价值。

Topic 6“智慧校园生活”:“学校”一词以0.89的权重成为该主题的核心。这表明封闭且路况相对简单的大学校园是当前无人配送最成熟的落地场景,无人车已深度融入智慧校园生活,成为师生日常收发快递的重要工具。

Topic 7“公共安全”:该主题揭示了无人配送的特殊社会价值。关键词“疫情”(权重0.88)指向无接触配送的高频应用背景,而“应急”(权重0.52)、“救援”、“危险品”等词则突显了在高风险作业环境下,无人配送作为保障人员安全的重要手段,体现了技术在公共安全与应急救援领域的战略储备意义。

根据不同主题之间的深层语义关联绘制主题聚类树状图(Dendrogram),如图3所示。在提取出29个独立主题的基础上,利用主题向量的余弦相似度进行了分层聚类分析(Hierarchical Clustering)。横轴表示主题间的语义距离,距离越短代表主题相似度越高,纵轴则列出了所有主题及其核心关键词。

图3的聚类结果可以看出,29个细分主题划分为四大类团,并根据每个类团包含主题的含义及特征,对4个类团进行了命名。

类团1:经济效益与社会伦理。该类团主要包含Topic 21 (省钱/节约)、Topic 19 (失业/资本)、Topic 20 (价格/成本)以及Topic 16 (司机/卸车)等。这一分支的主题高度聚焦于无人配送技术的经济社会影响。关键词“省钱”、“成本”反映了公众对其降低物流成本的认知;而“失业”、“资本”、“司机”的高频出现,则揭示了技术替代人力引发的社会焦虑。公众不仅关注技术的经济账,更担忧其对底层配送员就业岗位的冲击,体现了技术落地背后的社会伦理博弈。

类团2:配送场景与服务质量。该类团主要聚合了Topic 2 (鸡蛋/易碎品)、Topic 3 (把手/操作)、Topic 24 (外卖/商家)、Topic 27 (快递/送货)以及Topic 7 (疫情/危险品)等。这一分支侧重于具体的运营实务与服务场景。从“外卖”、“快递”等通用场景,到“疫情”、“危险品”等特殊场景,再到“爬楼”(Topic 9)、“鸡蛋”(Topic 2)等具体的服务痛点,该集群反映了用户对无人配送能不能送好和怎么送的务实关注。这表明,配送服务的可靠性与全场景覆盖能力是衡量技术成熟度的关键指标。

类团3:技术本体感知与创新评价。该类团涵盖了Topic 4 (机器人/人形)、Topic 12 (聪明/智商)、Topic 22 (技术/创新)、Topic 8 (感觉/体验)等。这一分支构成了对无人配送车的本体认知与技术评价。讨论焦点集中在机器人的形态设计、智能化水平以及创新程度,反映了公众作为观察者对新科技本身的直观感受与期待,侧重于评估其作为高科技产品的属性。

类团4:环境交互与安全适应。该类团包含了Topic 15 (交通/事故)、Topic 14 (减速带/速度)、Topic 6 (学校/老师)、Topic 5 (无人/值守)以及Topic 0 (智障/人工/欢迎)。这一分支主要探讨无人车如何融入人类的物理与社会环境,涉及校园等特定场景的适应性、交通混行中的事故风险以及语音交互体验,强调了技术在复杂现实环境中运行的安全边界与交互友好度。

Figure 3. Thematic hierarchical clustering diagram

3. 主题分层聚类图

3.3. 研究主题演化趋势分析

为了揭示无人配送领域社会关注点的时间动态变化规律,本研究按年份划分时间段,通过BERTopic的动态主题模型(DTM)对合并后的关键主题进行演化分析,以分析用户关注点随时间的变化,主题演化趋势如图4所示。

第一,2020年至2021年:技术储备与舆论平稳期。这一时期,整体舆论热度较为平稳,大部分主题的关注度都在低位徘徊。“3_物流操作”、“5_无人化值守”以及“13_智能化欠缺”的出现频率均略有下探,维持在300左右的基准线;“26_服务客诉”和“7_公共安全”也呈逐渐下降趋势。这表明在行业发展初期,公众对无人配送的讨论尚处于分散状态,未形成核心议题,相关技术更多处于实验室储备阶段,尚未大规模进入公众视野。

第二,2021年至2022年:示范场景先行与应用探索期。进入2021年,主题演化呈现出显著的非均衡特征。其中,“6_智慧校园生活”的关注度逆势上扬并达到阶段性峰值,表现出极强的场景依赖性;而通用性的“3_物流操作”则回落至300左右。这种“一升一降”的分化趋势,符合无人配送技术由点及面,先易后难的落地规律。2022年《“十四五”现代物流发展规划》明确提出推广智能末端设施,高校凭其交通环境可控,管理边界清晰以及用户接受度高等优势,成为技术验证的最佳先行试验田[17]。这使得舆论高度聚焦于校园这一特定示范区域进行应用探索,而关于复杂公开道路下的交互风险尚未充分暴露,导致相关技术性话题关注度暂时遇冷。

第三,2023年至2024年:路权开放与商业化探索的调整期。这一阶段话题热度进入关键的过渡调整期。随着外部环境常态化,“6_智慧校园生活”的热度自2022年峰值后开始明显回落。但值得注意的是,新的趋势在2023年萌芽:“3_物流操作”触底反弹,开始逐年回升,“13_智能化欠缺”也结束了波动,呈现出缓慢上升的迹象。这一转折源于2023年工信部等四部门发布《关于开展智能网联汽车准入和上路通行试点工作的通知》,标志着无人配送车正式从封闭园区走向公开道路。场景的复杂化使得配送操作难度直线上升,推动了技术评价类话题的回暖。

第四,2024年至2025年:新质生产力驱动下的全面爆发期。在2024年以后,行业关注度突破临界点,迎来高速增长。从图4的演化轨迹来看,除“7_公共安全”回升幅度有限外,其他核心主题均进入快速上升通道。尤为引人注目的是,“13_智能化欠缺”呈现指数级增长,跃升为当前舆论场的绝对焦点;与此同时,“3_物流操作”、“5_无人化值守”及“26_服务客诉”也随之大幅攀升。这种普遍且剧烈的上涨趋势,实则是新质生产力战略宏观指引与市场规模化应用微观驱动双重作用的结果。一方面,政策层面的战略升级重塑了技术期待。2024年,“人工智能+”行动被写入政府工作报告,国家大力推动具身智能(Embodied AI)与人形机器人的发展,将无人配送装备视为发展新质生产力的重要载体。这一顶层设计极大地提高了社会公众对无人设备的认知标准,使得舆论焦点从早期的车辆外观或新奇感迅速聚焦于核心的智力水平。另一方面,市场层面的规模化落地激发了现实需求。随着京东、美团及第三方快递企业在城市末端的大规模铺设,无人配送已从实验性科技转变为高频使用的日常基础设施。规模化的应用必然带来长尾场景的复杂性,导致用户对服务是否及时、售后是否完善提出了严苛要求。这表明,行业的主要矛盾已发生根本性转移:从解决能不能送的可行性问题,升级为解决送得好不好与够不够智能的体验与质量问题。

Figure 4. Theme evolution trend

4. 主题演化趋势

4. 结论与展望

4.1. 研究结论

本文基于BERTopic主题模型挖掘抖音和新浪微博平台关于无人配送的公众评论,得出以下主要结论:首先,用户对无人配送技术的关注点呈现多元化特征。通过主题建模识别出的核心主题涵盖“语音技术”、“生鲜运输”、“物流操作”、“机器人应用”、“无人化值守”、“智慧校园生活”、“公共安全”及“智能化服务”等多个维度,反映出无人配送技术在不同应用场景中的用户体验与社会影响。通过层次聚类进一步归纳,这些主题可系统性地整合为四大研究方向:经济效益与社会伦理、配送场景与服务质量、技术本体感知与创新评价以及环境交互与安全适应。这表明公众的认知结构已超越单纯的技术猎奇,形成了包含经济博弈、服务实效与安全伦理在内的立体化评价体系。

其次,基于时间序列的演化分析揭示了政策引导与市场驱动双重作用下的行业发展规律。研究发现,无人配送议题经历了从技术储备与舆论平稳期(2020~2021)、示范场景先行与应用探索期(2021~2022)、路权开放与商业化探索调整期(2023~2024)到新质生产力驱动下的全面爆发期(2024~2025)的显著范式转移。特别是在2024年后,随着“人工智能+”战略的落地与规模化应用的铺开,舆论焦点呈现出智能化缺口与服务长尾问题并存的特征,标志着行业主要矛盾已从解决能不能送的可行性问题,升级为解决送得好不好与够不够智能的体验与质量问题。

4.2. 管理启示与对策建议

在技术攻关层面,应推动以用户感知为中心的智能交互系统重构。针对舆论场中高频出现的“不够聪明”“行为呆板”等负面评价,相关企业需超越单纯追求算法精度的思路,转而构建具备状态透明化、行为可解释性与情感适配能力的交互架构。通过集成多模态反馈机制提升系统可理解性;优化底层决策逻辑,使避障、停驻等行为更符合人类驾驶直觉。此类改进不仅增强用户体验,也为规模化部署奠定信任基础。

在运营服务层面,需完善人机协作SOP,优化长尾场景体验。鉴于物流操作与服务客诉关注度的显著攀升,建议企业建立更为精细化的人机协同标准化作业程序(SOP)。特别是在决定用户体验的最后一百米交付环节,应着力优化取货交互设计,并建立针对无人配送的专项客服体系。通过快速响应规模化运营中暴露的偶发性故障与异常情况,有效降低用户的不信任感,提升服务满意度。

在社会伦理层面,要兼顾效率与公平,积极探索新型就业形态。面对舆论中关于失业与资本的社会焦虑,政府与企业应共同探索人机共生的新型就业模式。例如,通过职业技能培训,引导传统配送员转型为无人车安全员、远程运维师或运力调度员。这种方式既能释放技术带来的效率红利,又能实现劳动力的平滑转移,从而有效化解技术落地背后潜藏的社会伦理张力。

4.3. 研究局限与展望

本研究仍存在一定局限性,在数据源方面,本文主要选取抖音与微博作为数据来源,虽然覆盖了主流舆论,但缺乏对专业论坛或行业深度报道的分析。未来研究可整合多模态数据,以获取更全面的视角。其次,本文侧重于主题挖掘与热度演化,对特定主题下的细粒度情感倾向挖掘尚显不足。未来可结合情感计算技术,量化公众在不同演化阶段的情感波动特征,更精准地捕捉用户满意度的动态变化。

基金项目

湖北汽车工业学院博士科研启动基金项目(BK202445)。

参考文献

[1] 经济日报. 2024年全国社会物流总额超360万亿元, 增长5.8%——物流运行呈现积极变化[EB/OL]. 2025-02-16.
https://www.gov.cn/yaowen/liebiao/202502/content_7003950.htm, 2025-12-06.
[2] 程乐. “人工智能 + 物流”: 技术张力与结构性优化[J]. 人民论坛, 2025(2): 35-40.
[3] 张会云, 张琳琳. 后疫情时代的“无接触配送”服务[J]. 综合运输, 2021, 43(8): 102-106.
[4] Chen, D., Pan, S., Chen, Q. and Liu, J. (2020) Vehicle Routing Problem of Contactless Joint Distribution Service during COVID-19 Pandemic. Transportation Research Interdisciplinary Perspectives, 8, Article ID: 100233. [Google Scholar] [CrossRef] [PubMed]
[5] Kim, S., Kwak, J.H., Oh, B., Lee, D. and Lee, D. (2021) An Optimal Routing Algorithm for Unmanned Aerial Vehicles. Sensors, 21, Article No. 1219. [Google Scholar] [CrossRef] [PubMed]
[6] 卢福强, 汪夏, 毕华玲, 等. 基于改进野狗优化算法的无人机-骑手联合外卖配送路径优化[J/OL]. 管理工程学报, 1-12. https://www.chndoi.org/Resolution/Handler?doi=10.13587/j.cnki.jieem.2026.01.018, 2025-12-06.[CrossRef
[7] Merkert, R., Bliemer, M.C.J. and Khan, F. (2022) Consumer Preferences for Innovative and Traditional Last-Mile Parcel Delivery. International Journal of Physical Distribution & Logistics Management, 52, 261-284. [Google Scholar] [CrossRef
[8] Ghaffar, M.A., Peng, L., Aslam, M.U., Adeel, M. and Dassari, S. (2024) Vehicle-UAV Integrated Routing Optimization Problem for Emergency Delivery of Medical Supplies. Electronics, 13, Article No. 3650. [Google Scholar] [CrossRef
[9] 马飞, 张洁, 孙少龙, 等. 基于TBL视角的“卡车 + 无人机”协同配送多目标路径优化[J/OL]. 系统工程理论与实践, 1-25.
https://link.cnki.net/urlid/11.2267.N.20250313.1919.024, 2025-11-27.
[10] Kapser, S., Abdelrahman, M. and Bernecker, T. (2021) Autonomous Delivery Vehicles to Fight the Spread of Covid-19—How Do Men and Women Differ in Their Acceptance? Transportation Research Part A: Policy and Practice, 148, 183-198. [Google Scholar] [CrossRef] [PubMed]
[11] Huang, S.H., Huang, Y.H., Blazquez, C.A. and Chen, C. (2022) Solving the Vehicle Routing Problem with Drone for Delivery Services Using an Ant Colony Optimization Algorithm. Advanced Engineering Informatics, 51, Article ID: 101536. [Google Scholar] [CrossRef
[12] Kukushkin, K., Ryabov, Y. and Borovkov, A. (2022) Digital Twins: A Systematic Literature Review Based on Data Analysis and Topic Modeling. Data, 7, Article No. 173. [Google Scholar] [CrossRef
[13] Reimers, N. and Gurevych, I. (2019) Sentence-BERT: Sentence Embeddings Using Siamese BERT-Networks.
https://arxiv.org/abs/1908.10084
[14] Mcinnes, L., Healy, J. and Melville, J. (2018) UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction.
https://arxiv.org/abs/1802.03426v3
[15] Rahman, M.F., Liu, W., Suhaim, S.B., et al. (2025) HDBSCAN: Density based Clustering over Location Based Services.
https://arxiv.org/abs/1602.03730
[16] Grootendorst, M. (2022) BERTopic: Neural Topic Modeling with a Class-Based TF-IDF Procedure.
https://arxiv.org/abs/2203.05794
[17] 中华人民共和国国务院办公厅. 国务院办公厅关于印发“十四五”现代物流发展规划的通知[EB/OL]. 2022-12-15.
https://www.gov.cn/zhengce/content/2022-12-15/content_5732092.htm, 2025-11-27.