1. 引言
移动互联网技术的普及与社交媒体的渗透,推动了电商直播迅速崛起。电商直播凭借实时互动、沉浸式体验的核心优势,重塑了电商领域人、货、场的内在关联,进而成为拉动社会零售增长的重要组成部分。相关统计显示,我国直播电商交易规模在2024年已突破5万亿元大关[1],业务场景延伸至农产品销售、跨境贸易、文化消费等多元领域,其商业规模与研究多样性为学术分析提供了丰富样本。
既有相关学术成果已覆盖了消费者行为、营销策略、平台运维等多个研究方向,但整体仍呈现出碎片化的分布特征,且多集中于特定应用场景下的具体影响机制,如消费者购买意愿的影响因素[2]-[4]、主播特性对商品销量的影响效应[5] [6]、垂直品类的直播运营策略等[7] [8]。这些研究虽然深入探讨了特定场景下的作用机制,却未对该领域的核心议题、知识架构及演化脉络进行系统性整合梳理。与此同时,传统文献综述依赖于人工编码,而经典的LDA主题建模方法又受制于词袋模型的局限性,难以有效挖掘文本间的深层语义关联,进而造成主题识别的精度有所欠缺[9]。
基于此,本研究以2016~2026年知网数据库收录的884篇CSSCI与北大核心期刊相关文献为分析样本,引入BERTopic主题建模技术,系统识别电商直播领域的核心研究主题与知识演化路径。研究旨在解答电商直播领域的核心知识主题具体涵盖哪些内容,以及各主题在时间维度上的演化规律及未来趋势这两大问题。本研究的开展既可为学界呈现该领域的全景式知识图谱,也能为企业营销决策优化和平台治理完善提供实践层面的参考依据。
2. 文献综述
电商直播的研究始于对商业模式的探索,早期研究侧重技术驱动因素与消费场景重构逻辑,指出移动互联网、流媒体技术的成熟与消费需求升级是电商直播快速发展的核心动力[10]。随着研究深入,学者们主要围绕三大核心方向展开探索。在消费者层面,魏剑锋等[6]关注主播特性、直播情境对购买决策的影响;在运营层面,王辰宇等[11] [12]探讨营销策略优化、供应链管理与销售模式选择;在治理层面,丁国峰等[13]聚焦平台风险防控、行业规范与可持续发展。
尽管现有研究成果丰富,但仍存在研究主题呈现碎片化特征的问题,多数成果仅为单一研究维度,尚未形成对领域知识体系的系统性整合;其次,研究方法相对单一,传统主题识别技术难以有效挖掘大规模文本数据中隐含的深层语义关联。
作为新兴主题建模技术,BERTopic基于Transformer预训练模型生成语义嵌入,结合HDBSCAN聚类自动识别主题,克服了传统模型的语义捕捉缺陷。该方法已在医学、人工智能等领域验证了有效性[14] [15],能够为电商直播领域大规模文献主题识别提供更高效的技术支持,进而成为弥补现有研究不足的重要工具。
3. 研究方法
为了准确识别电商直播领域的核心研究主题并厘清其演化脉络,本研究采用数据预处理、文本向量化、向量降维、主题聚类的完整技术步骤,结合BERTopic模型在语义捕捉方面的优势,确保研究结果的科学性与可靠性。
3.1. 数据来源
本文研究检索数据来源于知网数据库,以电商直播、直播电商为检索字段进行检索,检索方式设置为精度匹配,确保文献核心议题与研究对象具有较高的相关度。其次,筛选条件如下:
(1) 来源期刊设置为CSSCI期刊和北大核心期刊,排除普刊与会议论文集;
(2) 文献主题为电商直播的理论研究、实证分析或机制探讨,排除纯新闻报道、行业动态、无实质研究内容的短文;
(3) 文献摘要完整,排除摘要缺失、无法判断研究主题的文献;
检索时间设定为2016~2026年。剔除重复数据及缺失值,共检索收集到884篇期刊文献。提取文献的标题和摘要,语言统一为中文便于后续进一步分析。按上述要求完成初步筛选后,需采取去重流程,主要包括以下三个方面:
(1) 利用知网数据库自动去重,剔除标题、作者、来源期刊完全一致的重复文献;
(2) 通过EndNote软件人工二次去重,剔除摘要重复率 ≥ 80%的高度相似文献;
(3) 手动核对剩余文献,删除因检索词泛化导致的非相关文献,如仅提及直播未涉及电商的媒体研究文献;
3.2. 文本预处理
为产出可直接服务于主题分析的标准化语料库,依次对文献标题、摘要两类核心文本信息,开展系统性的预处理工作。通过设置自定义词库、文本分词、词性过滤和去除停用词等步骤,确保语料库能够充分反映电商直播各发展方向的技术及应用特征,为后续主题建模提供高质量输入。
3.3. BERTopic主题建模
3.3.1. 技术文本向量化
在自然语言处理中,文档嵌入是一项基础性技术,也是将文本输入模型后的第一步处理,其作用是将文本信息转化为可用于计算机理解和处理的向量形式[16]。本文将文献标题、摘要文本拼接形成初始合并文本,随后使用multilingual-MiniLM-L12-v2模型对初始合并文本进行向量化处理,得到维度如(n, 1024)的文本语义矩阵,为后续的技术主题识别奠定数据基础。矩阵公式如下:
3.3.2. 向量降维
由于高维向量空间中存在维度诅咒问题,即随着数据维度的增加,直接对向量进行聚类效果不佳[17]。为此,使用BERTopic模型时,可以结合UMAP流形降维方法解决这一问题,降维算法具体参数设置如表1所示。
Table 1. UMAP dimensionality reduction method parameter settings
表1. UMAP降维方法参数设置
参数名称 |
参数含义 |
参数值 |
n_neighbors |
控制每个数据点局部邻域的大小 |
10 |
n_components |
降维后的目标维度 |
2 |
metric |
设置计算数据点间距离的度量标准 |
cosine |
min_dist |
设置数据点之间的最小距离 |
0.00 |
random_state |
设置随机数种子,确保每次运行结果一致 |
30 |
3.3.3. HDBSCAN聚类
HDBSCAN作为一种基于密度的层次聚类算法,其优势在于无需指定聚类数量,且能有效处理非凸分布数据与噪声点。因此,本研究在UMAP降维后的低维向量基础上,采用HDBSCAN算法进行主题聚类,从预处理后的语料中分离出具有明确语义边界的核心研究主题。
4. 研究结果
4.1. 电商直播领域的核心知识主题
基于BERTopic主题建模技术,本研究对884篇CSSCI与北大核心期刊文献进行了细致的分析,共识别出16个核心知识主题,按研究方向可划分为六大类,具体可见表2。
Table 2. Topic recognition results
表2. 主题识别结果
编号 |
计数 |
主题 |
关键词 |
−1 |
266 |
−1_消费者_影响_购买_研究 |
[消费者,影响,购买,研究,意愿,平台,主播,发展,价值,行为] |
0 |
173 |
0_农产品_乡村_振兴_发展 |
[农产品,乡村,振兴,发展,模式,农村,销售,营销,官员,研究] |
1 |
82 |
1_媒体_图书_网络_发展 |
[媒体,图书,网络,发展,传播,融合,转型,短视频,内容,传统媒体] |
2 |
57 |
2_渠道_供应链_制造商_品牌 |
[渠道,供应链,制造商,品牌,主播,利润,模式,选择,策略,营销] |
3 |
47 |
3_疫情_行业_发展_网络 |
[疫情,行业,发展,网络,逻辑,问题,肺炎,政策,平台,传播] |
4 |
40 |
4_空间_分布_城市_消费 |
[空间,分布,城市,消费,企业,地区,中国,抖音,规模,水平] |
5 |
39 |
5_主播_购买_意愿_消费者 |
[主播,购买,意愿,消费者,影响,感知,中介,特征,特性,作用] |
6 |
38 |
6_契约_心理_情感_消费 |
[契约,心理,情感,消费,消费者,影响,主播,行为,情绪,效应] |
7 |
34 |
7_场景_购物_互动_内容 |
[场景,购物,互动,内容,消费,场所,使用,平台,传播,消费者] |
8 |
20 |
8_机会_行业_数字_学习 |
[机会,行业,数字,学习,出海,机构,互补,网络,发展,创业] |
9 |
17 |
9_服装_影响_意愿_购买 |
[服装,影响,意愿,购买,感知,消费者,评价,女性,语言,因素] |
10 |
17 |
10_交互_信息_用户_话语 |
[交互,信息,用户,话语,实时,评论,行为,研究,影响,语用] |
11 |
17 |
11_广告_监管_主播_平台 |
[广告,监管,主播,平台,法律责任,法律,规制,信用,营销,承担] |
12 |
14 |
12_虚拟_主播_影响_意愿 |
[虚拟,主播,影响,意愿,消费者,驱动,形象,购买,数字,中介] |
13 |
12 |
13_旅游_消费者_消费_购买 |
[旅游,消费者,消费,购买,影响,冲动,旅游景点,信息量,社交互动,冲动性] |
14 |
11 |
14_数字_数字经济_创新_产业链 |
[数字,数字经济,创新,产业链,数字技术,业态,企业,流通,维权,时代] |
4.1.1. 消费者行为与决策相关主题(主题-1、5、6、9、13)
该类主题涵盖5个细分主题,共372篇文献,占总文献数的42.1%,侧重于消费者购买意愿的影响因素与心理机制。其中,主题-1为宏观层面的消费者行为研究,围绕主播特性、平台功能、产品特征等外部因素,分析其对消费者感知价值、信任及购买决策的综合影响,研究方法以问卷调查结合结构方程模型为主[18];而主题5是主题-1的细分,针对专业性、互动性、可信度等主播特性的作用,重点验证了感知信任、心流体验等中介变量的传导效应[19];此外,主题6从心理视角切入,探讨契约心理、情感共鸣、情绪传染等因素如何影响消费者购买行为,如主播情感表达的共情效应对销售额的正向作用[20];主题9与主题13则针对垂直品类与场景,分别研究服装类产品直播中女性消费者的感知评价机制,以及旅游直播中冲动性消费的触发因素,都反映出品类和场景与消费者精准匹配的研究思路[21] [22]。
4.1.2. 乡村振兴与农产品直播主题(主题0)
主题0占总文献数的19.6%,是电商直播在特定产业领域的核心应用研究,围绕农产品直播与乡村振兴的协同发展展开[23]。研究内容包括三类,一类是运营模式分类,如政府主导型(官员直播背书)、企业带动型(农业龙头企业整合供应链)、农户自主型等模式的特征与适用场景;其次是实践成效与挑战,肯定其在提升农产品销量、助力脱贫攻坚中的作用,同时指出标准化低、物流成本高、人才短缺等问题;此外,还包括乡村振兴的结合路径,提出通过直播电商推动农业产业化、农村人才培育与地方文化传播,例如将地域文化融入农产品故事营销,增强消费者情感认同。其中,文献[7]提出的直播电商打通农产品销路,通过政府主导型(官员直播背书)、企业带动型(农业龙头企业整合供应链)模式,实现农产品销量提升与乡村产业升级,验证了该主题的核心研究方向。
4.1.3. 媒体融合与内容传播主题(主题1、10)
这类主题共有99篇文献,占总文献数的11.2%,主要围绕电商直播与媒体生态的融合及信息交互机制展开研究。主题1以传统媒体转型为核心,探讨图书出版、传统电视台等主体如何借助直播电商实现内容与销售的跨界融合,比如出版社联合作者开展线上读书会直播,地方电视台利用主持人资源推广文化产品,核心是寻找内容专业性与商业性的平衡策略[24];主题10包含17篇文献,从微观视角切入,分析直播间的信息交互特征,包括实时评论的语用功能、弹幕内容的情感倾向、用户话语的互动逻辑等,比如功能性弹幕对消费者持续观看意愿的促进作用,可为优化直播内容设计提供参考[25]。
主题1中传统媒体(图书出版、电视台)借助直播电商实现内容与销售跨界融合,验证了媒介融合是内容融合与渠道融合有机结合体的核心观点;主题10中直播间实时评论的语用功能,修正了传统媒体传播理论中单向传播的认知,补充了双向互动传播的微观机制。
4.1.4. 运营管理与供应链主题(主题2、14)
这一主题下共有68篇文献,占总文献数的7.7%,核心研究方向是提升电商直播运营效能与推动产业协同发展。其中,主题2以销售渠道布局与供应链优化为两条主线,既剖析制造商、零售商及主播的渠道决策逻辑,对比直销与分销、KOL合作直播与品牌自主直播等模式的差异,也探究库存动态预测、物流成本管控等供应链关键环节的优化路径,同时借助博弈模型量化平台佣金比例、代理费用等变量对各参与主体利润分配的影响[26];主题14从数字经济的宏观视角切入,探讨直播电商与产业链创新的深度融合机制,包括数字技术如何重构商品流通链路、驱动业态迭代升级,以及企业如何依托直播电商实现以销定产的柔性生产模式,进而提升产业链整体运转效率[27]。
4.1.5. 监管治理与风险防控主题(主题3、11)
该主题共涵盖64篇文献,占总文献数的7.2%,主要围绕行业外部环境约束与长效规范体系构建展开。其中主题3以新冠疫情为典型突发事件,分析其对电商直播的短期冲击与长期变革效应,短期冲击包括物流网络中断、供应链运转停滞等问题,长期则表现为行业规范化进程加速与直播 + 跨界融合趋势深化,并进一步探讨政府与平台的协同应急策略,如流量倾斜扶持、专项政策补贴等[28];主题11侧重行业长效治理机制建设,围绕广告合规性审查、主播信用体系监管、平台法律责任界定等核心问题展开研究,例如明确虚假宣传的判定标准、构建主播失信行为的惩戒机制,并有部分研究引入区块链技术搭建产品溯源系统,从而强化商品质量全链条监管[29]。
以主题11为例,政府监管、平台自治、主播自律的治理框架,有效印证了多元主体协同的核心观点;此外,同时通过区块链溯源技术强化商品质量监管的研究,拓展了协同治理理论在数字经济场景中的技术赋能路径。
4.1.6. 技术赋能与行业机遇主题(主题7、8、12)
这一主题下共有68篇文献,占总文献数的7.7%,核心关注技术创新驱动下电商直播行业的发展新动能与新场景。其中,主题7围绕直播场景构建与互动体验设计展开,旨在分析不同品类商品与直播场景的匹配度,如体育用品直播中场景与产品的契合度,以及AR试穿等互动功能对消费者心流体验的影响机制[30];主题8则探讨行业发展新机遇,既包括数字技术赋能下跨境直播电商的出海路径,也涉及MCN机构与传统企业的合作模式,目的在于挖掘双方资源互补的价值[31];主题12以技术赋能为核心,重点研究虚拟主播与AI技术的应用场景,包括虚拟主播的形象设计、场景适配性对消费者信任度的影响,以及AI在个性化内容推荐、违规内容自动审核中的作用,同时也关注算法偏见等AI伦理风险[32]。
4.1.7. 研究板块关联分析
电商直播领域的六大研究板块并非孤立存在,而是围绕技术创新为核心驱动、以消费者需求为导向、规范治理为保障形成相互联动、动态适配的有机整体。技术赋能与行业机遇板块是贯穿多领域的核心纽带,其技术突破为其他板块提供了关键支撑,如主题12的虚拟主播与AI技术不仅优化了主题7的直播场景互动体验,还为主题0的乡村振兴与农产品直播解决了人才短缺难题,即虚拟主播无需专业培训即可全天候直播,配合AI个性化推荐,能精准对接城市消费者需求,让农产品销售突破时空限制;而主题7中的AR试穿、实时互动等功能,又反过来丰富了消费者行为与决策板块的研究维度,使得主题-1、5等关于感知价值、心流体验的研究更具实践场景,形成了闭环。
其次,监管治理与风险防控板块则为行业发展划定边界,其规范要求直接影响运营管理与供应链、消费者行为两大板块的发展方向,包括了主题11明确的广告合规审查、主播信用体系建设,推动主题2的平台运营策略优化,而这种规范化运营又能提升消费者对直播电商的信任度,减少主题6中契约心理相关的消费顾虑,进而促进购买决策;主题3中疫情引发的应急治理经验,还为供应链优化提供了参考,推动主题2形成更具韧性的库存管理与物流调配方案,实现监管约束、运营规范、消费信任的传导。
此外,媒体融合与内容传播板块则承担了流量桥梁的作用,连接起供给端与需求端。主题1中传统媒体转型带来的专业内容生产能力,为主题0农产品直播注入了文化内涵,出版社通过读书会直播带动文化产品销售,既提升了内容传播的专业性,又拓宽了乡村振兴与垂直品类直播的流量入口;而主题10揭示的直播间互动逻辑,能为运营管理板块提供精准的流量运营参考,帮助主题2优化直播营销策略,同时也为消费者行为研究提供了微观互动数据,让主题5、6对主播与消费者互动效应的分析更具针对性。
不仅如此,消费者行为与决策板块的研究发现还能反向指导其他板块的优化方向。如主题-1、9等揭示的女性消费者对服装类产品的感知评价机制、旅游直播中的冲动消费触发因素,能帮助运营管理板块调整供应链布局与产品选品策略,也为媒体融合板块提供了内容创作的侧重点,实现需求洞察、供给适配、价值提升的良性循环,让各板块在相互支撑中推动电商直播行业从规模扩张向高质量发展转型。
4.2. 演化特征
在BERTopic主题识别结果的基础上,按年为时间切片,呈现不同时间的主题强度变化,如图1所示。
Figure 1. E-commerce live streaming topic trend distribution map
图1. 电商直播主题趋势分布图
4.2.1. 基础探索阶段(2016~2019年)
在早期的基础探索阶段,所有主题的研究热度都处于较低水平,仅少数主题出现缓慢增长。这一时期的研究主要围绕电商直播的商业模式界定、基本特征分析(如互动性、实时性),以及消费者行为的初步探索。在该阶段中,核心关键词以直播模式、购买意愿、主播特性为主,研究方法多为定性描述与简单实证分析,尚未形成系统的主题体系。
4.2.2. 深化发展阶段(2020~2022年)
随着电商直播进入爆发式增长阶段,研究开始向细分场景与深层机制延伸,乡村振兴与农产品直播成为热点方向,关于消费者决策机制的中介与调节效应分析逐渐增多,平台治理与风险防控也开始受到学界关注。在所有的关键词中,供应链、感知信任、行业规范的出现频次明显上升,且研究方法也更加丰富,结构方程模型、博弈论等量化方法得到广泛应用。
4.2.3. 创新拓展阶段(2023~2026年)
近三年,各主题的研究热度呈现分化升级态势,乡村振兴与农产品直播持续成为热门主题,虚拟主播相关的文献数量占该主题总文献数的64.3%,关注度较前两阶段显著上升。研究呈现三大趋势:一是技术赋能,虚拟主播、AI应用等前沿主题兴起;二是细分深化,跨境直播、特定行业应用研究增多;三是规范升级,平台治理与政策监管的研究更加系统,核心关键词虚拟主播、跨境电商、AI赋能、协同治理的频次显著上升。
5. 结语
数字经济快速发展与电商直播行业规模稳步扩张的背景下,本研究以2016~2026年知网数据库收录的884篇CSSCI与北大核心期刊文献为研究样本,运用BERTopic主题建模技术,系统剖析了电商直播领域的核心研究主题、知识结构与演化脉络,为该领域的学术研究与实践发展提供了全景式参考。研究识别出16个核心主题,并归为六大类。其中,消费者行为与决策研究占比42.1%,为核心议题;乡村振兴与农产品直播占比19.6%,是重要应用方向,其余还包括媒体融合、运营管理、监管治理、AI技术赋能等主题。
从演化脉络来看,电商直播领域研究经历了基础探索、深化发展到创新拓展的三阶段演进历程。当下虚拟主播、跨境直播、协同治理等前沿议题成为研究热点,行业的技术驱动与规范化特征日益凸显。
未来研究可从两方面推进:一是拓展数据来源,整合国内外多数据库文献、行业报告、企业实践数据等,丰富研究样本的多样性;二是深化研究内容,聚焦虚拟主播应用、跨境直播运营、产业链协同创新等前沿主题,结合实证研究、案例分析等方法,探究其内在作用机制与实践路径。