1. 引言
随着电商行业的蓬勃发展,电商交易规模持续上升,截至2024年,已突破50万亿元[1]。在这一背景下,评论作为消费者决策的核心参考依据,成为电商生态的“信用基石”。然而,虚假评论的泛滥正不断侵蚀这一基石。市场监管总局2024年“反不正当竞争”专项报告显示,电商虚假评论投诉量同比增长62%,其中“刷单炒信”“恶意差评勒索”“评论控评”三类行为占比超85% [2]。例如某电商平台刷单案中,商家通过“刷手团队”生成2万余条虚假好评,导致消费者因误导购买劣质商品,维权时却因无法证明评论虚假而败诉[3],此类案例凸显虚假评论对消费者权益的直接侵害,以及传统追责模式的失效。
数据挖掘技术的成熟为虚假评论治理提供了新路径。通过自然语言处理(NLP)提取评论文本中的“夸张表述”“重复句式”等特征,结合机器学习算法分析用户行为,如同一IP地址短时间内高频评论,可实现虚假评论的精准识别。有领头电商平台引入数据挖掘系统后,虚假评论识别率从32%提升至79% [4]。但技术应用与法律追责的衔接仍存在空白:数据挖掘生成的“识别报告”能否作为法定证据?平台未有效运用技术手段监测虚假评论是否需承担责任?这些问题尚未在现行法律框架中得到明确回应,亟需构建“技术 + 法律”协同的追责机制。
2. 电商虚假评论的生成模式与法律追责现状
2.1. 电商虚假评论的核心特征与生成模式
电商虚假评论并非单纯的“不实表述”,而是具有“目的性、组织性、隐蔽性”的复合型侵权行为,其生成模式可分为三类:
1. 刷单炒信型:这是最普遍的虚假评论类型,由商家通过“刷手团队”或自动化工具生成虚假好评。具体流程为:商家与刷手团队签订协议→刷手通过“模拟真实购物”完成交易→按商家要求发布含“关键词”的好评→商家返还货款并支付佣金。此类评论的核心特征是“文本同质化”、“行为异常化”,某刷单案中甚至出现“同一刷手1天内为10家同类店铺评论”的极端情况[5]。
2. 恶意差评型:分为“勒索型”与“竞争型”两类。前者由“差评师”通过下单后发布负面评论,以“删除差评”为由向商家索要钱财;后者则是竞争对手雇佣团队,针对竞品发布“虚假负面评价”,破坏竞品口碑。2024年“某母婴用品商家恶意差评案”中,竞争对手通过“批量注册小号”发布200余条“产品导致婴儿过敏”的虚假差评,导致该商家销量下降40%,此类评论的特征是“负面表述极端化”“无具体事实依据”[6]。
3. 评论控评型:商家通过电商平台的“评论管理工具”,选择性展示好评、隐藏或删除真实差评,形成“虚假口碑闭环”。部分平台甚至为商家提供“付费控评”服务,如某平台曾推出“差评过滤套餐”,商家支付费用后,含“差评关键词”的评论将被自动屏蔽[7]。这种行为虽不直接生成虚假评论,但通过操控信息展示,本质上剥夺了消费者获取真实信息的权利,属于“间接虚假评论”。
2.2. 当前电商虚假评论的法律追责困境
尽管现行法律已对虚假评论有所规制,如《电子商务法》第十七条禁止“以虚构交易、编造用户评价等方式进行虚假或者引人误解的商业宣传”[8],但在实践追责中仍面临三大核心困境:
1. 证据固定难:笔者通过中国裁判文书网检索2020-2-24年公开的电商虚假评论侵权案件共1247件,统计发现:因“无法证明评论虚假”“缺乏商家与刷手关联证据”等理由被驳回起诉案件占比高达68.3%1。传统取证方式无法应对虚假评论的隐蔽性。消费者主张虚假评论侵权时,需证明“评论内容虚假”“评论系人为操控”,但传统取证手段难以满足这一要求。一方面,虚假评论的文本与真实评论高度相似,消费者无法仅凭肉眼区分;另一方面,刷单交易的“物流信息”“付款记录”多为伪造,消费者难以获取商家与刷手的关联证据。更关键的是,电商平台通常不向消费者开放评论的后台数据,导致消费者“举证无门”。在“某服装商家刷单案”中,消费者虽怀疑评论虚假,但因无法提供平台后台数据,法院最终以“证据不足”驳回其诉讼请求[9]。
2. 责任划分乱:仅31.2%案件明确平台责任。上诉1247件案件中,仅31.2%明确认定平台需要承担责任,52.5%仅判决商家承担责任,16.3%因“责任主体模糊”未明确划分责任。这也充分表明,平台、商家、刷手的责任界定存在模糊地带,比如商家责任:虽《反不正当竞争法》明确商家刷单需承担赔偿责任,但对于“委托刷单但未直接参与评论撰写”的情形,是否需承担全部责任仍有争议[10]。再就刷单人责任而言:刷手作为直接实施者,现行法律多将其视为“不正当竞争的帮助者”,但因刷手多为个人且分散,消费者难以追责——上诉案件中仅2.8%涉及刷手追责,且均为团队组织者。最后平台责任:《电子商务法》要求平台“对平台内经营者的虚假宣传行为予以制止”,但未明确“平台应采取何种措施”——是仅需“接到投诉后处理”,还是需“主动监测虚假评论”?部分平台因未主动识别刷单评论被监管部门处罚,但平台辩称“已尽到形式审查义务”,反映出平台责任标准的不明确[11]。
3. 救济成本高:维权成本平均损失5倍。虚假评论侵权多为“小额分散型”,但维权需经过“收集证据–平台投诉–监管举报–诉讼”多个环节,耗时长达2~6个月。笔者统计上诉案件中消费者的维权成本,消费者平均达实际损失的5.2倍——某消费者因虚假评论维权花费8000元,最终仅获赔500元[12],这种“高成本低收益”的现状,导致73.5%的消费者选择“自认倒霉”,放弃追责2。
3. 数据挖掘赋能电商虚假评论法律追责的路径
数据挖掘技术的核心价值在于“从海量数据中提取有效信息”,其在虚假评论识别、证据链构建、责任溯源中的应用,可精准破解传统追责的三大困境,为法律追责提供“技术抓手”。
3.1. 虚假评论识别:从“人工判断”到“算法精准定位”
传统虚假评论识别依赖消费者或监管人员的“主观经验”,效率低且准确率差,而数据挖掘可通过“文本挖掘 + 行为挖掘”实现自动化识别:
1. 文本挖掘:提取虚假评论的“语言特征”。通过自然语言处理(NLP)技术分析评论文本,识别虚假评论的典型特征:一是“词汇特征”,虚假好评多高频使用“绝对化表述”、“模糊表述”;二是“句式特征”,刷单评论常使用“模板化句式”,可通过“文本相似度算法”检测重复率;三是“情感特征”,虚假评论的情感倾向多为“极端化”,且缺乏情感波动,可通过“情感分析模型”(如LSTM神经网络)识别异常。某研究团队基于50万条电商评论数据训练模型,通过文本特征识别虚假评论的准确率达82%,远超人工识别的45% [13]。
2. 行为挖掘:捕捉虚假评论的“用户行为异常”。虚假评论的背后往往伴随异常的用户行为,数据挖掘可通过分析用户的“行为数据”识别异常:一是“账号特征”,刷手账号多为“新注册账号”“无真实购物记录的账号”,可通过“账号活跃度算法”标记高风险账号;二是“交易特征”,刷单交易多为“秒下单”、“同一IP地址多账号下单”“无真实物流信息”,可通过“交易行为聚类算法”(K-Means)识别批量刷单行为;三是“评价特征”,刷手多在“收货后1小时内评价”“同一时间段发布多条评论”,可通过“时间序列分析”捕捉这种异常节奏。
3.2. 证据链构建:从“碎片化证据”到“完整数据闭环”
证据不足是消费者追责的最大障碍,数据挖掘可通过“数据留存–验证–可视化”构建合法证据链,但需要同步建立数据安全和隐私保障机制:
1. 数据留存:合法固定生命周期数据。电商平台需基于数据挖掘技术,建立“评论全生命周期数据库”,留存三类关键数据:“评论基础数据”(评论文本、发布时间、用户账号信息)、“关联交易数据”(订单号、支付记录、物流信息)、“用户行为数据”(登录IP、浏览记录、设备信息)。数据需采用“区块链存证 + 哈希值校验”确保不被篡改,且需要符合《个人信息保护法》要求——对用户敏感信息采用“差分隐私”技术匿名化处理,仅保留“用于关联分析的非标识化数据”[14]。
2. 数据验证:多维交叉排除误差。数据挖掘可通过“多维度交叉验证”排除数据误差,确保证据的可信度。对疑似虚假评论,需通过“文本相似度 + 交易真实性 + 用户行为异常”三维验证:如某评论文本与其他10条评论相似度超90%、物流空包、用户1天内为5家同类店铺评价,方可认定为有效证据[15]。
3. 数据可视化:转化为法律可认的证据形式。数据挖掘生成的“算法报告”需通过可视化工具,如热力图、时间轴转化为直观的证据形式,便于法院、监管部门理解。例如,“某美妆品牌刷单案”中,平台用“资金关联图谱”证明刷手用金流向商家经销商,成为法院定案关键[16]。
3.3. 责任溯源:从“主体模糊”到“精准定位责任方”
数据挖掘可通过“关联分析算法”追踪商家、刷手、平台的责任链条,同时建立申诉与纠错机制:
1. 追踪商家责任:识别“刷单指令源头”。通过“账号关联分析”,挖掘刷手账号与商家的关联线索:一是“IP关联”,若刷手账号登录IP与商家办公IP、仓库IP一致,可证明商家直接参与刷单;二是“资金关联”,通过分析刷手的“佣金收款账户”,追踪资金是否来自商家或其关联企业;三是“指令关联”,若刷手与商家存在“聊天记录”(如微信、QQ),可通过“文本关键词匹配”(如“按模板评价”“返佣”)识别刷单指令。在“某美妆品牌刷单案”中,监管部门通过资金关联分析,发现刷手的佣金最终流向该品牌的经销商,成功锁定了责任主体[2]。
2. 定位刷手责任:通过“社交网络分析算法”(如PageRank)识别团队核心成员,关联“手机号–银行号”对接公安身份系统。蒲绒刷手可通过“主动注销账号 + 承诺不再参与”申请从“黑名单”移除[17]。
3. 界定平台责任:评估“技术监测义务履行情况”。数据挖掘可作为判断平台是否尽到责任的“标尺”:若平台已部署虚假评论识别系统,但因“算法阈值设置过高”(如仅识别相似度90%以上的评论)导致大量虚假评论漏判,可认定平台“未充分履行监测义务”;若平台未部署任何数据挖掘监测工具,仅依赖“人工投诉处理”,则属于“未履行基本义务”。例如,2024年某平台因未升级虚假评论识别算法,导致某类新型“AI生成虚假评论”大量流入,被市场监管部门处以50万元罚款,这一案例明确了“平台需持续优化数据挖掘技术”的法定义务[2]。
4. 数据挖掘赋能下电商虚假评论法律追责机制的构建
数据挖掘为虚假评论追责提供了技术支撑,但需通过法律制度将“技术优势”转化为“治理效能”。本文从立法、平台义务、追责程序三个层面,构建“技术 + 法律”协同的追责机制。
4.1. 立法完善:明确数据挖掘在追责中的法律地位
现行法律尚未对“数据挖掘生成的证据效力”“平台技术义务”作出明确规定,需通过立法确立数据挖掘证据的法定地位:在《民事诉讼法司法解释》中新增“电子数据证据”的具体规定,明确数据挖掘生成的“虚假评论识别报告”“关联分析图谱”可作为法定证据,但需满足三个条件:一是数据来源合法,需来自电商平台依法留存的后台数据;二是数据具有真实性,需经第三方审计机构(如中国电子技术标准化研究院)出具“算法合规报告”,证明数据未被篡改、算法逻辑无偏见;;三是数据具有关联性,需与案件核心事实直接关联,如“刷手IP与商家IP一致”的数据,需直接指向“商家参与刷单”的事实。同时,建立第三方算法审计、专家辅助人制度、算法分级管理的司法具体审查制度。法院可委托国家认可的司法鉴定机构(如国家电子数据司法鉴定中心),对算法的“逻辑透明度”“阈值设置合理性”进行审计,出具审计报告;聘请算法领域专家(如高校计算机学院教授),就“算法原理”“识别误差原因”等出庭说明,帮助法官理解技术细节;对“核心算法”实行“备案制”,平台需向监管部门报备算法逻辑。从而解决“算法黑箱”导致的证据可信度争议。
通过立法细化平台的“技术监测义务”:在《电子商务法》修订中,明确平台需履行“主动监测 + 及时处理”的双重技术义务:一事前监测义务,要求平台在评论发布后24小时内,通过数据挖掘技术完成初步筛查,对高风险虚假评论进行“临时屏蔽”;二事中处置义务,对确认的虚假评论,需在48小时内删除,并留存相关数据供监管部门调取;三事后报告义务,若某商家虚假评论占比超过5%,平台需在7日内将该商家信息报送市场监管部门,并暂停其促销活动。同时规定“平台未履行技术义务的法律责任”,如逾期未处理虚假评论,按每条500元处以罚款,累计罚款不超过50万元[18]。
明确刷手的法律责任与追责路径:在《反不正当竞争法》中新增“刷手责任条款”,将刷手分为“普通刷手”与“团队组织者”:对普通刷手,可处违法所得1~3倍罚款;对团队组织者(如控制100个以上刷手账号),除罚款外,可并处“行业禁入”(3年内不得参与电商交易)。同时,建立“刷手黑名单共享机制”,由市场监管部门建立全国统一的“虚假评论参与者黑名单”,电商平台需对黑名单中的用户采取“限制下单”“禁止评论”措施,从源头遏制刷手行为[2]。
4.2. 平台义务细化:建立“技术 + 管理”双轨制防控体系
电商平台是虚假评论治理的“第一责任人”,需在技术应用基础上,细化内部管理义务:
1. 搭建标准化数据挖掘监测系统:平台需按照“国家电商虚假评论监测技术标准”,可由市场监管总局牵头制定,搭建涵盖“文本识别、行为分析、关联追踪”的全流程监测系统:一是“文本识别模块”,采用“预训练语言模型(如 BERT) + 行业词典”,提高对“行业特定虚假表述”,如美妆行业的“敏感肌可用”虚假宣传的识别率;二是“行为分析模块”,对接物流、支付机构数据,实时核查交易真实性;三是“关联追踪模块”,运用图神经网络(GNN)分析商家、刷手、账号的关联关系,自动生成“风险主体图谱”。平台需每季度向市场监管部门提交“技术监测报告”,说明系统运行情况与虚假评论处置数据。
2. 建立消费者权益保障机制:平台需基于数据挖掘技术,为消费者提供“便捷化维权服务”:一是“虚假评论一键投诉”功能,消费者怀疑某评论虚假时,可点击“投诉”按钮,平台通过数据挖掘系统在24小时内反馈“是否属于虚假评论”的初步结论;二是“证据自动生成”服务,若确认评论虚假,平台需为消费者自动生成“评论虚假证明”(含文本分析报告、交易异常数据),并同步至12315平台,减少消费者取证成本;三是“先行赔付”制度,对因虚假评论导致的消费者损失,平台需在确认责任后7日内先行赔付(最高不超过5000元),再向商家追偿,提高消费者维权积极性。
4.3. 追责程序优化:构建“低成本、高效率”的维权路径
针对消费者维权成本高的问题,需优化追责程序,建立“多元化纠纷解决机制”:
1. 建立虚假评论快速投诉通道:由市场监管总局牵头,整合12315平台、电商平台投诉系统,建立“全国电商虚假评论投诉平台”:消费者仅需填写“订单号 + 疑似虚假评论链接”,平台即可通过数据挖掘技术自动核查,无需消费者提交额外证据。对于事实清楚、金额较小的投诉,监管部门可在7日内作出“责令商家赔偿”的决定,商家拒不履行的,由平台从其保证金中划拨赔偿款[2]。
2. 推行“举证责任倒置”规则:在虚假评论侵权诉讼中,适用“举证责任倒置”,消费者仅需证明“因评论误导购买商品”“评论存在明显异常”,如平台初步判定为虚假,即完成举证义务;商家需举证证明“评论真实”,如提供真实消费者的身份信息、购物凭证,若无法举证,则需承担赔偿责任。这一规则可大幅降低消费者的举证压力,解决“维权难”问题[19]。
3. 开展“公益诉讼 + 集体诉讼”专项行动:由检察机关、消费者协会针对“大规模虚假评论”提起公益诉讼,如某商家刷单评论超1万条,可由消协代表全体消费者提起诉讼,要求商家赔偿“市场秩序损害赔偿金”,并在平台显著位置公开道歉。同时,优化集体诉讼程序,允许消费者通过“线上登记”加入集体诉讼,无需单独出庭,降低参与成本。2024年“某食品商家虚假评论集体诉讼案”中,2000余名消费者通过线上登记参与诉讼,最终获赔总额超50万元,为集体诉讼的推广提供了实践经验[20]。
5. 结论
电商虚假评论的法律追责,本质是“数字经济中信用秩序与消费者权益的维护”问题。传统追责机制因无法应对虚假评论的“技术化、组织化”特征而失效,而数据挖掘技术通过精准识别、证据构建、责任溯源,为追责提供了“技术突破口”。但技术本身并非万能,需通过立法明确其法律地位,通过平台义务细化实现技术落地,通过程序优化降低维权成本,最终构建“技术赋能法律、法律规范技术”的协同治理格局[13]。
未来,随着AI生成评论、跨境电商虚假评论等新问题的出现,还需进一步优化数据挖掘技术,完善跨境追责机制。只有持续推动“技术创新”与“法律完善”的深度融合,才能彻底破解虚假评论治理难题,让电商评论回归“真实信用载体”的本质,为消费者营造安全、透明的购物环境[21]。
NOTES
1笔者基于中国裁判文书网2020~2024年公开案件的统计分析(检索关键词:“电商”“虚假评论”“刷单”“不正当竞争”)。
2同上。