1. 引言
随着移动互联网、社交媒体与电子商务生态的快速发展,网络用户规模持续增长。用户在不同平台所产生的行为日志呈现出高维度、异构化与高噪声等特征,使信息过载问题愈加突出[1]。在此背景下,推荐系统作为缓解信息冗余、提升用户体验的核心技术,已广泛应用于电商、短视频及内容分发等领域[2]。其中,协同过滤(Collaborative Filtering, CF)因不依赖领域知识、建模方式灵活而成为最具代表性的推荐算法之一[3]。
协同过滤主要包括基于用户的协同过滤(User-CF)和基于物品的协同过滤(Item-CF) [4]。前者通过寻找兴趣相近的邻域用户,并依据其行为偏好推断目标用户的潜在兴趣[5];后者则根据物品间的相似度关系,结合用户的历史行为实现推荐,具有稳定性高、扩展性好的特点[6]。尽管CF在实际系统中表现出良好的适用性,但仍受到冷启动、数据稀疏与评分不一致等问题的限制[7]。
随着推荐系统在各类平台的深入应用,协同过滤在高噪声环境下的鲁棒性问题日益受到关注。围绕用户评分的不稳定性及噪声抑制,现有研究主要从“样本加权”、“异常检测与剔除”以及“可信度建模”三个方向展开改进。
第一类方法利用权重加权机制抑制不可靠交互,其核心思想是:训练过程中难以拟合的样本更可能包含噪声,因此可基于损失大小、模型不确定性或元学习策略动态调整样本权重。此类方法在隐式反馈任务中表现突出,Wang等提出的基于噪声权重加权的深度推荐框架可自动弱化噪声交互,从而提升模型的鲁棒性[8]。这类方法具备自适应优势,但往往依赖较大的数据规模与训练资源,且可解释性有限。
第二类方法强调显式识别并剔除异常评分,包括基于时间一致性、行为模式检测以及评分噪声转移矩阵的校正方法。Ye与Lu提出的基于噪声转移建模的鲁棒矩阵分解框架,可有效识别并修正“rating flip noise”[9]。此类方法在处理明显错误或恶意评分时表现优异,但对噪声判别机制依赖较强,在稀疏数据场景中存在误删风险。
第三类研究从模型层面提升鲁棒性,通过改进损失函数、引入因果噪声模型或采用可分离式表示学习,将偏好信号与噪声信号区分开来。例如Chen等提出基于课程学习的可分离推荐模型,可在训练过程中逐步过滤噪声[10]。这类方法理论性强,但模型结构复杂、训练成本较高。此外,也有学者从可信度建模出发,构建交互级置信度矩阵或可解释信任信号,以增强相似度计算与排序的可靠性。综述研究指出,基于可信度的推荐有助于提升系统透明度,但通常需要额外的上下文或社交信息支持[11]。
相较上述方法,近年来基于信息熵的不确定性建模逐渐受到关注。该类方法利用Shannon熵衡量用户评分分布的离散程度,以此表征其评分行为的稳定性与可信度。Liu等的研究表明,熵值能够有效识别评分波动较大的用户,在相似度计算中降低其影响权重[12]。与依赖深度学习的动态权重加权方法或需要明确噪声模型的异常剔除方法相比,熵权策略具有计算轻量、无需额外特征、可解释性强等优势,尤其适用于稀疏与高噪声并存的场景。基于此,本文提出的“用户评分信息熵权重协同过滤”方法以评分分布的熵作为用户可信度指标,并将其引入相似度计算,从而增强评分稳定用户的贡献、抑制不稳定用户的干扰,为提升协同过滤的鲁棒性提供一种简洁而有效的途径。
在真实电商环境中,用户评分行为常呈现高度主观、稳定性差及评分尺度使用不一致等现象,用户评分分布差异会显著影响相似度的可靠性[13]。例如,部分用户评分习惯偏高或偏低,而另一些用户评分波动较大,导致基于余弦相似度或皮尔逊相关系数的传统CF易产生偏差,进而降低推荐可信度[14]。因此,如何合理建模用户评分行为的有效性,减少“不可靠用户”对预测结果的干扰,是协同过滤研究的重要问题。
近年来,信息熵、置信度权重与行为稳定性指标被用于增强协同过滤的评分质量辨识能力。信息熵作为衡量分布不确定性的经典工具,可有效识别评分模式稳定的用户,在相似度计算中赋予其更高权重[15]。已有研究显示,引入评分信息熵能够缓解评分尺度差异导致的相似度偏差,并提升协同过滤预测性能[16]。相关研究亦进一步指出,若能区分高噪声与高置信度的用户行为,可显著提高Top-K推荐的精确度与排序表现[17]。
基于上述问题与研究趋势,本文提出一种基于用户评分信息熵权重的协同过滤推荐方法(Entropy-weighted CF)。该方法在用户相似度计算中引入评分熵值,以动态调整不同用户对相似度的贡献,降低评分波动大、行为不稳定用户对推荐结果的影响。通过突出评分稳定用户的作用,该方法有望在评分噪声较高的环境中显著提升协同过滤性能。为验证其有效性,本研究从多项指标系统评估模型表现,并与传统CF进行全面对比,以探讨熵权机制在Top-K推荐任务中的实际增益。
2. 算法介绍
用户信息熵计算:设用户
的评分集合为
,评分值的概率分布为
,则其信息熵定义为:
(1)
其中,
为不同评分等级数量,
为用户
给出第
种评分的概率。熵值
反映了用户评分的随机性与波动性,熵越大表示评分越无规律,可信度越低。
熵权计算为抑制高熵用户的干扰,引入归一化权重
:
(2)
其中,
为样本中最大熵值。当
越大,
越小,表示该用户在相似度计算中权重下降。
用户相似度加权计算:在传统余弦相似度基础上,引入熵权调整:
(3)
其中
(4)
评分预测:基于用户相似度的加权预测公式为:
(5)
其中,
表示与用户
相似的用户集合。
3. 实验设计
3.1. 数据设置
本文使用了公开的MovieLens真实数据集(https://grouplens.org/),用户可以对电影进行打分,网站可以对用户提供个性化推荐服务。用户对自己浏览、收藏过的产品按照5分制进行打分,其中最低分1分表示最不喜欢,最高分5分表示最喜欢。如果用户看了一部电影并且对它进行了打分,用户与电影之间就会产生一条连边。本章选取的MovieLens数据集中共包含610个用户、9743个电影和100,837条打分信息。通过用户–物品矩阵转化形成稀疏评分矩阵,用于构建相似度计算与预测实验,为验证所提方法的有效性。
3.2. 评价指标
均方根误差(Root Mean Squared Error, RMSE):均方根误差是一种常用的回归或评分预测模型的评价指标,用于衡量模型预测值与真实值之间的偏差程度。其定义为:
(6)
其中,
表示测试样本的数量,
表示模型预测的评分值,
表示用户的真实评分。RMSE的值越小,表明模型的预测误差越小、预测精度越高。由于平方运算会放大较大误差的影响,因此RMSE对异常预测值(outliers)较为敏感。
平均绝对误差(Mean Absolute Error, MAE):平均绝对误差用于衡量预测结果与真实值之间的平均偏差,其定义为:
(7)
MAE直接计算预测评分与真实评分之间的绝对差的平均值。与RMSE相比,MAE的优点是直观且不受极端值过度影响,因此在对模型稳健性评估时更为可靠。MAE越小,表示模型整体预测效果越好。
4. 实验结果与分析
图1展示了普通协同过滤(CF)模型与基于用户熵权重的协同过滤模型在预测精度方面的对比结果。从图中可以看出,改进模型在均方根误差(RMSE)和平均绝对误差(MAE)两个指标上均显著优于传统协同过滤算法。具体而言,如表1所示,普通CF模型的RMSE与MAE分别约为0.7573与0.5676,而基于熵权的CF模型分别下降至0.3544与0.2243,整体误差降低幅度超过50%。
这一结果表明,引入用户熵作为权重能够有效提升推荐性能。熵值反映了用户评分分布的信息量和稳定性,高熵用户往往提供了更具代表性的偏好信息。在相似度计算中对高熵用户赋予更高权重,有助于减少噪声用户对结果的干扰,从而提高预测的准确性与模型的鲁棒性。
此外,从误差分布来看,RMSE与MAE均显著下降,说明模型不仅在整体预测上更接近真实评分,也能更好地控制单个预测误差。这意味着,熵权机制在改善模型稳定性和泛化能力方面具有明显优势。
Figure 1. Performance comparison of the entropy-weighted user-based collaborative filtering model
图1. 基于用户熵权重的协同过滤模型性能对比
Table 1. MAE and RMSE comparison of the entropy-weighted user-based collaborative filtering method
表1. 基于用户熵权重的协同过滤MAE、RMSE对比
算法 |
MAE |
RMSE |
CF |
0.5676 |
0.7573 |
基于熵权CF |
0.2243 |
0.3544 |
本研究围绕传统协同过滤(CF)模型与引入熵权后的协同过滤方法,见图2,在Top-K推荐场景下的表现进行了对比分析,重点关注Precision@10、Recall@10与MAP@10三项关键评价指标。整体结果表明,加入熵权后,模型性能呈现出显著改善。见表2,首先,在Precision@10方面,熵权CF明显优于传统CF。传统模型的Precision@10为0.8745,而采用熵权后该值提升至0.9640,增幅超过10%。这一现象说明,熵权的引入能够提升推荐列表的“命中程度”,使前10个推荐条目中有更高比例真实契合用户需求。其核心作用在于,根据不同用户评分行为中所包含的信息量差异进行差异化加权,从而增强高辨识度用户的贡献,削弱随机、噪声行为的影响。其次,在Recall@10指标上,熵权CF同样实现了一定提升,由0.2859增至0.3247,表明其不仅在推荐精度方面表现更优,也增强了对用户潜在兴趣项目的覆盖能力。虽然召回率上升幅度相对有限,但依然体现出熵权机制能够在有限的推荐名额中捕捉到更多真正相关的条目。再次,在衡量整体排序质量的MAP@10上,熵权CF的提升更为突出,从0.8460增加至0.9737,与Precision指标的改善趋势保持一致。这说明熵权机制不仅提高了推荐内容的相关度,还进一步优化了推荐列表的排序结构,使得用户更容易在列表前部获取更匹配的项目。从整体趋势来看,三项评价指标在熵权CF中均呈现不同幅度的上升,特别是Precision和MAP的变化更为明显,再次确认熵权机制在协同过滤任务中的有效促进作用。综上,引入熵权后,推荐模型在准确性、兴趣覆盖度以及排序优化方面均实现了更为系统性的性能提升。
Figure 2. Comparison of Top-10 recommendation performance
图2. Top-10推荐性能对比
Table 2. Data comparison of the entropy-weighted user-based collaborative filtering method
表2. 基于用户熵权重的协同过滤数据对比
算法 |
Precision@10 |
Recall@10 |
MAP@10 |
CF |
0.8745 |
0.2859 |
0.8460 |
基于熵权CF |
0.9640 |
0.3247 |
0.9737 |
5. 结论
本研究围绕传统协同过滤(CF)模型在评分波动、用户行为不稳定等情境下易产生相似度失真与推荐质量下降的问题,提出了一种基于用户评分信息熵权重的协同过滤推荐算法(Entropy-weighted CF)。该方法利用信息熵刻画用户评分分布的稳定性与可信度,并在相似度计算过程中引入熵权调节机制,以抑制评分模式随机性较高用户对结果的干扰,从而强化稳定评分用户在推荐计算中的实际贡献。通过这一改进策略,模型在相似度度量、评分预测与Top-K推荐任务中的核心性能均获得显著提升。在评分预测实验中,熵权模型较传统CF在RMSE与MAE两项指标上均取得超过50%的误差下降幅度,表明熵权机制有效缓解了高噪声评分带来的预测偏差,提高了整体预测的精确性与稳健性。同时,在Top-K推荐任务中,本研究重点对Precision@10、Recall@10与MAP@10三项关键指标进行了分析,结果显示熵权CF在三个指标上均呈现出不同程度的提升,其中Precision@10与MAP@10的增幅最为明显,达到近10%的性能改善。这表明熵权机制不仅能够增强推荐结果的相关性,还能优化推荐排序的层次结构,使用户更易于在列表前端获得更契合其兴趣的项目。总体来看,引入信息熵的协同过滤模型能够更准确区分稳定与不稳定评分行为,从而实现更合理的用户相似度权重分配,有效缓解传统CF中“评分差异性”、“行为噪声”、“相似度偏移”等关键问题。本研究的实验结果进一步验证了熵权机制在推荐准确性、兴趣覆盖度与排序质量等方面的综合优势,为解决电商推荐场景中的用户评分不一致性与行为不确定性提供了可行路径。未来研究将从以下方向进一步拓展:可引入时间衰减因子或用户行为序列特征,结合熵权机制构建动态协同过滤模型,以捕捉用户偏好的时序变化;需要指出的是,尽管信息熵在衡量用户评分分布稳定性方面具有理论优势,但其仍存在一定局限性。一方面,熵值主要依赖评分分布本身,难以完全捕捉用户行为背后的语义差异,例如评分偏高但始终稳定的用户,其行为模式与偏低且稳定的用户可能截然不同,但熵值难以区分这一差异;另一方面,熵权方法可能对极度稀疏用户表现出偏弱的刻画能力,当用户评分数量过少时,其熵值可能不足以真实反映其稳定性。此外,熵作为一种统计量,本质上是基于静态分布的测度,难以直接建模行为随时间变化的动态不确定性。因此,在模型扩展中可考虑结合时间序列特征、行为嵌入表示或基于图结构的可信度传播方法,以强化对用户行为真实性和有效性的多维度建模。
基金项目
本文系国家自然科学基金“在线社交用户行为的耦合时序分析理论及其应用研究”(72171150)研究。