1. 引言
随着Web技术的发展,新媒体成为人们日常交流和获取信息的主要工具,依赖社交媒体平台发展和与粉丝极强的互动能力催生出许多活跃且具有影响力的网络用户,称为“网红”。依托身后大量粉丝资源,网红获得经济收入或社会地位,实现网红价值。网红在使用社交媒体、与粉丝互动过程中产生的数据和其他生产要素一起融入到网红价值创造过程,根据2019年中国信通院数据资产的定义 [1] ,这些数据形成数据资产。商界和学术界为如何评价数据资产价值、破解数据定价难题,提升数据的共享和使用努力探索,但目前的研究和应用还处于起步阶段,数据资产增值需要依赖于业务场景,如何衡量数据资产价值还缺少系统的研究。
本文以特定情境下的数据资产价值衡量为研究目标,以新浪微博网红账号为例,把微博账号的量化价值作为微博网红数据资产的价值,通过网红静态个人信息、动态行为信息,从专业度、活跃度、丰富度、传播度4个方面探究网红数据资产价值的影响因素。本文的研究可以为数据资产价值研究提供理论和方法支持,同时对网红价值衡量方法提供重要补充。
2. 相关研究
作为一种新型资产,影响数据资产价值的因素非常复杂,至今尚未取得共识,著名教授吴恩达 [2] 提出数据价值由数据量级、质量、分析能力共同决定。李永红等 [3] 提出数据量级和质量通常受数据覆盖程度、完整性、外部性、时效性、相关性及企业规模等影响。J. Attard等 [4] 指出数据价值贯穿于数据整个生命周期。部分学者针对不同领域(图书馆、电力、金融等)数据资产选择影响价值的因素,尽管关注的因素不尽相同,但都认为数据资产增值需要依赖于具体的、带有不确定性的业务场景 [5] [6] [7] 。
在网红经济这一特定应用场景下,网红的网络行为和其他生产要素共同创建了网红价值,网红的量化价值体现了网红相关数据资产的价值,其影响因素相关数据也是网红数据资产的基本构成。网红经济现象的出现与其对粉丝的影响力密不可分,社会化影响力催生网红经济价值,因而本文主要从影响力视角分析网红价值影响因素 [8] 。
基于社会关系理论,网红本身的影响力直接影响粉丝与网红的信任关系 [9] 。De Veirman等 [10] 、Xiao等 [11] 验证了信任感受到网红专业度、行为特征影响。网红通过互动形成的复杂社会关系,会改变网红的社会影响范围 [12] [13] 。刘凤军等 [14] 、Torres等 [15] 从信息来源、网红参与度补充了影响网民信任度的因素还包括信息来源可靠性、网红的参与度高低。
新浪微博作为我国成立较早的社交平台之一,孕育出了大量网红账号,数据资产价值巨大 [16] 。对微博影响力的研究中,赵阿敏等 [17] 归纳了账号的关注度(关注、转评赞数量)、活跃度(发博数和是否原创)、互动性(@符号应用)、整合力(所发内容与新闻热点的相关性)四个维度;白建磊等 [18] 将影响政务微博传播效果的因素归纳为社交媒体特征(与粉丝互动程度、所发内容的多媒体属性)、微博内容(话题类别、语言特征、博文长度)、账号特征(地理位置、是否认证);杨长春等 [19] 将微博总数、话题数、评论回复数、平均阅读量、原创微博数、粉丝数等指标提取成交互力、服务力、传播力、创造力4项一级指标分析。同时,人民网舆情数据中心每年发布《政务指数微博影响力报告》,从传播力、服务力、互动力、认同度评价政务微博的运行效果。
综合来看,在微博网红账号影响力相关因素中,粉丝数、关注数、转评赞数量是基本要素 [20] ,刘根勤 [21] 从传播学角度提出微博形式、内容、发布时间是热门微博信息价值的重要因素,Hao等 [22] 学者还从机构属性、文字、图片、视频的搭配效果,对微博影响力展开研究。
学界对微博账号影响力的研究相对完整,分别从不同维度探究微博影响力相关因素,但尚未将其与数据资产价值联系起来。而影响力直接影响账号价值,即网红的影响力越大,账号数据资产价值越大 [8] 。本文将结合前人已有研究成果,探究对网红数据资产价值产生影响的因素,为数据资产价值研究提供理论和方法支持。
3. 理论模型和假设提出
本文旨在基于微博账号,探究影响网红数据资产价值的因素,结合前人已有研究成果,从微博账号的专业度、活跃度、丰富度、传播度四个维度展开。本文的研究假设如下:
3.1. 假设说明
3.1.1. 专业度
刘凤军等 [14] 、孟陆等 [23] 在探究直播网红对消费者的影响时,证实了网红的专业性可以对消费者产生影响并刺激消费者的购买行为。包明林等 [24] 经过定量分析提出微博账号的信用水平、信息认证体现了账号的专业性,两者都正向影响政务服务质量。敖鹏 [25] 、金晓玲等 [26] 认为网红所依托的行业背景,能代表账号的专业水平。社交平台通常收集用户的学校、公司信息做人群画像,其中学校认证可以体现学历背景,公司信息可以体现行业背景。
基于此,本文分别用账号信用(账号信用水平和是否认证)、学历水平(是否有学校信息)、公司认证(是否有公司认证)表示账号的专业性,提出以下假设:
H1a:专业度对网红数据资产价值产生显著影响。
H1b:账号信用与网红数据资产价值呈现正相关性。
H1c:学历水平与网红数据资产价值呈现正相关性。
H1d:公司认证与网红数据资产价值呈现正相关性。
3.1.2. 活跃度
赵阿敏等 [17] 提出发博数越多、发博频率越高,账号活跃度越高,从而大大提高政务微博的影响力水平;账号关注数体现了与其它微博的互动行为,作为活跃度的表现,可以提高账号本身的关注度。刘晓娟 [27] 探究发布时间在政民互动中的影响时,将其表示为账号发博的活跃特征,认为微博发布的时间特征显著影响微博传播效果,通常在上午时段影响力达到峰值。曹政等 [28] 认为账号认证时间越久,活跃度和权威性越高,正向影响账号影响力。
基于此,本文选择账号发博活跃度(账号发博频率和发博总数)、关注数、时间特征(微博发布常用时间段)、创建时间表示其活跃度,由于账号认证时长不便获得,用账号创建时长代替,提出以下假设:
H2a:活跃度对网红数据资产价值产生显著影响。
H2b:发博活跃度与网红数据资产价值呈现正相关性。
H2c:创建时间与网红数据资产价值呈现正相关性。
H2d:关注数与网红数据资产价值呈现正相关性。
H2e:时间特征对网红数据资产价值产生显著影响。
3.1.3. 丰富度
网红的本质是内容生产者,“内容为王”说明内容是网红的核心竞争力 [29] 。微博内容的表现形式有文字、图片、视频、表情、话题、链接等,白建磊等 [18] 认为这些因素能够提高微博内容的丰富度,有利于微博传播。据此,本文用账号所发布微博包含图片、视频、话题、表情、链接的频率表示内容丰富度,提出以下假设:
H3a:内容丰富度与网红数据资产价值呈现正相关性。
3.1.4. 传播度
网红会对粉丝形成一定的话语权,形成深层次的粉丝关系和互动,有利于提高粉丝黏性,依赖粉丝的影响力扩大传播范围,提高信息传播的广度,从而提升网红账号的价值 [25] 。微博的点赞、评论、转发功能,是用户表达观点传递情感的重要途径 [30] ,能代表网民对信息的认可程度和情感极性。杨长春等 [19] 用粉丝数表示微博传播力,用微博的转评赞数量表示微博的认同力构建影响力指标体系,得出粉丝规模正向影响微博影响力,但不起决定性作用;转评赞决定了政务微博影响力大小。
基于此,本文用粉丝规模表示传播广度,用微博的转评赞数量表示传播深度,提出以下假设:
H4a:传播广度与网红数据资产价值呈现正相关性。
H4b:传播深度与网红数据资产价值呈现正相关性。
本文的研究假设如图1所示:
3.2. 研究设计
3.2.1. 研究样本和数据来源
本文研究数据包括云自媒平台微博账号定价信息,新浪微博平台微博账号的静态基本信息和动态行为信息。
1) 云自媒涵盖小红书、新闻客户端、直播、新浪微博等平台的媒介资源,考虑到社交平台的普及度和影响力,本文选择新浪微博作为研究对象,从云自媒获取相关信息。云自媒平台上微博广告资源分为派单资源和预约资源,预约资源需提前和媒介主沟通定价,而派单资源的账号和定价信息可以直接获取,因此本文选择可直接获取定价的派单资源,共计获得9463条数据。
2) 云自媒上仅获取到网红账号名称、主页链接、头像、简介、定价等基本信息,据此从新浪微博获取账号行为信息。
3.2.2. 数据预处理
本文从专业度、活跃度、丰富度、传播度4个维度定义影响微博网红数据资产价值的因素,首先做数据预处理。
1) 数据缺失值:将缺失值较多的案例做删除处理,缺失值较少的案例手动补充。
2) 数据标准化:网红账号的粉丝量达万人以上,而一条微博的点赞数可能低于一百,为避免数据量级差异过大造成不平稳,本文对数据取对数作标准化处理。
3) 因子分析:在每一分析维度内,使用一个变量表示更丰富的账号信息。本文结合因子分析–主成分分析法,将相关性强的指标降维成一个变量。
由于部分数据缺失,数据处理后最终共得到5827条数据。
3.2.3. 变量定义
下面针对数据预处理后的变量及其定义作简要说明,如表1所示:
4. 实验结果及分析
本文探究微博网红数据资产价值相关的影响因素,适合采用多元线性回归模型,来分析每个解释变量对网红价值的影响。将账号的专业度、活跃度、丰富度、传播度作为自变量,账号价值作为因变量,通过回归分析网红价值和多个因素之间的量化关系,最终确定显著的影响因素。本文使用SPSS25和python完成后续实验部分。
4.1. 描述性统计与相关分析
从表2可见,每个变量的标准偏差较小,说明数据预处理后得到了比较平稳的数据,适合用于回归实验,可以对模型产生较好的解释力。

Table 2. Descriptive statistics of variables
表2. 变量描述性统计
表3是模型所涉及变量的相关性分析表,自变量与因变量之间在0.01的显著性水平上相关关系成立;自变量间传播广度与传播深度相关性为0.724,发博活跃度和丰富度相关性为0.662,均表现为强相关。说明变量间可能存在多重共线性,从而不符合建立一般多元线性回归的条件,为此在表4中进一步检验数据关系。其它自变量之间,相关性关系不明显。

Table 3. Variable correlation analysis
表3. 变量相关性分析
备注:**在0.05级别(双尾),相关性显著;*在0.1级别(双尾),相关性显著。
4.2. 数据检验与模型诊断
回归中存在多重共线性会造成系数的偏差,从而影响最终结果的解读。一般变量间的VIF值小于10,或容差大于0.1,认为变量间的多重共线关系不显著。根据表4认为本文自变量之间的线性关系,不会对回归结果造成较大影响。

Table 4. Collinear statistics of variables
表4. 变量共线性统计
岭回归模型是针对数据的多重共线性问题,通过降低精度等方法,使得拟合系数更加准确的回归方法,本文基于上述结果,分别建立一般线性回归模型和岭回归模型探究变量之间的相关关系。
4.3. 模型结果分析
以微博网红账号价值为因变量,考虑到自变量间的多重共线关系,不断调整模型得到表5中模型回归结果。每一模型下,分别建立一般线性回归(ols)和岭回归(rr)方程。从结果看,自变量相同时采用ols还是岭回归得到的系数值相差不大,岭回归模型在R2上有微弱提高。因此本文根据ols回归结果进行后续自变量对微博数据资产价值的影响分析。
从ols 1来看,除传播深度外,其它自变量在0.01的显著性水平上表现为高度显著。考虑到传播广度和传播深度的强相关性,通过Model 2、3优化,说明传播广度和传播深度均显著正向影响微博账号的价值,假设H4a、H4b得到验证。其中Model 2的R2更大,对模型结果的解释力强于Model 3,因此本文选择剔除传播深度避免回归的多重共线性,基于此进一步验证其它变量对微博网红数据资产价值的影响。
Model 4、5考虑丰富度、发博活跃度强相关对回归结果的影响,Model 1中丰富度负向影响账号价值,但是受到发博活跃度的作用,在Model 5中对账号价值呈现正向影响,表明两变量间的相关性影响了回归系数。回归中,R2越大,表明模型的拟合效果越好;F值越大,模型整体的显著性水平越高。基于此比较ols 4、ols 5,最终选择Model 4作为微博网红数据资产价值衡量模型。
整体来看,账号信用、公司认证、发博活跃度、时间特征、传播广度、传播深度显著正向影响微博账号的价值,学历水平、创建时间、关注数、丰富度显著负向影响微博账号的价值。其中账号信用、公司认证、创建时间、传播广度、传播深度对账号价值影响较大。
结合实践对模型结果解释如下:
1) 传播广度、传播深度显著正向影响账号价值,粉丝数越多则微博曝光率越高,促使微博网红数据资产价值提升;增加微博内容的网民认可度,提高转评赞能够增加微博网红数据资产价值。
2) 账号信用水平显著正向影响账号价值,信用越高,在广告定价上越具优势。学历水平、公司认证分别负向、正向影响账号价值,说明在微博类社交平台上,网民往往更加关注账号的专业背景,而学历是次要的。公司认证为账号运营提供背景支撑,因此影响力、价值更大。
3) 发博活跃度、时间特征反映了账号活跃特征,发博积极性越高,账号价值愈大。从发博时间上看,账号发博时间越晚产生影响力越大。创建时间显著负向影响微博账号价值,说明账号注册的越晚,价值越大。新创建的账号,其类型更贴近社会热点,拥有更广泛的受众。但通常来讲,账号创建越久,粉丝基础越稳定。因此账号创建时间对其价值的影响是否存在一个分界线,有待深入研究。关注数表示账号本身关注的博主数量,表现为负相关性,说明账号关注行为不会显著增加其价值。
丰富度表现为显著负向影响,有三种可能的解释:第一种可能是这并不是网民关注的内容,因此是否包含该特征不会影响账号的价值;第二种可能是实验样本中,账号丰富度水平相当,导致变量影响不显著;此外,可能受到残差项影响,存在误差,因此微博内容的丰富度有待深入研究。
4.4. 假设验证结果
通过上述模型结果和分析,本文所提出的大部分假设都得到了验证。如表6所示:
4.5. 本文建议
基于实验结果,本文为微博网红提出以下建议:
1) 通过扩大粉丝规模提升价值;
2) 通过官方认证、提高信用值等方式提高网民信任度;
3) 账号运营要讲究策略,不要“长期沉睡”,应提高发博积极性,增加活跃度来获取流量,实现价值提升;
4) 除内容本身外,可以根据粉丝的作息习惯,针对性地选择发博时间;
5) 注重和网民的积极互动,通过回复网民评论、私信等方式,增加转评赞来提高微博的传播效果;
6) 创作上要注重内容的准确性和丰富性,对文字事实加以包装,激发网民的阅读兴趣。
对于媒体投放平台来说,可以结合线性回归中自变量的表现,在设计账号价值评估模型时,给予某些变量更高或者更低的权重。
5. 结论
伴随大数据时代到来,社会媒体快速发展,网民的网络行为产生了大量数据资产,造成数据爆炸现象。了解这类数据资产价值相关的影响因素,将其应用到社会实践中,将大大提高社会生产效率。
本文以网红经济领域下的数据资产价值衡量为研究目标,以微博账号为研究对象,探究对网红数据资产价值产生影响的因素,从微博账号价值生成过程出发选择自变量,通过回归实验,证明了账号的专业度、活跃度、丰富度、传播度会影响网红数据资产的价值。其中传播广度、传播深度、账号信用、公司认证、发博活跃度、时间特征显著正向影响微博网红数据资产价值,创建时间、学历水平、丰富度、关注数显著负向影响微博网红数据资产价值。这丰富了数据资产的研究视角,为数据资产价值研究提供重要补充。
新浪微博2009年成立,是国内发展较为成熟的社交网络平台,而近几年来兴起的短视频、直播平台,也占网民日常生活的大部分比重,对这类网红数据资产价值产生影响的因素与微博之间存在差异。因此,本文得到的网红数据资产价值影响因素推广性受限,还需结合特定场景,后续深入研究。
基金项目
本文系国家社科基金项目“数据资产价值视角下‘网红’影响力及其行为规范研究”(项目编号:21BXW098)研究成果之一。