1. 引言
微博、微信以及各种话题论坛是新媒体的典型代表,S公司作为一家巨头公司,自2016年8月世界第一起S手机爆炸和2016年9月中国第一起S手机爆炸之后,新浪微博与IT之家论坛上就有了广泛而热烈的讨论,S公司的每一次声明都会获得极高的关注度。所以,研究S公司应对此次企业危机事件的策略,中国消费者对“S手机爆炸事件”的态度和关注点具有实际意义。
文章将微博数据和IT之家论坛数据作为数据来源,研究公众对于“S手机爆炸事件”随着S公司的声明和时间的发展,中国消费者情感的变化分析。国外研究有关网络舆情和危机公关的文献众多,Zheng, B., H. Liu and R.M. DaviSon [1] 揭示了公众如何从社会控制的角度参与SCC (次级危机传播)的决策过程;Fan, K. and W. Pedrycz [2] 提出了一个社会判断为基础的意见(SJBO)动力学模型,以探讨在知情代理人的影响下的意见演变;Lian, Y., X. Dong and Y. Liu [3] 严格推导了一个用于描述网络舆情拓扑的模型;Liu, D., W. Wang and H. Li [4] 研究了网络突发事件中的舆情演化机制和信息监管。国内许多学者通过案例分析来评判企业的危机公关策略并给出建议 [5] [6] ,同时在危机公关过程中观察公众的情感态度变化 [7];李立耀 [8] 等从概述信息传播规律、信息传播模型、传播预测模型、意见领袖挖掘4个方面对信息传播机制进行了研究;戴杏云 [9] 等认为依据用户在网络中影响力的大小和群体情绪的动态变化状况,可以生成直观的社交网络情感图谱;万源 [10] 将语义统计分析应用到网络舆情研究中;林敏 [11] 全面揭示了网络舆情发生过程中的多层次因素及其内在的演化机理和规律。
现有的国内外很多针对企业危机公关的研究都是基于市场营销的角度做描述性案例分析或者做企业公关理论研究,而基于大数据的研究集中在人群画像和商务智能等内容上,采用社交网络研究方法的多用于建立模型。而文章不同于现有研究,是基于大数据做企业公关案例分析,将两个不同社区上爬取的针对这次危机事件的评论数据进行整合分析,得到定量的数据结果,同时绘制情感时间序列图,描述网络大众的情感变化过程并进行预测和验证。
2. 研究设计
2.1. 数据收集
论文数据收集一共有两个来源,一是微博文本数据,二是网页论坛数据。前者是在微博搜索页面进行以“S手机爆炸”为话题的搜索,收集从2016年9月至2017年8月的关注度较高的博文的评论数据,采用网络爬虫软件进行数据抓取。后者是在著名的数码、科技和生活门户网站IT之家上抓取新闻评论数据,搜索关键词“S手机爆炸”,得到若干新闻条目,选取关注度较高的新闻进行评论数据抓取。
2.2. 数据清洗
论文采用EXCEL软件做数据清洗,一共有以下步骤:
将.txt文本数据转化为EXCEL格式。获取的微博文本数据是EXCEL格式的,不需要转化,但是运用python编程语言获得的在数据库中的数据是.csv或者.txt格式的,需要先在WORD文档中将文本数据转化为表格格式,然后再复制到EXCEL表格中。
清除数据中的空值和不需要数据,增添需要的数据。在用八爪鱼工具采集数据时,有可能采集到了空的评论数据,将该条数据删除;在使用Python编程语言只采集到了评论数据,从数字1开始编号,为用户设计一个ID。
合并同一时间段的数据在一个文件中。在后续的数据分析中,按照需求设置时间单位,并将在微博采集到的数据(以下简称微博数据)和在IT之家门户网站采集到的数据(以下简称网页数据)这两个不同社区的数据合并在一起。
2.3. 情感分析设计
首先将每条评论数据进行文本预处理,即以标点符号为分割点,将每条评论分为某几段,再提取每段中的情感词;然后以这个情感词为中心,寻找临近的程度副词、否定词等,对照情感词表进行综合打分;最后进行反问、感叹等语气判断,在之前的分数基础上改变相应程度的分数。
一般来说,情感词表将最积极的情感数值设为“1”,最消极的情感数值设为“0”,高于0.5代表一句话带有积极情感,反之低于0.5表明这句话含有消极情感。将微博数据或网页数据中每一条评论数据的情感打分取平均值,最终得到综合情感分。
2.4. 关键词分析设计
以评论数据构造关键词网络图,选取了名词做关键词相关分析。当结点之间存在相互联系的关系时,就会产生一条连接的线;两个结点之间距离越近,表明两个词的联想度越大;某个结点越大,表明在关键词中的权重越大,越能代表总体的看法。
每一个关键词得出的权重的过程和方法是:首先在情感分析过程中将评论数据分词的基础上,得到形容词、名词、动词等性质的词语;然后采用购物篮的分析方法,计算某个词语到其他词语的置信度;最后将这个词语到其他词语的所有置信度数值求和,并设置信度和的数值大于1才被列为关键词,此时这个和值也是这个关键词的权重。
2.5. 回归分析设计
结合情感分析数据和关键词分析数据,通过观察关键词权重表,除去在评论中一定会被提到的话题中心词,选取在每个时间段出现频率较高的几个关键词,并且以天为时间单位计算关键词的权重数值,同时为了准确表现网友对关键词的关注程度,将计算出来的关键词权重再除以评论数量,最后与每天的情感综合分做相关分析。
3. 实证分析
3.1. 数据获取及预处理
文章采用网络爬虫软件进行数据抓取,一共抓取微博数据20,198条和网页数据25,568条。
通过EXCEL软件进行数据清洗和预处理,清除数据中的空值和不需要的数据,增添需要的数据。最后将相同时间段的两个数据(微博数据和网页数据)合并一起,一共获得微博数据19,590条,网页数据22,167条。表1为得到的各个月份的评论数据数量:

Table 1. Comment data quantity distribution table
表1. 评论数据数量分布表
3.2. 情感分析
在合并微博评论数据和网页评论数据为一个评论数据集时,以月份为单位合并数据,并且选取三个关键月份,2016年9月,2017年1月和2017年7月,这三个时间段分别为第一起爆炸发生时、S公司官方给出电池爆炸的权威解释时以及S公司的此次危机在中国暂时平息的时候。通过计算出这三个关键月份的情感综合分,直观感受网络舆情在整个危机事件进行过程中的总体情感反应。

Table 2. Comment data sentiment distribution table
表2. 评论数据情感分布表
根据表2,可以分析得出:首先,评论总数随时间变化是减少的。其次,在这三个时间段,情感综合得分小于0.5,则表明网友对“S手机爆炸”事件的情感总是负面的。最后,虽然在2017年7月,即这次危机事件基本结束的时候,情感综合分对比2017年1月有明显上升,但是仍然是负面的情感态度。
分别统计出微博数据和网页数据每个月的评论数据的数量n1和n2,则某个月平均情感综合分数为(微博情感综合分 * n1 + 网页情感综合分 * n2)/(n1 + n1)。再将情感数据导入SPSS软件,利用指数平滑法做情感的时间序列分析。情感综合分数走势如图1所示。

Figure 1. Emotional composite score chart
图1. 情感综合分数走势图
据图1分析,随着网络舆情热度的下降,情感综合得分在不断上升。但在2018年4月“S手机爆炸”事件尚未平息时,又出现S企业其他手机自燃事件,导致情感综合得分迅速降低。针对此次危机,S企业迅速采取公关措施,情感综合得分逐步上升。
3.3. 关键词分析
与情感分析处理数据的方法类似,通过以月份为单位合并数据对两个社区做关键词分析,计算出关键词的权重,如表3所示,权重数值越大,说明网友评论时提及越多。

Table 3. Comment data keyword weight table
表3. 评论数据关键词权重表
评论数据关键词权重表表明,随着时间推移,“S公司”这个关键词的权重在降低,即人们对S公司这家公司的讨论度降低,同时排列在前的关键词的权重得分在不同程度下降,说明随着事件的发展,人们的注意力在被分散。另外值得注意的是,借着“S手机爆炸”事件的热点,人们开始拿S手机和其他品牌的手机做比较,如苹果和华为,这说明S公司也在失去它原本的潜在顾客。
因为S公司在对待中国消费者和外国消费者的方法上有些差异,所以网友在评论的时候“中国”也成为了一个重要的关键词,特别是在前两个时间段,在除“S公司”“手机”和“电池”这三个极其中心的关键词之外,“中国”是权重得分最高的。
另外,不出人意料的,“电池”和“爆炸”都成为了网友从一开始就评论的重点,说明对官方解释“电池为什么爆炸”,网友是抱有期待之情的。然而因为S公司没在短时间内给消费者和用户一个满意答复,所以导致在2017年1月的检验报告发布活动之后,“棒子”这个侮辱性词汇成为网友对此事件发表看法的重要用语。
3.4. 回归分析
结合情感分析数据和关键词分析数据,选取在每个时间段出现频率较高的七个关键词“态度”、“召回”、“苹果”、“中国”、“华为”、“消费者”和“产品”,与每天的情感综合分做相关分析。
表4是进行Pearson相关分析的结果。
**. Correlation is Significant at the 0.01 level (2-tailed). *. Correlation is Significant at the 0.05 level (2-tailed).
在进行相关分析后,情感综合分分别与关键词“态度”、“召回”、“苹果”、“中国”、“华为”、“消费者”的双侧检验值Sig都小于0.05,通过显著性检验,且皆为负相关。其中,关键词“苹果”、“消费者”与情感综合分与的相关程度最大,前者相关系数在0.05的置信水平下为0.602,后者为0.716。
但是,关键词“产品”没通过与情感综合分的相关性的显著性检验,因此做情感综合分为因变量的回归分析,只能选取关键词“态度”、“召回”、“苹果”、“中国”、“华为”和“消费者”为自变量做多元线性回归分析。
在进行数据预处理的时候,发现回归分析系数表中系数Sig值小于0.05,但是得出的系数却为0,是因为系数只保留小数点后三位,于是将数据中的情感综合分数值扩大100倍。
表5是进行回归分析的结果。
在回归分析中,首先,拟合优度R (goodness of fit)调整之前为0.688,表明自变量可以解释因变量68.8%的变化,拟合效应比较好。
其次,Sig值为0,小于0.05,说明通过了显著性检验。
最后,表5显示只有五个自变量即关键词“态度”、“苹果”、“中国”、“华为”和“消费者”的Sig值都小于0.05,通过t检验,而关键词“召回”的Sig值大于0.05,未能通过显著性检验,因此不能列入回归方程。
通过看Beta数值的大小,得知各个自变量的系数大小。下面是通过回归分析得到的线性回归方程,F表示“情感综合分”,Wt表示关键词“态度”,Wp表示关键词“苹果”,Wz表示关键词“中国”,Wh表示关键词“华为”,Wx表示关键词“消费者”:

Table 5. Regression analysis coefficient table
表5. 回归分析系数表
a. Dependent Variable:情感综合分。
(1)
线性回归方程(1)表明,首先两个社区的网友对S公司处理这次手机电池爆炸事件的态度越关注,则对S公司的情感态度越消极;其次对S手机的竞争对手“苹果”和“华为”讨论度越高,对S公司的负面情感越多;再其次,“中国”字眼的关注程度也影响着网络舆情对S公司向不利的方向发展;最后,网友关注“消费者”越多也导致S手机消极情感的产生,但是影响低于前几者。
4. 结语
论文以S手机电池爆炸为案例分析,综合了两个社区的评论数据,运用情感分析、关键词分析和回归分析的分析方法,得到了大众对此次事件的情感态度自始至终皆为消极的结论,说明S公司对这次危机的公关效果不尽人意,甚至导致了S手机被迫淡出中国市场的严重后果。在此次企业危机公关过程中,还得出以下结论:
首先,当事件开始发生时,是S公司进行干预的绝好时机,但是S公司在国外召回S手机而在中国继续销售,从而发生更多爆炸事件,导致这起危机事件在2016年9月、10月开始发酵。所以当危机事件发生时,企业要迅速找到问题根源,并做出反应;
其次,当事件开始发酵的时候,即引起社会大众广泛关注时,S公司竟然和消费者硬碰硬,甚至起诉消费者,导致这次危机事件愈演愈烈。企业在面对事件开始发酵时,应迅速把握舆论对危机事件的关注点,对事件处理的痛点和难点予以最真诚和积极的回应;
再其次,当危机全面爆发的时候,S公司的公关行为石沉大海,社交网络上的网络舆情已经呈现“一边倒”的态势,S手机短时间内在中国市场上已很难取得销售佳绩,华为、苹果等品牌受到更多关注。此时,企业需要顶住压力迎难而上,敢于承担危机带来的后果,尊重消费者,化危机为契机。
最后,S公司真诚地与消费者交流,公布电池爆炸的真实原因是值得肯定的,但是“S手机”在消费者心中已经和“电池爆炸”紧紧联系在一起了。当危机变成“危难”时,外部环境已经束手无策,只能管理好公司的内部,以期平稳度过此次危机。
文章的不足之处有两点,一是基于社区的评论数据的研究,但是没有收集发表评论的用户数据,二是对于不同的数据源没有区分研究。未来的研究可收集多类别的数据,分析不同类人群的正面或负面情绪,寻找意见领袖。