1. 引言
随着传统电商的获客成本的不断攀升,拥有天然引流能力和强裂变特点的社交电商脱颖而出。据艾瑞传媒发布的《中国社交电商行业研究》可知,2020年中国社交电商行业交易规模预计20673.6亿元,同时将保持30%以上的增长速度。而在社交电商中,最具有代表性的是拼购型电商,特别是拼多多。根据新浪财经的数据显示,2020年3月4日,拼多多市值418.65亿美元,反超百度,在中国电子商务领域,仅次于淘宝。
拼多多的飞速发展引来了许多学者深入研究。王昕天 [1] (2019)以电商流量分配为切入点,对比传统电商与社群电商的获客效率,指出了电商发展的趋势和拼多多能迅速发展壮大的原因。方子洁 [2] (2019)则从非研发创新地角度,论述了拼多多在商业模式、营销模式和渠道模式等三方面的创新,肯定了拼多多发展的潜力。郑刚、林文丰 [3] (2018)梳理了拼多多发展历程,评价拼多多为“野蛮增长”,同时指出了其在获得资本青睐后的公关危机,如一篇《拼多多,三亿人都敢坑的购物APP》的文章出现在了朋友圈,文章作者指责拼多多销售仿冒、山寨和三无产品。2018年6月8日,拼多多上海的总部遭遇上千家商铺维权。在网上甚至还出现了质疑拼多多依靠对商家罚款进行牟利的声音。当拼多多的负面口碑扩散时,一方面削弱新用户加入的热情,另一方面又影响现有用户持续使用的态度,因此拼多多的口碑是影响其发展的重要变量。
为了探究拼多多的口碑,通过spider爬虫,获取用户对拼多多app的在线评论,针对用户在线评论,先通过情感分析划分正向口碑与负向口碑,以此衡量拼多多的口碑。再利用python和ucinet进行文本处理,以词云、词频等分析直观反映影响拼多多口碑的因素,以聚类分析初步归纳拼多多口碑的内部要素模型。在此基础上,设计半结构访谈问卷,对线下用户进行深入访谈,获取线下口碑数据,通过扎根理论,进一步深化其内部要素模型,并提出相应的建议。
2. 理论与思路
2.1. 相关理论
2.1.1. 口碑
口碑是指消费者之间非正式地传递关于产品、服务及相关企业的想法、评论或者意见的一种交流行为 [4]。口碑的重要性主要表现在:它是一种无声的广告,能帮助消费者收集产品信息,帮助企业广泛传播其优良产品及优质服务 [5]。学者一般将口碑分为正面口碑和负面口碑,正面口碑有利于企业的发展,而负面口碑则会破坏用户对企业的形象,久而久之会抑制企业的发展。Senecal和Nante [6] (2004)通过实验法发现:接受过正面口碑的用户,对同一款商品的购买频率通常是未接触过正面口碑的用户的两倍。换言之,口碑的积极性对潜在客户购买商品的频率有正向的影响。因此,口碑对于商品或者服务而言都有十分重要的研究价值。同时用户在线评论(OUR)是拼多多口碑的组成部分之一,也是对企业发展的重要影响因素。李红柳、王兴元 [7] (2015)对在线评论的有效性研究中发现,发现在线用户评论的数量特征对消费者的品牌感知有正向影响,评论质量特征对消费者品牌认知有正向影响,由此影响消费者认知性态度忠诚。Konstantin Roethke, Johannes Klumpe [8] (2015)在研究在线评论对app的试用态度形成的调节作用指出,有效的在线评论会减少用户在决策-采纳过程中对于产品的不确定性。冯旭 [9] (2019)研究发现,评论情绪与评论的帮助程度有着深刻的关系,用户评论的情感分析可以深化评论的帮助程度。
2.1.2. 情感分析
情感分析是指通过自动分析某种产品评论的文本内容,发现用户对该产品的褒贬态度和意见 [10]。其中一个重要问题就是情感分类,也就是情感倾向性判断,通过对评论的情感判断,可以将评论分为积极的、中性的和消极的,积极的评论会产生正向口碑,消极的评论会产生负向口碑。
2.1.3. 聚类分析
聚类分析指的是将对象的集合分组为由类似的对象组成的多个类别的分析过程,能够从样本数据出发,自动进行分类,而不需要事先给出一个分类的标准,可以避免主观制定分类标准的盲目性 [11]。本文采用的聚类分析类似于网络关系图法,从每个词组的共频性的角度,确定词与词之间的相关性,确定影响权重最大的词汇,归纳整理为影响因子。
2.1.4. 扎根理论
从基本表现形式上来看,扎根理论是一套系统的数据搜集及分析的方法和准则;从基本逻辑上来看,扎根理论强调从经验数据中建构理论;从基本方法上来看,扎根理论采用一种生成性(形成性)的归纳法从原始数据中不断提炼核心概念与范畴;从基本特点上来看,扎根理论强调理论扎根于经验数据,但最终建构的理论不应仅局限于其经验性研究思路。综上,扎根理论可以有效的对文本进行定性分析。
2.2. 研究思路
通过情感分析对用户线上评论进行分类,提取正向口碑和负向口碑数据,再通过聚类分析,初步构建的理论模型。基于此模型进行线下访谈,利用扎根理论进一步深化和完善理论模型,直至模型饱和,最后基于研究成果提出相应的建议,如图1所示。
3. 线上文本分析
3.1. 数据获取
本文利用spider + Fiddler工具,爬取移动端中某应用商城里拼多多的用户评论信息,选择最有帮助的评论的分类标签,且评论时间为2019年1月到2020年3月进行数据爬取,并以评论时间、星级、评论内容作为属性,存储在mysql数据库中。由于移动端的数据大多为动态加载,需要在抓包工具中找寻包含所需数据的json文件,同时可采取了包装请求头和设置休眠时间等手段防止反爬。最终爬取评论数为6000条。
3.2. 数据清洗
在应用市场中一款软件获得的评价包含两种:一是从软件安装和使用角度作出的评价,例如是否存在广告、是否要获取更多的个人隐私权;二是对软件提供的服务、开展的业务进行评价。在这两种评价中只有第二种评价才能反映拼多多的口碑,因此要对爬取的数据进行数据的清洗,清洗的方式为关键字剔除。针对第一种评价,设定关键字:安装、注册、隐私、个人信息、登录、弹窗等,对包含关键字的评论语句进行剔除,一共剔除209条评论。
3.3. 情感分析
用户对一个产品进行评价时,往往存在高分差评的现象,故评分并不能准确的反映口碑,因此本文通过导入情感字典的方式进行情感分析,选择的情感字典为知网情感字典(HowNET),利用其中的正向情感词、负向情感词和程度词,探究在线用户评论的情感倾向,分为正面、中性和负面 [12],以此反映拼多多的口碑,按照时间维度分类,结果如图2所示。
由图可知,拼多多的电子口碑偏向于负面,又接近50%左右的负面口碑,但随着时间的推移,负面口碑有减轻的趋势,正面口碑有增长的趋势,由此说明,尽管现阶段拼多多的口碑为负向,但有朝着好的方向发展的趋势。
3.4. 聚类分析
为了进一步归纳拼多多口碑的内部要素,分别对正向和负向口碑数据进行词云、词频和聚类分析。首先采用在线分词平台,采用最大正向匹配法对文本进行分词处理,剔除掉标签词长度为1的词,保留形容词、动词和名词,同时选择词频大于100的标签词绘制词云,词频越高的标签词,所占面积越大,所在位置越靠近中心,如图3、图4所示。

Figure 3. Cloud map of positive word of mouth
图3. 正向口碑词云效果图

Figure 4. Cloud map of negative word of mouth
图4. 负向口碑词云图
列举词频前十的词汇:
由表1可知:无论正面口碑或负面口碑在词云和词频上都具有一致性,都聚焦平台的商品,其中商品的质量和价格最受关注。同时推荐、朋友、好友等词汇反映出社交因素的影响;红包、砍价、免费、活动等词汇的高频出现反映出用户对于营销方案的关注;客服、卖家、退款、体验、物流、发货等词汇则反映出用户对于购物感知的关注;平台、软件等词汇反映用户对于平台本身的关注。综上所述,可初步归纳出影响拼多多口碑的因素有商品的属性(价格、质量)、社交因素(朋友、推荐)、营销、购物流程体验等五个方面。
为了进一步探究标签词间的关系,本文利用ucinet对标签词进行聚类分析,首先通过词与词在句子中共同出现的次数,构建共现矩阵,再利用netdraw,以点度中心性作为每个因子大小的衡量依据,以共频度大于5为条件,进行社会关系网络的绘制,剔除没有联系的标签词,最后进行K-均值的聚类分析,结果如图5、图6所示。

Figure 5. Cluster analysis of positive word of mouth
图5. 正面口碑聚类分析

Figure 6. Cluster analysis of negative word of mouth
图6. 负面口碑聚类分析
由图可知,红色因子在两个模型中的占比较大,故选择其中的红色因子作为拼多多口碑因素的评价指标。选取的指标有商品(东西)、价格、质量、便宜、朋友、推荐、平台、活动、软件、优惠、购物、划算、保障、客服、商家等,结合词云与词频分析所得的维度进行整理,构建如下图7所示模型。
此模型是以用户对拼多多提供的产品和服务的评论为基础,通过词云、词频和聚类分析推导出来的。为了进一步完善模型,以此模型为基础设计半结构问卷,对拼多多用户进行深度访谈,整理好访谈文本后,通过扎根理论,完善模型。

Figure 7. Influencing factors of user experience
图7. 用户体验影响因素图
4. 访谈文本分析
在聚类分析结果的基础上,通过构建半结构式访谈提纲对受访者进行深度访谈。在半结构访谈中,我们选择了15名访谈对象,这15名访谈对象均具有3年以上比较丰富的网购经验。其中7名访谈对象只在短时间内使用过拼多多,剩余8名使用拼多多的时间在3个月以上,对拼多多较为了解。
本研究的个人深度访谈主要采取面对面访谈和线上访谈相结合的方式,访谈前将访谈主题及目的等内容向受访者进行解释,征得访谈者同意后对访谈过程进行录音,访谈结束后整理音频资料,完成访谈记录。最后对15份受访者的访谈记录通过三级编码的方式对访谈记录进行分析及模型构建。
4.1. 开放式编码
扎根理论研究的第一步是开放式编码。将访谈过程中收集到的原始数据范畴化。对原始数据概念化的过程为:原始数据——概念化——范畴化。对于原始数据,通过分析重点词句,对于重复多次出现的内容初始概念化,通过分析相互之间的关系进一步范畴化。本次研究共提取了12个范畴,分别是:商品属性、平台设计、平台服务、物流服务、信息安全、社交影响、平台活动、平台宣传、消费特征、用户忠诚度、更优观念和价值观念,见表2。
4.2. 主轴编码
扎根理论的第二步是主轴编码。在开放式编码得到的范畴基础上,进一步发现和建立概念类属之间的各种联系,将反弹背后的逻辑进一步深化挖掘,最终归纳形成2个主范畴,如表3所示。
4.3. 选择性编码
扎根理论第三步是选择性编码,其目的是将主轴编码形成的范畴进一步整合和提炼,形成核心整体,概括出拼多多用户体验评价的相关影响因素,如图8所示。

Figure 8. The influencing factor model of the word-of-mouth of Pinduoduo
图8. 拼多多口碑影响因素模型
5. 结论与建议
5.1. 结论
本文主要研究用户对拼多多口碑的影响因素,通过聚类分析,对不同出现频率的词进行关系整理,我们将用户对拼多多的口碑影响因素锁定在四个方面:商品属性、购物流程体验、营销组合和社交因素,参考已经构建的模型,设计半结构问卷。在之后的半结构访谈中,四种因素均得到进一步的检验,且发现社交因素多次在用户访谈中被提及,该因素与拼多多的营销手段有一定程度的关联,除此之外,通过扎根理论,我们进一步挖掘到了平台的服务、用户个人特征等的影响因素,在三级编码后,将所有因素归整为两个层面:用户层面和平台层面,通过访谈数据的分析,进一步完善已经构建的模型。以下我们从两个层面分析和看待拼多多口碑:
5.1.1. 个人层面
感官体验:用户在初次接触某一平台时,页面布局、页面内容和界面设计是用户对其第一印象。用户对于平台的设计更追求舒适和美观,对于页面的内容也应该设计成简单易懂的形式,减少用户的疑惑。
情感体验:用户根据社交影响、平台知名度等产生对平台的情感,由于拼多多前期口碑原因,使得用户对拼多多“敢用不敢言”,同时基于感情因素,用户和平台的联系更密切,基本选择留存。
个人偏好:不同环境下不同的群体有不同的特性,比如购物观、价值观和社会观,这些都将影响用户的行为以及对平台的评价。
5.1.2. 平台层面
商品属性:作为购物平台,商品质量、价格、推荐等基本指标是直接影响商品口碑的重要因素。根据商品的各个属性,用户选择是否购买以及购买后的满意度,进而形成一定的评价。
营销手段:平台为了让利顾客或吸引新用户,一般在平台首页推出各类的活动,这类活动的成功参与度会极大影响着用户对平台的体验效果。
服务保障:购物流程、订单修改、物流服务等体现的平台服务水平,优质的服务会优化用户对平台的印象,轻易上手并且容易操作的平台更吸引流量。
技术保障:平台技术是用户信任感的来源,支付安全性、信息安全性都是平台安全保障构建的重要方面。强大的技术保障才能使用户用的安心,买的放心。
5.2. 建议
从用户层面来讲,重视平台设计以及社交评价。APP的界面设计是用户的第一印象,平台需要进一步优化自身设计;同时,平台需要感知用户需求,满足用户去情感体验,当用户对平台产生好感时,极大可能会选择继续并长期使用;由于前期病毒式营销,用户对拼多多的负面口碑存在一定信任,用户增量达到一定程度的此时,更应该注重社交评价,扭转平台形象;明确目标客户,清晰的客户定位有助于平台的设计以及提升用户好感度。
从平台角层面来讲,构建完整的管理体系。用户渴望得到优质商家的商品和服务,进而正面口碑会大幅上涨。拼多多应对平台的商家加强管理,同时分析其发展现状,转换营销手段并提供更多技术支持,加强用户的信任;加深网络监管政策,对于用户提出的问题能尽快反应,分析其真正的原因并改进。
参考文献