1. 引言
变量之间相关程度的度量,在参数统计中最常用的是Pearson矩相关系数。在非参数统计 [1] 中,Spearman秩相关系数和Kendall-τ相关系数是常用的方法。但是它们只适用于两个变量的情形,在实际中常常需要处理多个变量之间的相关性,或多个评价的一致性,如凭手感评定毛织物的紧密程度,评论员的检验结果是否一致 [2]。对这类问题,可采用Kendall协和系数(Kendall’s coefficient of concordance) [3] 来解决。Kendall协和系数也称为Kendall W系数,由M.G. Kendall和B. Babington Smith于1939年引入,用于检验多个变量之间的相关性。它以多变量秩和检验为基础,主要用于双因素设计或区组设计问题的检验。在非参数统计教学中学生常常对Kendall协和系数的理解存在困难,本文旨在提供一种简洁易懂的方法,帮助学生加强理解。
2. Kendall协和系数的基本原理
由于一致性检验问题常可以转化成区组问题,如裁判的评分是否一致,每个裁判即可看成一个区组,因此检验一致性也可理解成检验区组之间有无差异。为此我们引入区组设计的一些相关概念。设有b个区组,k个处理,第
个区组内的k个观测值分别为
,其分布函数为
。要检验处理之间有无差异,原假设和备择假设分别为
,
不全相等。
其中
为第i个处理的位置参数。当然,若处理间有某种趋势时,如上升趋势,备择假设为
。
为了解决这一问题,在非参数统计中,我们先要对同一区组内的观测值由小到大进行排序,再求出观测值的秩在同一处理内的平均。如表1所示。

Table 1. The case of k treatments and b blocks
表1. k个处理b个区组的情况
为第i个处理第j个区组内的观测值
在区组j内的排序,当同一区组内有相同的观测值(即有结)时,此时要对秩取平均。
为第i个处理的秩和,
为第i个处理的秩平均。
其次,计算处理间的方差
,再计算同一处理内的方差
以及总方差
。特别强调的是,此处组间的方差是处理间的方差,组内的方差为同一处理内的方差。
我们将对总方差(SST)进行分解,得到SST = SSB + SSE,当同一区组内没有相同的观测值时,总方差
, (1)
为常数。若处理间的方差SSB增大,处理内的方差SSE会减小。当处理内的方差SSE减小到一定程度时,即可认为评论员对同一处理的打分具有一致性,显然,此时处理间的方差足够大。可借用Friedman所提出的Friedman检验统计量 [2],即
(2)
来判断原假设是否成立。当Q比较大时,拒绝原假设,认为
不全相等。由以上的分析我们知道,拒绝原假设时,处理间的方差足够大,意味着处理内的方差足够小,即评论员的打分一致,所以在一致性检验中,原假设和备择假设转变为
:评价不一致;
:评价具有一致性。
这是在教学中学生最容易混淆的。类似于相关系数的值规范在[−1, 1]之间,我们也对Q进行规范,将(1)和(2)带入下列式子中,得到
,(3)
即为M.G. Kendall和B. Babington Smith提出的Kendall协和系数。W的取值范围为[0, 1],越接近1说明相关性越大,评价越一致,在实际中我们可以借助软件计算p值,也可以直接采用SPSS进行判断。
3. 案例分析
案例:请6位电影评家对4部电影打分,评分结果见表2:试问三个评家的评价结果是否具有一致性?
。

Table 2. The scores by the 6 film critics
表2. 6个影评家的评分结果
此时,区组为影评家,处理为电影,参数k = 4, b = 6。检验步骤为:
1) 原假设H0:看法不一致;备择假设H1:看法一致,
2) 用kenddal-W检验计算Q = 12*SSB/4 * 5 = 8.4,或W = 8.4/6 * 3 = 0.467,
3) 查Friedman检验统计量表,k = 4, b = 6得到
时的临界值为7.6,或计算
,
4) 拒绝原假设,认为看法一致。
采用SPSS进行操作,步骤如下:
1) 输入变量为电影1,电影2,电影3,电影4,
2) 接下来在个案中录入各影评家的评分,共6行,
3) 统计–非参数检验–k个相关样本–检验变量–检验类型:kendall W检验,
结果见表3,与手算结果一致。
a. Kendall协同系数。
4. 总结
本文针对学生在课堂上对Kendall协和系数理解较为困难,从方差分析的角度解释Kendall协和系数,帮助学生理解Kendall协和系数的来源,由此知道为何看法一致放在备择假设中。并从实例出发,帮助学生解答有关一致性检验的问题。
基金项目
本项目由国家自然科学基金(基金号:11961035,11661076)支持。