1. 引言
发展性协调障碍(Developmental Coordination Disorder, DCD)一般被定义为“动作协调能力发展上的明显损伤,影响个体日常生活和学业表现,无法用一般的智力迟缓或任何先天/后天神经紊乱进行解释” (Henderson, Sugden, & Barnett, 2007)。作为儿童期常见的发育障碍,发展性协调障碍不但严重影响着儿童的日常生活(Barnhart, Davenport, Epps, & Nordquist, 2003),给儿童本身带来一系列问题,还会为儿童家庭带来困扰,增加母亲的育儿压力(Takahashi et al., 2017)。因此,对发展性协调障碍儿童进行早期诊断,有利于儿童的正常发展。
儿童动作发展与障碍测查技术的发展与各个理论流派的发展紧密相关。作为很长时间内的主流理论观点,标准功能性技能(Normative Functional Skill)理论认为动作是标准化、功能性的习得技能,有年龄标准和发展里程碑,因而支持了各类标准化工具的开发,强调各年龄段儿童在动作发展的具体方面存在一个确定的标准水平,而选取典型性的操作任务,即可根据儿童在这个具体任务上的表现与“常模”的比较,衡量其是否达到相应的标准水平。
动力学系统(Dynamic System)理论认为动作的完成有赖于知觉系统与动作系统之间的动力学协调,即知觉系统感知到环境信息以后,和动作系统之间产生直接的关联(Newell, 1986; Thelen, 2000; Newell & Vaillancourt, 2001)。而该理论的发展,使得研究者越来越重视日常生活活动(Activities of Daily Living, ADL)情境下儿童动作的具体表现,催生了一种摒弃“标准化”动作发展阶段描述和典型性任务的技术取向。一方面,促进了研究者开发基于日常生活活动的核查表或问卷,方便家长等知情人据此对儿童个体的动作表现做个性化的观察;另一方面,有经验的专家甚至通过儿童动作的行为观察、视频图像分析、动作捕捉等技术进行个案分析,不再基于某种确定的工具开展工作。
2. 常用评估工具的分类及举例
截至目前,专门用于动作发展及障碍筛查的工具,可以大致划分为标准化操作测验(test)、核查表(checklist)或问卷(questionnaire)两大类。
2.1. 标准化操作测验
标准化操作测验的测查任务偏向客观可信可测量,往往配有常模。最早使用标准化任务由儿童实操的动作评估工具是1923年Oseretsky在俄国发表的奥氏运动能力测验(Oseretsky Test of Motor Proficiency) (Hattie & Edwards, 1987)。该测验最初包含85个项目,采用二分法计分,且提供类似智力测验的一个儿童动作发展分年龄的常模,并按照儿童低于年龄常模的程度划分了4层“动作迟滞”的水平。然而,奥氏运动能力测验包含的项目过多,测查时间长,在测查过程和计分方式上还不够标准化,因此其信效度也值得商榷。但奥氏运动能力测验奠定了日后各类动作评估工具的雏形,即通过言语指导和示范,让儿童完成操作性的任务,记录成绩信息并打分。
随后,奥氏运动能力测验不断完善,Stott等做了修订修改,不断演变为布鲁因宁克斯—奥泽利特斯基动作熟练度测验(Bruininks-Osteretsky Test of Motor Proficiency, BOTMP) (Bruininks, 1978),目前的通行版本为第二版(Bruininks-Oseretsky Test of Motor Proficiency 2nd edition, BOT-2) (Bruininks & Bruininks, 2005),测评内容包括手部精细控制、手部协调、身体协调、力量和灵活性四个方面,适用年龄为4~21岁。完整版的BOT-2分为8个分测验,包括53个项目,包含定性观察内容,需要40~60分钟完成;简版BOT-2包括14个项目,15~20分钟即可完成测验。BOT-2是一个常模参照测验,需要将原始分转换为平均数为50、标准差为10的标准分,并根据标准分高低划分不同的等级水平。
Henderson在Stott工作的基础上,出版了运动损伤测评(Test of Motor Impairment, TOMI) (Stott, Moyes & Henderson, 1984; Slaton & Nichols, 1988)。TOMI涉及的测查内容较前有所删减集中,集中为粗大动作和精细动作两大类项目。TOMI后续发展,即成为儿童动作评估成套工具(Movement Assessment Battery for Children, MABC)的标准化测试部分。
麦卡伦神经肌肉发育评估(McCarron Assessment of Neuromuscular Development, MAND)可以评估儿童的精细动作和粗大动作、筛选早期发展问题,适用年龄为3.5岁到青年。共有10个项目,其中5个为精细动作内容,5个为粗大动作内容,需要20分钟完成。MAND是常模参照测验,其中3.5~12岁每半岁一个常模,12~16岁每整岁一个常模。可以根据神经发育指数或标准分划分不同的等级。
塔夫茨运动表现评估(Tufts Assessment of Motor Performance, TAMP)同样为标准化测评,其前身为1988年Gans等人发表的标准参照测验。主要目的是描述功能运动表现状态,协助制定治疗计划,记录干预后有意义的运动技能临床变化。TAMP为标准参照测验,包含32个项目,主要为基本自理技能的测查。完成需要45~60分钟。可计算百分等级和累计比例。
2.2. 核查表和问卷
这类工具主要通过儿童在日常生活活动情境中的动作技能及其表现进行评定。代表性工具是Keogh及其同事开发的加州大学洛杉矶分校(UCLA)核查表(Reynard, 1975; Sugden, 1972)。作为体育教学领域专家,Keogh和Sugden最初开发出了一套教师核查表,旨在提醒教师注意到儿童存在的动作困难,并在评估针对这些困难的教学效果时作为基线。这类核查表工具将课堂和操场情境下儿童可能进行的动作逐一进行了罗列,供教师回答判断儿童的动作发展情况。随着时间的推移,这一核查表发展出基于行动者-环境关系的动作分类,将个体根据自身和环境的状况采取的任何行为都纳入考量。例如,个体状况可以划分为静态和动态,个体做出动作的环境状况也可以划分为静态/可预测的状况和动态/变化的状况。该工具也考察可能对儿童动作产生负面影响的因素,这和Stott、Henderson及其同事为TOMI开发的一些问卷内容非常类似(Sugden, 1972; Reynard, 1975)。
虽然已证明UCLA核查表是有价值的工具,但随着时间的推移,Sugden和他的团队发现其作为制定干预方案的依据时在动作运动维度的有效性上仍显不足。为了弥补这个问题,他们认为有必要把上述项目做些归类,以便教师作答并为具有类似特征的任务安排干预。Sugden和Sugden (1991)转而考虑将Gentile (1972)、Higgins (1972)和Spaeth-Arnold (1981)的工作作为一种解决方案,发展出基于行动者–环境关系的动作分类方法。在这个框架下,将核查表中的运动维度项目划分为四个维度。维度1是儿童静态–环境静态的活动,其任务包括儿童自己控制时间节奏做出动作;维度2是儿童动态–环境静态的活动,包括移动家具,走去提起一件静止的物品等等;维度3是儿童静态–环境动态的活动,在其任务中要求儿童静止,但要在一个动态环境中做出反应;维度4是儿童动态–环境动态的活动,儿童不仅仅要对动态环境做出反应,还要控制其自身的身体动作。
发展性协调障碍问卷(Developmental Coordination Disorder Questionnaire, DCDQ) (Wilson et al., 2000)的开发理念与之相类似,其特点是家长或教师可以很方便地进行主观填答。它描述的基本上都是儿童日常生活中所需要的运动技能及表现,需要评分者根据儿童实际情况进行判定。随着儿童的成长和发展,其协调能力可能每年都有变化。因此,在进行评定的时候,需要参考同龄儿童的表现,进行比较,以得出更客观的评定结果(Wilson et al., 2009)。
2.3. 儿童动作发展评估工具的对比分析
目前常用的儿童动作发展评估工具往往存在共同的问题,如无较新的修订版本、操作复杂、常模缺乏跨文化代表性等等(Hands, Licari, & Piek, 2015)。表1从上述各方面对主要工具进行对比分析:

Table 1. Comparison of advantages and disadvantages of movement assessment tools
表1. 动作评估工具的优缺点比较
3. 儿童动作评估成套工具(MABC)的发展与技术分析
在上述各类常用评估工具中,MABC综合了测评与检核表两种形式,在各方面综合比较下具有一定优势。首先,儿童动作评估成套工具在操作上相对简单,儿童接受一对一测查的时间较短,儿童能够保持一定的兴趣、较易配合;其次,儿童动作评估成套工具的最新版(MABC-2)是修订时间最新的,也有相对比较广泛的应用与研究;此外,儿童动作评估成套工具在记分规则、算法等方面的研究和讨论也更多。综合而言,这套工具是目前相对最好、最适用的儿童动作发展测试工具。
3.1. MABC-2的发展概述
1992年,Henderson和Sugden将动作发展的测评部分和核查表部分合成为一个工具包(Henderson & Sugden, 1992),儿童动作评估成套工具第一版由此诞生。这一结合使得他们可以对个体儿童的运动能力得出完整的测查结果,既包括在安静的一对一环境下的客观表现分数,也包括在复杂学校环境下的衍生观察结果。MABC的标准化测评包括一系列需要儿童完成的精细和粗大动作任务,这些任务共分为三类:手部灵活性、定位与抓取、平衡性。核查表要求成人(通常是父母、抚养者或教师)在30道题目的量表上对儿童的运动能力进行评定。在MABC的初期版本中,每八个项目为一组,用于不同年龄段的测查。其中,年龄段1覆盖4~6岁,年龄段2覆盖7~8岁,年龄段3覆盖9~10岁,年龄段4覆盖11~12岁。
与Henderson在儿童动作发展领域共事多年之后,Barnett在2005年出任项目总监,主管MABC项目的修订与标准化(Henderson, Sugden, & Barnett, 2007)。Barnett和Henderson一起与统计学专家Rust合作,启动对MABC的修订项目,并于2007年出版了修订后的MABC-2。与MABC第一版相比,MABC-2中标准化测评的结构主要有两个变更:一方面扩展了测评的适用年龄,另一方面将年龄段由4段减少到3段。对其中的个别测查项目也做了调整。最终MABC-2的适用年龄扩展到了3到16岁。其中,3~4岁的儿童提供6个月常模,其他年龄段提供年段常模,划分为三个年龄段,年龄段1覆盖3~6岁,年龄段2覆盖7~10岁,年龄段3覆盖11~16岁。
3.2. MABC的计分体系与常模
自1992年以来,MABC手册已有欧洲六种语言的译本,并因研究需要翻译成更多语言。MABC-2标准化测评将适用年龄扩展到3~16岁,工具划分为3~6岁、7~10岁和11~16岁三个年龄段版本,对每项任务、维度和总分,提供标准转换常模,其转换后的标准分是均值为10,标准差为3的标准分,分数范围为1~19。其中3~4岁每半岁提供一个常模,5~16岁每整岁提供一个常模。在使用时,用儿童的出生年月日和测评日期,计算儿童的实足年龄,再根据儿童年龄查询对应标准分转换表,确定对应的标准分。每个年龄组内,都提供8项测评内容的标准分转换(涉及到左右手和左右脚的项目分别提供转换常模)。转换完成后,在根据各个项目所属维度计算出维度分与测评总分,同样可以转换为1~19的标准分,同时提供该标准分对应的百分位数。MABC及MABC-2同时提供分年龄组的常模,并配置“红绿灯”体系,采用标准参照的划定分数线,划定了发展性协调障碍(“红色”)、疑似发展性协调障碍(“黄色”)、动作发展正常(“绿色”)等三个等级类别;上述分数线既有确定的百分位数标准,亦有对应的标准分数与观测值数值。由于性别差异的效应尚不够充分,还没有建立性别常模(Chow, Henderson, & Barnett, 2001)。
在常模转换过程中,涉及到观测值–标准分–百分位数三者的相互关系问题。MABC的常模划定理念基本与“利兹共识声明”(Sugden, 2006)相一致;经过对常模样本实际观测值分布状况的分析,确定发展性协调障碍儿童在具体任务上表现的临界值,接近于百分位数5%的位置,因此人为规定了5%、15%为“红色”、“黄色”等级的标准参照界限。这一划分办法得到了一定的认可(Henderson & Barnett, 1998; Smits-Engelsman, Fiers, Henderson, & Henderson, 2008)。
3.3. MABC的工具质量
MABC-2的标准化测评和核查表均有良好的信效度,是可靠的评估工具(Henderson, Sugden, & Barnett, 2007)。不同国家和地区的相关研究都表明该评估工具的有效性,Ellinoudis等人(2011)对希腊183名3~5岁儿童进行标准化测评施测,发现年龄段1中,手部灵活性、定位与抓取、平衡性三部分的Cronbach α系数分别为0.51、0.70、0.66,测评项目之间及与总分都存在中等程度相关。验证性因素分析表明,MABC-2标准化测评和模型拟合程度较高,具有良好的结构。由此可见,MABC-2的标准化测评是评估3~5岁儿童运动困难的有效工具。
Smits-Engelsman、Niemeijer和Waelvelde (2011)使用MABC-2的标准化测评对50名3岁儿童施测,结果发现,两周左右的重测信度为0.76 (两次主试不同)到0.94 (两次主试相同)。对儿童进行“正常”和“具有运动障碍”的判断方面,重测信度表现良好(0.71和0.81)。与Chow等人(2001)的研究结果(从0.69~0.92,均值为0.79)类似。
台湾的一项研究(Wuang, Su, & Su, 2012)表明,MABC-2标准化测评的内部一致性信度非常好(Cronbach α系数为0.90),三个分维度的α系数分别为0.81、0.84和0.88;重测信度良好,组内相关系数为0.97,结构方程模型结果表明该工具结构良好,是评估儿童发展协调障碍患者运动能力的有效工具。
我国大陆地区也对MABC-2标准化测评进行了研究,如柯李(2019)在中国大陆对2185名3~10岁中国城市儿童进行施测,发现MABC-2标准化测评的Cronbach α系数为0.58,评分者信度系数为0.99,两周后重测信度为0.86;验证性因素分析结果表明,测评的χ2/df值为5.28,CFI (comparative fit index)和TLI (Tucker-Lewis index)均为0.9左右,RMSEA (root mean square error of approximation)值小于0.05,数据表明模型拟合程度良好,支持MABC-2各项目维度的划分。在花静(2011)的研究中,将MABC-2和DCDQ的ROC曲线进行比较,显示控制或未控制年龄、性别和Kaup值后的MABC和修订MABC的诊断价值较高,均明显优于DCDQ。
3.4. MABC的适用性
在标准化测评任务项目的选取方面,MABC和MABC-2的考量也具有一定代表性。一些项目虽然具有很好的区分度,但由于其难于操作,往往不能纳入标准化测验,例如,使用刀叉或扣纽扣这些任务对于很多有动作困难的儿童而言很难习得(Henderson, Sugden, & Barnett, 2007)。这些项目常常可以包含在一些观察核查表中,例如MABC核查表和DCDQ中,熟悉儿童的成人可以很容易地完成评估。MABC和MABC-2选择任务时更多采用了类似实验室情境下的标准化任务,必须尽可能做到:① 医疗卫生或教育领域专业人士可以用标准化的方式组织实施测查;② 使用的设备工具简单而标准化,容易组装、便于携带,对儿童有吸引力;③ 评分简单、客观、可信;④ 对男生和女生都适用;⑤ 对不同文化背景都适用。Hua、Gu、Meng和Wu (2013)一项关于MABC-2在中国大陆3~6岁儿童的适用性研究中发现,对中国大陆儿童使用该工具可能需要一些调整,该结论也需要进一步验证。Ke等人(2020)进行了中英对比,认为建立中国常模有其必要性。
4. 总结
发展性协调障碍是儿童期常见的发育障碍,给儿童及其家庭带来极大的困扰,根据需要选择适当的测评工具,对发展性协调障碍的早发现早干预有着重要意义。MABC-2作为应用较广的动作发展测评工具,其信效度较高,是目前较合适的发展性协调障碍测查工具。
NOTES
*第一作者。
#通讯作者。