1. 引言
中风,又称脑卒中,是一种具有较高的发病率、病死率、致残率及复发率的全球性疾病 [1] 。中风后失语是一种常见的神经系统损害症状 [2] ,是指患者在意识清醒的状态下,存在“听、说、读、写”各方面的障碍 [3] 。中风后失语无论在中风急性期或是康复期都存在较高的发病率 [4] 。这类患者在与外界交流过程中,因社交能力显著下降而易产生孤独、失望、悲观等情绪。若患者缺乏足够的心理应对能力,往往容易并发抑郁 [5] 。有研究表明 [6] ,中风后合并失语的抑郁发病率比无并发失语发病率高1.5倍。合并抑郁症的中风病人死亡风险则更高 [7] 。因此早期介入治疗中风后失语患者尤为重要。
目前中风后失语常用方案主要是言语及构音训练、针灸等。早在千年前,祖国医学对失语就存在相关描述。而在中医康复临床实践指南–脑卒中早将针灸纳入中风后失语治疗方案中,推荐金津、玉液为主针刺方法改善中风后失语患者症状 [8] 。在中国脑血管病临床管理指南–卒中康复管理中亦是推荐针灸作为治疗失语的有效方式之一 [9] 。
目前已有关于针灸治疗中风后失语有效性的系统评价/Meta分析发表,但尚未有研究整体评价相关系统评价/Meta分析的方法学、报告质量及证据质量,导致系统评价/Meta分析结论的可信度受到质疑。因此,本研究对针灸治疗中风后失语相关的系统评价/Meta分析进行再评价,客观描述其方法学、报告质量及证据质量,以期为针灸治疗中风后失语的临床应用提供参考。
2. 资料与方法
2.1. 纳入与排除标准
2.1.1. 研究类型
国内外发表或未发表的有关针灸治疗中风失语症的系统评价及meta分析。
2.1.2. 研究对象
被明确诊断为中风失语症的患者,不限性别、年龄、种族、病程和国籍。
2.1.3. 干预措施
实验组采用针灸或针灸联合其他疗法进行治疗,针灸包括针刺、温针、头针、耳针、电针、火针、腹针、艾灸、穴位埋线、穴位敷贴等;对照组采用其他积极治疗方法或假针灸进行治疗,如康复疗法、药物疗法(西药、中药、中成药)等。
2.1.4. 结局指标
① (总)有效率;② 阿姆斯特丹–奈梅亨日常语言测试(ANELT);③ 日常生活交际能力(CADL);④ 交际效率指数(CETI);⑤ 功能交际概况(FCP);⑥ 中文功能交际概况;⑦ 不利影响;⑧ 不利事件;⑨ 语言功能;⑩ 口语表达水平评分;⑪ 痊愈率;⑫ 听理解能力评分;⑬ 阅读能力评分;⑭ 书写能力评分;⑮ 日常生活能力评分;⑯ 汉语失语检查法评分;⑰ 基于汉语失语检查法评分标准的理解能力评分、复述能力评分、阅读能力评分、书写能力评分。
2.1.5. 排除标准
① 研究对象诊断不明;② 对照措施使用传统针灸疗法;③ 重复发表文献;④ 与作者联系后仍无法获取全文;⑤ 干预措施中针灸并非主要疗法;⑥ 非随机对照试验;⑦ 非半随机对照试验,⑧ 非中、英文文献;⑨ 单纯质量评价、数据不全或原文不规范的文献。⑩ 系统评价的质量评价或方法学研究的文献。⑪ 临床研究综述;⑫ 不同系统评价在纳入相同的原始研究,且对同1个原始研究的结局指标重复发表时,将其合并为1个。
2.2. 文献检索攻略
计算机检索PubMed、Embase、Web of science、CBM、VIP、WanFang Data和CNKI数据库,搜集针灸治疗中风后失语的系统评价/meta分析,检索时限为建库至2020年10月。此外,追溯纳入文献的参考文献,以补充获得相关文献。英文检索词包括:acupuncture、acupuncture therapy、acupuncture ear、acupuncture points、needle、electro-acupuncture、auricular acupuncture、moxibutions、zhenci、zhenjiu、Dianzhen、scalp-acupuncture、warm acupuncture、acupoints application、acpoint embedding、Apoplectic aphasia、aphasia after apoplexy、aphasia by wind stroke、aphasia due to stroke、apoplexy aphasia、stroke aphasia、systematic reviews、meta-analysis、systematic assessment、systematic evaluation;中文检索词包括:针灸、针刺、电针、腹针、耳针、刺法、灸法、艾灸、毫针、头针、火针、温针、穴位贴敷、穴位埋线、舌针、中风失语、中风失语症、中风后失语、脑中风失语症、脑卒中后失语症、系统评价、meta分析、荟萃分析、系统综述。根据各大数据库的差别,分别采用不同主题词搭配自由词检索,以确保检索结果的完整性和准确性。各大数据库检索策略见附件。
2.3. 文献筛选、资料提取
文献筛选:将检索出的文献导入EndNote,去掉重复的文献后,由两名评价员独立阅读文章的题目、摘要,排除明显不符合纳入标准的研究后,对可能符合纳入标准的研究阅读全文进行筛选,各自完成之后进行交叉核对,若有争议则讨论协商解决。
资料提取:两名评价独立将纳入的系统评价和meta分析相关信息提取至Excel预先设计的表格中,表格信息包括了作者、发表时间、纳入研究数量、样本量、干预措施、结局指标、主要结论、基金支持及质量评价方法等,各自完成之后再行交叉核对,若有争议则讨论协商解决。
2.4. 质量评价
方法学质量评价采用AMSTAR 2量表 [10] ,报告质量评价采用PRISMA声明 [11] ,应用GRADE工具 [12] 对主要结局指标进行证据质量分级。质量评价由两位评价员独立进行,意见不一致时,则讨论协商解决。
AMSTAR 2量表 [10] 将条目2、4、7、9、11、13和15作为影响系统评价制作和其结果效度的关键条目,其余条目作为非关键条目。若≤1个非关键条目不满足,则评价为“高”质量等级;若>1个非关键条目不满足,则评价为“中”质量等级;若1个关键条目不满足,伴或不伴非关键条目不满足,则为“低”质量等级。若>1个关键条目不满足,则评价为“极低”质量等级。
PRISMA声明 [11] 由27个条目组成,评分原则为每个条目完整报告计1分,部分报告计0.5分,未报告计0分,满分27分,≤15分为由相对严重的信息缺陷,15~21分为报告有一定缺陷,21~27分为报告相对完全。
GRADE工具 [12] 评价中,无降级证据为高质量,有1项降级为中质量,2项降级为低质量,3项及以上降级为极低质量。
3. 结果
3.1. 文献筛选流程及结果
初步检索出文献32篇,中国知网6篇,维普数据库2篇,万方数据库4篇,CBM6篇,PubMed 5篇,EMbase 5篇,Web of science 4篇。剔除重复文献后剩余16篇,进一步阅读标题和摘要剩8篇,最后阅读全文筛选剩7篇,最终纳入7篇文献 [13] - [19] 。见图1。

Figure 1. Literature screening flowchart
图1. 文献筛选流程图
3.2. 纳入文献的基本特征
纳入的7篇文献 [13] - [19] 中,中文文献6篇 [13] - [18] ,英文文献1篇 [19] 。其中有4篇文献 [13] [14] [15] [16] 采用的纳入文献标准为RCT或CCT文献,3篇 [17] [18] [19] 采用的纳入文献标准为RCT文献;有5篇文献 [13] [14] [16] [18] [19] 所使用的方法学质量评价工具为Cochrane评价标准,1篇 [17] 为Cochrane评价标准及Jadad量表,1篇 [15] 未提及质量评价工具;7篇文献 [13] - [19] 均未提及安全性分析;5篇文献 [13] [14] [17] [18] [19] 描述了偏倚风险,2篇 [15] [16] 未提及;3篇文献 [16] [17] [19] 提及基金支持,而4篇文献 [13] [14] [15] [18] 则无。具体见表1。

Table 1. Basic characteristics of the literatures included
表1. 纳入文献基本特征
① 痊愈率;② (总)有效率;③ 语言功能评分;④ 口语表达评分;⑤ 听理解能力评分;⑥ 阅读能力评分;⑦ 书写能力评分;⑧ 日常生活能力评分;⑨ 复述能力评分;⑩ 语言障碍严重程度;⑪ 自主发言评分;⑫ 陈述能力评分。
3.3. AMSTAR 2评价结果
有2项研究 [13] [15] 的研究问题和纳入标准未基于PICO原则,在结局指标方面存在缺漏;3项研究 [13] [15] [17] 的研究方案中未提及异质性分析;7项研究 [13] - [19] 均未在纳入文献时说明纳入研究的类型;仅1项研究 [19] 对检索的语言、时间、数据库等给予了详细的表述,同时提及了手动检索及灰色文献检索策略;3项研究 [13] [15] [17] 文献筛选、数据提取不具有重复性,未提及是否有两名人员独立提取、交叉核对及寻求第三方帮助;7项研究 [13] - [19] 均未提供排除研究的清单及排除理由,纳入文献的基本信息不全,仅2项研究 [14] [19] 以流程图形式展现文献筛选过程;1项研究 [15] 为对偏倚风险进行文字或彩图报告;7项研究 [13] - [19] 均未报告纳入各个研究的资助来源;7项研究 [13] - [19] 均对异质性来源进行了合理的解释;7项研究 [13] - [19] 在纳入文献时均纳入了不同质量的RCT,且在进行系统评价时调查每个纳入研究存在的偏倚风险对研究结果的影响;7项研究 [13] - [19] 均对异质性进行详细的解释和讨论;1项研究 [13] 无漏斗图;7项研究 [13] - [19] 均未报告潜在的利益冲突来源。具体见表2。

Table 2. AMSTAR 2 scale evaluation items [Number of articles (%)]
表2. AMSTAR 2量表评价条目[篇数(%)]
3.4. PRISMA评价结果
7项研究 [13] - [19] 均明确了本研究报告是系统综述、Meta分析;7项研究 [13] - [19] 均未提供结构式摘要,其中背景、目的、纳入标准、资料处理等部分信息欠缺,其中1项研究 [19] 提供了注册号;2项研究 [18] [19] 提及了本研究是否为新研究或是更新研究;仅1项研究 [18] 按照PICOS原则提出所需要解决的清晰明确的研究问题;2项研究 [13] [15] 在方法中提及的纳入标准在PICOS、发表情况等方面均有不同程度的信息残缺;1项研究 [15] 为提及手工检索及灰色文献检索;仅1项研究 [14] 直接了当地叙述了至少一个主要数据库的资料检索方法,其余6项研究 [13] [15] [16] [17] [18] [19] 针对检索条件阐述模糊,不可使检索结果重现;3项研究 [15] [17] [18] 未提及研究被选择的过程(包括初筛、合格性鉴定、纳入系统评价的步骤、Meta分析过程等);1项研究 [14] 详细描述了资料提取方法(如预提取、独立提取、重复提取及任何求证过程);7项研究 [13] - [19] 均未完整报告资料条目,其中2项研究 [14] [15] 未报告资金来源;2项研究 [17] [18] 完整报告了评价单个研究存在偏倚的方法;7项研究 [13] - [19] 全部概括了效应指标;7项研究 [13] - [19] 均报了异质性检验的方法;3项研究 [15] [16] [17] 未提及选择性报告偏倚,1项研究 [13] 未详细报告用来研究可能偏倚的所有办法;6项研究 [13] [14] [16] [17] [18] [19] 进行了敏感性分析,其中1项研究 [19] 进行了亚组分析;3项研究 [13] [15] [16] 未提供文献筛选流程图;7项研究 [13] - [19] 均未完整报告每一个被提取资料的文献特征;2项研究 [15] [16] 未提供可直观评价偏倚风险结果的表格或图形;7项 [13] - [19] 单个研究结果均有森林图;7项研究 [13] - [19] 结果综合均提及了异质性检验;2项研究 [15] [17] 未详细报告研究偏倚具体结果;2项研究 [15] [18] 无其他敏感性分析或亚组分析;2项研究 [15] [18] 较为完整的总结主要发现,并分析其主要利益相关性;除1项研究 [17] ,其余6项研究 [13] [14] [15] [16] [18] [19] 较为完整的讨论研究层面、结局层面、系统综述的局限性;7项研究 [13] - [19] 均对结果进行了概要性解析,并提出对未来研究的提示;4项研究 [13] [14] [15] [18] 未提及资金来源。具体见表3。

Table 3. PRISMA evaluation items [Number of articles (%)]
表3. PRISMA评价条目[篇数(%)]
3.5. GRADE证据等级评价结果
应用GRADE系统对纳入研究结局指标的证据质量进行评价分级,结果见表4。其中,张勇等的研究 [16] 关于口语表达能力评分及日常生活能力评分仅进行描述性分析,为提供完整数据,故该两项排除。纳入的7篇文献 [13] - [19] 共纳入48个结局指标,其中有效率(痊愈率、总有效率、临床有效率)为12个,语言功能评分(语言能力)为6个,理解能力评分(听力理解能力评分)为5个,阅读能力评分为5个,书写能力评分为5个,复述能力评分为5个,口语表达水平(口语水平)为2个,自主发言为3个,语言障碍严重程度为3个,陈述能力评分为2个。指标有效率(痊愈率、总有效率、临床有效率)中的中等质量证据4个、低质量证据7个、极低质量证据1个;语言功能评分(语言能力)中的低质量证据2个、极低质量证据4个;理解能力评分(听力理解能力评分)中的极低质量证据5个;阅读能力评分中的低质量证据1个、极低质量证据4个;书写能力评分中的低质量证据4个、极低质量证据1个;复述能力评分中的低质量证据2个、极低质量证据3个;口语表达水平(口语水平)极低质量证据1个;自主发言中的低质量证据1个、极低质量证据2个;语言障碍严重程度中的低质量证据1个、极低质量证据2个;陈述能力评分中极低质量证据2个。

Table 4. GRADE evidence rating table
表4. GRADE证据等级评价表
① 纳入研究在随机、分配隐藏和盲法等方面不清楚或存在较大局限性;② 纳入研究异质性较高,合并后I2值较大;③ 纳入研究样本量小,可信区间较宽;④ 纳入研究存在发表偏倚。
4. 讨论
本研究共纳入了7篇针灸治疗中风后失语的系统评价或Meta分析 [13] - [19] ,所有纳入的研究主要发表在2010~2019年间,提示近年来运用针灸治疗中风后失语的研究越来越得到重视。而尽管很多研究显示针灸治疗中风后失语的疗效较好,副作用少,且报告的大部分结局指标均有统计学意义。但由于中医理论的特殊性,如辩证施治、同病异治、异病同治等,以及循证医学的意识形态尚未与中医临床充分融合,临床医生借用经验医学的概率远高于循证医学的证据,中医理论与循证医学之间仍处于磨合阶段 [20] ,不可避免地使得不少实验设计不严谨,导致这些系统评价或Meta分析的整体质量偏低。
AMSTAR 2方法学质量评价显示,7项研究 [13] - [19] 均属于极低质量,即均存在1项以上的关键条目未完全满足。除此之外,全部研究均未详细说明纳入研究的类型、未排除研究清单以及排除理由、未报告系统评价纳入研究的基金资助信息以及未在执行Meta分析时评价单个研究偏倚风险对Meta分析结果的影响;大部分研究未说明全面的检索策略、未详细描述纳入研究的基本信息以及未报告潜在的利益冲突来源。但值得肯定的是,全部研究在执行Meta分析时结果合成的统计学分析方法合适、在解释和讨论系统评价的结果时考虑了单个研究的偏倚风险以及对存在的异质性进行了满意的解释和讨论。
PRISMA量表评价显示,7项研究 [13] - [19] 质量较低。条目5、10、11、27存在较大缺陷,部分存在问题与AMSTAR 2量表存在的问题相同。大部分研究未详细报告结构式摘要、理论基础、目的以及方案和注册,检索不全面,资料提取和资料条目不详细,单个研究存在的偏倚中描述评估偏倚方法不完全,证据总结未分析利益相关,研究特征中均未报告随访时间。
GRADE证据等级评价结果显示,7项研究 [13] - [19] 中大部分证据质量为低级别和极低级别,表明其真实疗效可能与估计疗效有很大差别,尚不能为临床及决策制定者提供可靠的依据。降级的最主要原因是纳入研究在随机、分配隐藏和盲法等方面存在较多缺陷,报告不清楚。而纳入研究存在发表偏倚也是造成低质量和极低质量的主要原因,其主要表现为漏斗图不对称。而有4个结局指标为中等质量,均为有效率,表明针灸治疗中风后失语疗效不错,但由于质量不高,以上证据仅供一定程度参考,并不完全可靠。
本研究也存在一定的局限性:1) 本研究仅进行中文与英文数据库的检索,并未对纸质文献与灰色文献进行检索,存在偏倚风险;2) 本研究纳入的研究中仅有1项进行了系统评价的注册,使得本文严谨性受影响;3) 本研究采用的AMSTAR 2量表、PRISMA、GRADE证据等级评价,其评价条目均为人工打评,尽管有2个研究人员进行独立的评价再进行综合,但依旧会因存在一定的主观性而产生偏倚;4) 无法得知纳入文献中的研究人群种族、地域、宗教信仰等因素是否会影响结果。
综上所述,目前针灸治疗中风后失语的系统评价与Meta分析研究结论的证据质量较低 [21] ,临床工作者在使用这些证据时应结合具体情况应用。而今后的中医药研究中对于系统评价的撰写应提前进行注册工作,并积极按照AMSTAR 2量表、PRISMA量表和GRADE指南规范自己的研究,进而提供更高质量的证据。
基金项目
广东省科技创新战略专项资金(“攀登计划”专项资金)资助项目(编号:pdjh2020b0136)。
NOTES
*通讯作者。