1. 引言
阅读障碍是最常见的学习障碍之一,其发生率高达5%~10%。患者在智力正常并获得同等教育机会的情况下,表现出词汇识别准确性低、不流畅以及拼写能力低下,阅读水平显著低于同龄儿童[1]。阅读理解,被定义为通过阅读文本来获取信息的能力,对于学生在教育环境中取得成功至关重要,因为任何学习领域都需要大量的阅读[2]。对于有阅读障碍的学生来说,阅读理解往往是困难的,阅读障碍的主要原因之一是难以读懂书面文本,不准确和缓慢的词汇阅读和句子阅读,使理解文本变得有挑战性,这对阅读理解产生了直接的负面影响,降低了词汇阅读的准确性和速度。对于阅读障碍,目前尚无完全克服的方法,但是可以通过教育手段及干预训练将其影响降低。
阅读障碍是一种神经生物发育障碍,尽管有潜在的教育机会,阅读障碍学生在阅读及如解码、流利度方面存在着严重缺陷,而且一些学生对于适当的训练和干预没有反应[3]。一个有效的策略是在教育教学中使用辅助技术,以帮助阅读障碍学生发挥潜能,弥补阅读能力的缺陷。Emily等人(2021)的一项研究,报告了使用辅助技术最多的残疾群体依次是聋、盲学生(74%)、视力障碍学生(71.4%)、身体残疾学生(46.5%),其次是阅读障碍学生,该群体使用辅助技术的比例达到了19.2% [4]。
呈现阅读材料的方式除了传统的纸张形式,也有口头呈现的方式。口头呈现的形式,如文本转语音、阅读笔、有声读物等,可以免除对阅读材料进行解码的需要,因此可能帮助阅读障碍学生更好地理解书面文本。然而文本转语音技术工具的使用,对于阅读障碍学生阅读理解能力的提升是否真正有帮助还不确定。阅读障碍学生使用文本转语音及相关朗读工具的一些研究,报告了阅读障碍学生阅读能力的提高,而另一些研究则未得出一致的结论[5]。由于这些不一致的结论,本研究将回顾国内外相关文献,目的是分析文本转语音及相关朗读工具的使用对阅读障碍学生阅读能力的影响。
2. 文本转语音技术及相关朗读工具的应用
2.1. 文本转语音及相关朗读工具的概述
2.1.1. 文本转语音概念及工作原理
文本转语音(text-to-speech, TTS)系统是将一般语言的文字转换为语音,将储存于电脑中的文件或者网页,转换成自然语音输出的语音合成应用[6]。文本转语音系统可以提供替代性的学习参与方式,从而减少文字阅读的阻碍,实现用听觉信息替代视觉信息的功能,以可调整的方式呈现信息(如突出显示,音量调节等),帮助人们学习和表达。文本转语音为学生提供了文本的同步视觉和听觉表示,可以适用于各种学习者,包括有特殊教育需要的学生(如,阅读障碍者)。大多数文本转语音工具允许使用者调整速度和音量,有些应用程序还能突出显示正在读的句子或特定词汇。不喜欢听别人说话的学生可以选择关闭音量。跟随口语或高亮显示的文本都可以让学生在不丢失位置的情况下阅读文本。
文本转语音工具可以朗读出现在屏幕上的词汇,并已成为有阅读障碍学生的公认辅助工具[7]。Meyer和Bouck (2014)进行的一项研究发现,有阅读障碍的中学生喜欢使用文本转语音的程序来阅读本年级水平的说明文。学生们觉得阅读花的时间更少,而且当他们使用文本转语音时,他们更流利,理解了更多的材料。总体而言,在课堂环境中使用文本转语音越来越多地被用作向残疾学生提供口头便利的一种手段。
现代技术已经将文本转语音内置到设备中(例如,笔记本电脑,平板电脑,智能手机等),或者在设备上安装专门的工具来实现文本转语音,以供阅读障碍学生使用。文本转语音工具的工作原理是将出现在计算机屏幕上的文本翻译成计算机化的语音[8]。计算机化的语音是通过将文本与预先编程的发音规则相匹配而产生的。文本可以直接输入到语音合成程序中,或输入到与文本转语音工具兼容的其他文字处理程序中,也可以使用扫描仪和光学字符识别工具输入文本。学生可以实现工具选取特定词汇的朗读,或整行、整个文本,即时语音反馈允许学生通过点击不认识的词汇来纠正他们的阅读错误,以便听到词汇的正确发音。文本转语音工具的使用减少了有阅读障碍的学生对不能准确解码的挫败感,更有利于其完整地理解文本[9]。
2.1.2. 针对阅读障碍学生常见的文本转语音工具
文本转语音技术是一种语音合成技术,文本转语音工具的朗读功能是即时合成语音,而不同于传统有声读物的语音提前录制。研究表明,单词识别在阅读理解中起着关键作用,有阅读障碍的学生在解码单词方面存在问题。当阅读中出现错误时,学生从文本中获得的信息不完整,对信息加工和理解产生不利影响,从而影响阅读理解能力[10]。为减少阅读障碍学生在字词解码上的困难,文本转语音及相关朗读工具被大量应用于教学实际当中,该类型工具可以使使用者同时使用“看”和“听”两种感官进行阅读,以加深学生对于文本信息的获取和意义的理解[6]。Schneps等人(2019)的研究证明,使用“文本转语音”技术可以有效提高学生的阅读速度[11]。
本研究通过对国内外相关研究的归纳和总结,列出以下针对阅读障碍学生的文本转语音工具的典型代表:ClaroPDF、TTSMaker、TextGrabber、Natural Reader、Voice Dream Reader、Balabolka、Read Aloud、Spoken Content、TextAloud、ReadPlease、Dyslexia APP、TXT文本听书、乐朗乐读、文字转语音助手等。这类工具除了文本转语音的功能,还可以选择多种音色、控制朗读速度,并自动对于正在朗读的内容添加高亮等视觉增强效果。例如ClaroPDF可以朗读PDF文件,有四种不同的音色可以选择。Natural Reader合成的语音非常自然,朗读效果较好,并且支持英文。Voice Dream Reader可以大声朗读文章、文档和书籍,支持很多种语言,使用者可以选择不同的音色和朗读速度。
2.2. 对阅读障碍学生的干预研究与补偿研究
文本转语音和技术在教育中的使用开始于20世纪80年代,随着科技的不断进步,从业者和教育研究人员已经开始使用文本转语音和相关工具来帮助有阅读障碍的学生。文本转语音及相关朗读工具在干预研究和补偿研究中都有使用[12]。
对阅读障碍学生的干预研究,旨在提高学生独立于技术之外的阅读能力。很多学者对阅读障碍学生的认知缺陷做了研究与干预。在认知语言学层次,主要从语音意识、语素意识、正字法、快速命名等方面开展研究与干预,这几个方面的结果可以预测儿童的阅读能力和水平[13]。从非语言学层次的认知缺陷来看,研究主要聚焦在视觉加工缺陷、听觉加工缺陷、注意缺陷和记忆缺陷等方面[14]。与此相反,补偿性学习试图为学生提供一种辅助工具来帮助他们进行阅读。以干预为导向的研究,使用文本转语音工具来提高无辅助阅读技能,而以补偿为导向的研究,使用文本转语音工具来补偿词汇水平的技能缺陷并获得书面材料。但通常不清楚如何判断干预何时失败,以及学生应该什么时候开始使用补偿[15]。
教育工作者希望最大程度提高阅读障碍学生的阅读技能,但并不是每位学生都能熟练地掌握阅读技能。一些有阅读障碍的学生在解码方面相对准确,但阅读速度很慢,可能无法跟上阅读任务。文本转语音工具可以使学生阅读超出其基本词汇阅读水平的材料,同时符合他们的兴趣和听力理解能力[16]。补偿性学习的目的是帮助阅读障碍学生获取文本,阅读障碍学生存在解码缺陷,那么减少或免除解码要求应能提高阅读理解能力[17]。如通过大声朗读文本材料给学生听,从而帮助学生理解。一些教育者担心学生使用文本转语音工具将无法练习重要的阅读技能,但一些研究表明,使用该工具不仅具有辅助作用,而且还提供了补偿作用。当有词汇识别问题的学生在电脑上阅读故事时使用文本转语音工具时,他们的解码和词汇识别技能显著提高[18]。
3. 文本转语音工具对阅读障碍学生阅读理解能力影响的相关研究
3.1. 文本转语音工具对提高阅读障碍学生的阅读理解无明显作用
Horney等人(1996)发现,高年级段的小学生(五年级和六年级)比低年级段的小学生更能成功地使用文本转语音工具,这可能是因为年纪较小的学生需要更多使用文本转语音工具的经验,才能充分利用它所能提供的好处。因此,文本转语音工具使用的效果随着学生年龄和课程质量的不同而不同[19]。三个年级学生的单词理解和段落理解测试中的得分的统计分析需要谨慎考虑,由于学生在三个年级上的年龄分布不等,阅读成绩平均分数的差异可能更多地反映了学生的年级水平,而不是学生的阅读能力的相对提升。
Li (2014)的研究关注两个问题,一是残疾和非残疾学生朗读工具对阅读评估的影响;二是哪些因素会影响朗读工具的使用的差异。通过调节因子(例如,残疾状态和内容区域)进行探索,并利用分层线性模型比较影响的大小[20]。具有广泛的纳入标准,例如包括准实验和实验研究以及已发表和未发表的研究,使得调节分析成为可能。结果显示,与阅读评估相比,无论学生的残疾状况如何,朗读工具的应用对数学阅读的影响较小。此外,与非残疾学生相比,残疾学生在数学阅读方面没有提升。
Buzick和Stone (2014)进行了一项元分析,探讨了残疾学生和非残疾学生的朗读工具对考试成绩的影响,与非残疾学生相比,朗读工具是否能提高残疾学生的考试成绩[21]。他们的纳入标准比Li (2014)使用的更严格,因此符合标准的数量较少。其结果支持Li的研究结果,即朗读工具的应用对数学阅读的影响较小。
以上研究未细分残疾类型,笼统地分为残疾学生和非残疾学生,其重点是大规模的标准化测试。也就是说,这些测试并非专门针对阅读障碍学生进行,因此并未能说明文本转语音及其相关工具对阅读障碍学生阅读理解的影响。
3.2. 文本转语音工具对提高阅读障碍学生的阅读理解有促进作用
当文本信息在视觉和听觉上都可用时,对文本信息的理解会有所帮助。在Montali (1996)的一项研究中,八年级和九年级的18名普通学生和18名有阅读障碍的学生在电脑上进行了阅读练习。每个学生参加的阅读任务分为视觉、听觉和视觉、听觉同时呈现(屏幕上的文字在电脑大声朗读的同时呈现)。在视、听觉同时呈现条件下,阅读能力差的学生达到了默读的普通学生的理解水平[9]。Schneps等人(2019)在控制理解的情况下,采用听觉文本转换为语音与加速视觉增强结合的方法,有阅读障碍的学生和普通读者都达到了最高的阅读速度。而且有阅读障碍的学生达到了与使用纸质、视觉或听觉方法的普通读者相当的阅读速度,并没有理解上的差别[11]。
Torgesen等人(1995)研究发现学生在使用带有语音朗读的书后,在词汇识别和语音解码能力上的显著提高[22]。Edith等人(2010)为期两年的研究发现,文本转语音工具的应用可以显著地提高阅读障碍学生的即时和长期的阅读成绩。因此,文本转语音工具可以最大限度地减少阅读障碍的负面影响,并最大限度地发挥学生阅读能力的潜力[23]。Wood等人(2018)通过对文本转语音技术和相关朗读工具对阅读困难学生阅读理解的影响进行元分析,结果显示文本转语音技术的应用可以帮助学生提升阅读理解能力。
以上研究证实了文本转语音工具对提高阅读障碍学生的阅读能力有一定的积极作用,但尚不清楚其机制。使用文本转语音工具可以通过向学生提供更成功的阅读体验来引起学生的阅读动机[9]。当有阅读障碍的学生被鼓励花更多的时间阅读时,其阅读技能(如语音解码和词汇识别)和整体阅读能力的提高才更有可能[24]。因此,在课堂中使用文本转语音工具可以帮助有阅读障碍的学生成为更独立的读者,从而帮助他们在阅读理解方面获得更大成功。
4. 讨论
4.1. 文本转语音工具对阅读障碍学生阅读理解的影响
20世纪80年代起,便开始了文本转语音工具的应用,本研究找到了少量上个世纪90年代的研究。随着时间的推移和技术的更新,相关的研究越来越多,使用计算机文本到语音朗读工具的研究数量正在增加,也反映了更广泛使用文本转语音技术的趋势。研究文本转语音和相关朗读工具对阅读理解的有效性的总体数量和质量都在增加。但是目前已有的研究的质量参差不齐,如一些研究未进行随机对照研究。理想的情况是研究的样本数量要大且均匀,以便对文本转语音工具应用的效果进行最佳评估,然而已有的研究多数为小样本,被试大概为十几人。应当在教育背景下进行文本转语音工具的相关研究,以应对课堂情境的多样性,更有针对性地应用相关工具。
本研究通过对文本转语音工具对阅读障碍学生阅读理解能力影响的相关研究进行回顾分析,发现文本转语音技术可能有助于学生的阅读理解,但对提高阅读理解能力的大小程度需要更多的研究来进一步探索。而且文本转语音工具的应用可能存在一些潜在的影响,因此需要更好的研究设计来控制这些潜在的影响。
4.2. 教育实践和未来研究的建议
本研究通过对国内外文本转语音及相关朗读工具应用研究的归纳和总结,发现现有的文本转语音工具主要以英文版本居多,如Natural Reader,虽然是免费使用,但是对于汉语阅读障碍学生来说,想要使用还需要软件的本地化或者重新设计[25]。其它类似的工具虽然有相应的本地化版本,但是由国内开发者设计的专门以汉语为主帮助汉语阅读障碍学生的工具,如李勤华设计的阅读障碍辅助训练APP“阅障帮”[26],这类应用比例很小,因此在此类应用开发方面还有许多空间。在实践层面上,当前我国针对阅读障碍儿童的辅助技术体系还未系统建立。《残疾人教育条例》(2017)中提及政府及其有关部门要“支持研究、生产残疾人教育教学专用仪器设备、教具、学具、软件及其他辅助用品”,但目前相关政策仍存在一些可发展的空间,如建立系统的特殊教育辅助技术体系,建立相关政策以确保阅读障碍学生获得充分的、专业的技术支持。
未来的研究应该涉及以下内容:被试的阅读能力各维度评估、文本转语音工具的特征、被试的工具使用跟踪、更大数量的被试使用研究、工具在教育背景下针对性的使用等。在未来的研究中,应该评估被试的阅读能力的各个维度,如解码能力、工作记忆能力、词汇、听力和阅读理解。文本转语音工具的特定问题,如朗读的速度,文本高亮的强度需要解决。对文本转语音工具的使用者进行跟踪,包括其使用时长、偏好设置等,记录并分析阅读障碍学生的阅读水平和障碍程度,结合其阅读测试的结果,以制定更具个性化的工具使用策略,了解其应该如何利用该辅助工具。未来的研究可以探索阅读障碍学生如何与这些技术互动,以及它们对阅读理解的影响。
NOTES
*通讯作者。