中高级学习者汉字认读偏误分类及成因研究

doi:10.12677/AE.2024.142187

期刊菜单

中高级学习者汉字认读偏误分类及成因研究
Research on the Classification and Causes of Chinese Character Recognition Bias among Intermediate and Advanced Learners

DOI: 10.12677/AE.2024.142187, PDF, HTML, XML,
作者: 唐代林：广西民族大学文学院，广西南宁
关键词: 汉字认读；认读偏误；汉字教学；Chinese Character Recognition； Recognition Bias； Chinese Character Teaching

摘要: 认读汉字是学习汉语的必备技能之一。学习者产生的汉字认读偏误各式各样，主要可以分为以下六类：跟字形有关的形近偏误、跟形声字有关的形声旁偏误、跟字词意义有关的近义偏误、跟组词有关的预测偏误、跟字序有关的顺序偏误、由多音字引起的多音字偏误。偏误成因较为复杂，除了正字法方面的影响，记忆策略和认读策略也是不可忽视的原因。

Abstract: Chinese character recognition is one of the essential skills in learning Chinese. Learners make vari-ous recognition errors, which can be mainly divided into the following six categories: shape-approximation errors related to shape, para-morpheme errors related to shape-sound words, synonym errors related to word meaning, prediction errors related to word formation, order errors related to word order, and polyphone errors caused by polyphone words. The causes of errors are complex. In addition to the influence of orthography, memory strategies and recognition strategies cannot be ignored.

文章引用：唐代林. 中高级学习者汉字认读偏误分类及成因研究[J]. 教育进展, 2024, 14(2): 1217-1224. https://doi.org/10.12677/AE.2024.142187

1. 引言

近二十年以来，对于汉字认读偏误的研究有不少，张晓涛(2005)在对非汉字文化圈学生汉字认读进行研究后，将学生的汉字认读偏误主要分为因字形和笔画相近或相同引起的混读、因字义相同或者相近而导致的认读的偏误、因过分依赖形声字声旁表音产生的偏误、母语发音负迁移造成的偏误、多音字造成的偏误，并从学习者和教师的方面分析了偏误产生的原因，最后对汉字教学提出了自己的建议 [1] ；王玲、张健(2014)对中级阶段留学生的汉字认读偏误进行调查后，发现了五种汉字认读的偏误：声旁泛化偏误、形近字的认读偏误、多音字认读偏误、增加义符导致的偏误、字义相同或相近导致的认读偏误 [2] ；郝美玲(2018)对35位高等级留学生即时认读1200个常用汉字的情况进行考察后，提出了三类汉字认读偏误的分类，即：字形相似错误、选择偏误、语音错误。在前人研究中，总结了许多影响汉字认读的相关偏误，也对偏误进行了分类和归因 [3] ，还有许多可以完善的地方。本论文拟通过课堂观察法、问卷法、测试法对中高级汉语学习者的汉字认读偏误进行进一步的分类并对不同偏误的成因进行研究，最后对汉字教学提出一些建议。

2. 研究设计

2.1. 研究问题

汉语学习者的汉字认读偏误的分类；汉语学习者的不同汉字认读偏误的成因。

2.2. 研究对象

高级汉语学习者一名，中级汉语学习者两名，三名学习者的母语都为拼音文字，且都能熟练使用英语，三人所使用的教材均为《HSK标准教程》系列教材，三人均为30岁左右男性，所有被试的学习方式均为网络在线学习，学习汉语时都在中国。高级学习者，建筑学博士，母语为西班牙语，学习汉语4年，已经通过了HSK6级考试，汉字认读能力非常优秀；中级学习者A，建筑学博士，母语为阿拉伯语和法语，学习汉语2年，已经通过HSK4级考试，刚开始HSK5课程的学习；中级学习者B，英语博士，母语为英语，学习汉语1年多，刚通过HSK4级考试。

2.3. 研究方法

课堂观察法、访谈法、测试法。

2.4. 偏误分析

2.4.1. 偏误的收集

本论文一共收集了816条学习者的汉语字词认读偏误：三名学习者在课堂教学中，最近产生的汉字认读偏误600条，在测试中产出的216条偏误。

2.4.2. 偏误的标准

本论文认为汉字认读偏误是指学习者在接受汉字的图像信息刺激以后，不能正确输出语音而产生的偏误。如：“我”被学生认读为“找”、“凉”被误读为“冷”。某些语音偏误，如儿化音、变调、平翘舌、声母(如：j、q、x)混淆等，不计入汉字认读偏误，比如张晓涛(2005)提出的母语语音负迁移偏误，其西班牙学习者因为西班牙字母的“c”发音与汉语拼音“k”发音相同而将“草、考”二字误读，笔者不将其考虑为汉字认读偏误，这样的偏误是因为学习者对于汉语声母“c”的发音掌握不好，可能划入语音声母偏误比较符合。另外，对于难以分辨的偏误，采用组词或翻译进行辅助判定。

2.4.3. 数据分析

将收集到的偏误，通过Excel汇总，分别标注偏误出现的词语、句子、课文，并对偏误进行分类，然后对其进行数据分析，计算出不同偏误在三个不同等级学习者汉字认读偏误中的占比，以探究不同等级学习者的汉字认读偏误特点，并尝试探究不同偏误时产生原因的和心理机制。

2.5. 测试与访谈设计

从三名学习者使用的教材中(中级学习者使用的《HSK标准教程4》、高级学习者使用的《HSK标准教程6》)，随机选择1000字左右的文字材料，材料的类型包括单字、词语、句子、课文。材料选择完成后，将其以小四号宋体呈现在word文档中，测试时要求学习者尽可能快地通过电脑屏幕认读测试材料，主试对正误和偏误进行记录。测试完成后，主试会用英语询问学习者的想法，并记录学习者在产生偏误时的所思所想。

3. 偏误分类及成因分析

3.1. 偏误分类

3.1.1. 形近字偏误

形近字偏误是跟汉字字形有关的偏误，是三名学习者产生的偏误中最多的一类偏误。根据其主要诱因，形近字偏误可以细分出许多类别。有相似偏旁和部件引起的形近字偏误，如：“特”被误认为“待”、“很”被误认为“跟”、“住”误认为“往”、“尝”被误认为“觉”、“考”被误认为“老”、“夏”被误认为“复”、“话”被误认为“活”。有因笔画的差异造成的形近字偏误，如：“甩”被误认为“用”、“目”被误认为“日”、“毛”被误认为“手”。有因轮廓相似引起的形近字偏误，如：“支”被误认为“文”、“厅”被误认为“行”、“妻”被误认为“事”。

3.1.2. 形声旁偏误

形声旁偏误跟形声字、形旁、声旁有关。形声旁的偏误也可以细分成几类：首先是过度泛化声旁的表音作用引起的偏误。如：“详”字被误认为“羊”、“校”被误认为“交”、“晚”被误认为“免”。然后是不了解汉字的构字法而引起的偏误，学习者在认读一些非形声字但具有形声字相似结构的汉字时产生错误，比如将会意字“位”误读为“立”、会意字“休”误读为“木”、会意字“便”误读为“更”。最后是与形旁相关的偏误，在认读某些汉字时，学生还有可能给汉字加上形旁，如：“介”被误读成“价”、“主”被误读为“往”、“专”被误读成“传”。

3.1.3. 近义偏误

近义偏误是跟汉字语义相关的偏误。像是近义词和同义词引起的偏误。例如：学习者将“改”误读为“变”、将“经验”误读为“经历”。

在收集偏误时，我们也发现近义偏误的发生不止存在于同义字词或者近义字词之间，某些意义有关系的词语，也会造成选择偏误的发生，比如“丈夫”被误认为“妻子”、“树”被误认为“花”、“竟然”被学生误读为“即使”。这也从侧面说明了，学习者可以利用汉语的意义线索对汉语字词进行分类记忆。另外在认读某些三字词语时，也会发生近义偏误，如“兴趣”被误认为“感兴”。

3.1.4. 预测偏误

预测偏误跟学习者的记忆策略和认读策略有很大的关系，这一类偏误一般发生在认读多字词语时，虽然学生可以成功认读词中的某些字，但剩下的内容却不行。如：“结果”被误认为“如果”、“亲切”被误认为“亲戚”、“保持”被误认为“坚持”。

我们在研究此类偏误时，发现一个有趣的现象，预测偏误产生的偏误词可能与本来的词的词序完全不同。例如：“希望准确地找到解决问题的方法。”一句中的“解决”被误认成“了解”、“我实在不知道怎么办。”一句中的“实在”被误认为“其实”。另外，学习者使用预测策略认读汉语字词时，出现的词语不一定是随机的，它们似乎有一种优先级，如中级学习者A在认读含有“果”字的词语时，“如果”出现的次数非常高；中级学习者B在认读含有“觉”的词语时“觉得”一词也经常出现；高级学习者在认读含有“细”的词语时，“仔细”一词经常出现。似乎记忆越深，或者习得时间越早、程度越高的词语，越可能成为学习者预测的材料。

3.1.5. 顺序偏误

某些汉字词语在顺序颠倒的情况，会代表原词相近但是不同的意思。学习者在认读汉字时是准确辨认了汉字，但是因为某些原因，没有输出正确的词语，造成了顺序偏误。如：“积累”被误认为“累积”、“奶牛”被误认为“牛奶”。

3.1.6. 多音字偏误

多音字偏误即多音字引起的偏误，如：表“应该”的“得”被误认为结构助词“得”、“爱好”的“好”被误认为三声、“了解”的“了”被误认为“le”。

3.2. 偏误成因分析

本论文认为文字的认读受到客观和主观两方面的影响，客观即汉字自己的特点，主要是汉字的正字法，正字法是将语言的声音描绘成书写符号的方法，按照正字法的不同，语言可分为三种类型：音节文字、字母文字、字符文字 [4] 。不同的正字法对于文字认读的影响是不一样的，汉字是典型的字符文字，字符文字将词和词素作为语言单位，并将一些象形的符号与这些单位匹配，这些符号就是字或者字符，字符中即包含了读音、也包含了意义。对于汉语学习者来说，认读汉字就是要通过字符将汉字的读音、意义正确的提取。它有四个阶段：接受汉字的图像刺激、辨认汉字、检索汉字音义、发音器官发音。

主观即认读主观，学习者作为认读主观，所采用的汉字记忆策略和汉字认读策略会对汉字认读造成影响。汉字记忆策略就是学习者将汉字字形、字义、字义相结合的方式，即汉字在学习者脑中的存储模式。受到词本位教学模式的影响，许多汉语学习者对汉字的记忆是以词为基本单位的。文字的认读策略有很多，Coltheart等人(2001)指出，在书面语和口语之间有始于正字法的三条通路：形–音转换通路、词典加语义系统通路、纯词典通路 [5] 。汉字的认读策略指的是学习者认读汉字的方式，不同的认读策略所利用的线索是不同的。学习者可以只利用汉字的图形信息即字形对汉字材料进行认读 [6] ，例如：认读“木、本、末”字是，学习者可以通过横、竖、撇、捺这几个笔画的组合，直接认读汉字。这种自下而上的认读策略是最基础的汉字认读策略，也是学习者使用最多的认读策略。但是在学习汉语的大部分时间里，汉字不会单个出现，它一般存在于词语、句子之中。除了利用图像信息对汉字进行认读外，学习者可以利用自身记忆和已有信息(语境、语义、构词等多种因素)对汉字进行认读，这是自上而下的汉字加工方式 [6] 。例如：学生在单独认读“结婚”一词时，认读“婚”字失败。但在读“爱情是结婚的重要原因”一句时，认读“结婚”一词并没有问题。下面将从客观和主观两个方面分析不同偏误产生的主要原因：

3.2.1. 形近字偏误

从汉字自身来看，汉字的独特的正字法是形近字偏误产生的客观因素。不同于横向排列的拼音文字，汉字将所有的笔画纵横交错放在一个大方块中，汉字的结构很复杂，且相似的部件非常多，容易误导认读者。在主观方面，学习者对于汉字的图像信息记忆不够仔细，在汉字的笔画、部件、结构等细节的辨认上出现问题，将认读的汉字错认为其它字，就会导致了形近字偏误。艾宾浩斯的“遗忘曲线”就提到，遗忘的产生于干扰和衰退。干扰是指获得顺序不同的记忆对彼此造成的影响；衰退指大脑中记忆痕迹会在缺少刺激的情况下逐渐衰弱直到遗忘的过程。形近字偏误就是因为某一汉字形体的记忆被其他形似字的记忆所干扰产生的。在对学习者的形近字偏误进行访谈时，学习者就说到，认读汉字时，某些相似的部分很容易对他们的记忆和认读造成干扰，有些汉字只是在细节上有差异，特别是在阅读课文时，大量的汉字混在一起，认读起来就更加困难，一旦马虎就会读错。

3.2.2. 形声旁偏误

汉字虽然是字符文字、表意文字，但有的汉字中也存在表音结构，形声字就是有表音线索的一类汉字，声旁是形声字中提示读音的部件 [7] [8] 。声旁虽然对于认读汉字有不小的帮助，但并不是所有的声旁都可以准确地表示整个汉字的读音，大约只有四分之一的形声字声旁和整字完全相同，这就给形声旁偏误的产生提供了正字法基础。对于形声字认读策略和记忆策略的不同就是形声旁偏误产生的主观原因。首先，学习者不能正确记忆完全表音和不完全表音声旁时，会产生偏误；然后，学习者不能正确记忆哪些字是形声字，哪些不是时，也会产生偏误；再者，学习者在认读时忽视形旁，还会产生偏误。在访谈中，中级学习者表示自己并不能分辨形声旁，只是以为部分具有相同符号的汉字，读音会相同。高级学习者在访谈中表示，自己会将有相同声旁的字记忆在一起，但是大部分情况下，无法对所有的字进行细节的区别。另外，分清那些汉字是形声字，那些不是也不太容易。前人的研究中，少有提到形旁相关的认读偏误，笔者认为学生在误读形声字，比如将“室”误读成“至”、“详”误认为“羊”、“笔”误认为“毛”、“军”误认为“车”时，不仅是不了解声旁的表音规律，一定程度上，这也可以看作是对形旁的忽视，学生应该意识到具有相同声旁，不同形旁的汉字很有可能读音不同。虽然形旁的主要作用是表示了汉字的义属，不是表音，但它也会一定程度上对汉字认读造成影响，在汉字认读时，声旁和形旁其实是相辅相成的。

3.2.3. 近义偏误

汉字是形、音、义高度结合的文字，相同的语义可以由几个不同的字词表示，并且为了避免重复的和增加语言的准确性，汉字中还存在大量的近义字词。另外，某些合成词是由两个意义相同或相近的字组成的 [9] 。很明显大量的同义词和近义词就是近义偏误产生的客观条件。近义偏误产生的主观条件，集中在记忆上。科勒的“重叠效应”理论就指出人们习惯将相似度高的信息集中在一起记忆，这样会导致同化的产生，相似度高的记忆互相抑制和干扰，就产生了遗忘。同义字词、近义字词在学习者中的记忆中重叠干扰，就导致了近义偏误的产生。在访谈中，学习者就说道，在认读到某些字词时，它们的意思突然都从脑袋中蹦出来，但是读音信息不能被唤起，学习者就要从符合语义的选项中选择。这就说明了学习者接受到汉字的图像信息刺激后，有时会首先激活了意义系统，他们需要根据被激活意义提取汉字读音，但某一意义信息能够刺激到重叠的多个相近或相同意义的字词，学生从中选择错误，就会造成认读偏误。如：“邀”被误认成“约”、“改”被误认成“变”、“变”被误认为“换”。另外，学生还谈到在认读某些词语时，脑中被激活的信息不是确切的词义，而是一个语义场。比如：“丈夫”一字会激活“家庭成员的称呼”这个语义场，学生会产生“父亲”、“妻子”这样的认读错误；还有“竟然”会激活“关联词”这一语义场，这时学生就会产生“即使”、“但是”这样的偏误。在字词激活语义场相关记忆时，学习者从这个意义类属中选择错误，近义偏误也就产生了。

3.2.4. 预测偏误

语言的经济原则是语言演化过程中遵循的一个基本原则，它要求语言以最少的材料来表达最大限度的信息量。汉字就是一种非常经济的语言材料，同一个汉字可以组成许多词语。学习者在学习汉语字词时，记忆的信息除了读音、意义，还包括汉字的组词信息，学习者可以通过组词意思对词语中不认识的字进行预测或者猜测 [10] 。汉字的高效经济的组词能力是预测偏误发生的客观条件。记忆策略和认读策略则是预测偏误的主观条件，从笔画、结构辨认汉字是最为基础的汉字认读方式，双音节词在现代汉语中占有优势，学习者在课堂上认读的汉字材料多为词语或者句子，没有足够的时间将每个汉字的每个笔画都一一认清。这时，学习者会通过组词和语境的信息，对之后的材料进行猜测，有可能会猜测错误。

3.2.5. 顺序偏误

汉字强大的组词能力让相同的汉字材料可以通过不同排序表示不同的意义，这是顺序偏误产生的客观因素；主观原因方面，在“词本位”教学模式的流行背景下，学习者对汉语词语的记忆多以词为单位，对于词中各字符的记忆往往不那么仔细。

3.2.6. 多音字偏误

汉字的结构复杂，形态多样，常用的1000多个汉字能满足我们的交流需要，全都是多音字的功劳，也是多音字偏误产生的正字法基础。引起多音字偏误的主观原因主要跟学习者的记忆策略有关，对多音字的记忆不清导致了语音信息相互干扰。

4. 偏误数据分析

本论文共收集了816条偏误，其中600条偏误为最近课堂教学中所产生，三名学习者各取200条。另外216条由测试得出。表1为课堂汉字认读偏误的统计情况，表2为测试中产生偏误的统计情况。

Table 1. In-class error statistics

表1. 课堂偏误统计

Table 2. Test results statistics

表2. 测试结果统计

通过表1我们可以看出，在所有学习者产生的偏误，形近字偏误占比高达50.6%。形近字偏误是所有产出的认读偏误中占比最大的一类偏误。紧随其后的，是形声旁偏误、预测偏误和近义偏误，分别占比16.6%、15.3%和12.6%。多音字偏误和顺序偏误，在总的偏误中所占的比例是最小的。

因为课堂教学偏误出自于多少数量的汉字材料不易统计，所以只能看出学习者的不同偏误的占比，不能用于分析认读相同字数材料的产生的偏误，所以我们对三名学习者进行了测试，并将测试结果统计形成表2。通过表2所展示的数据，我们可以看出在认读相同字数的材料时，三名学习者的偏误产生数量是按汉语水平的高低递减的，高级水平的学习者产生偏误的数量是最少的，两名中级水平的学习者产生的偏误相对较多。测试结果的偏误组成结构和课堂偏误的结构非常相似，产生的偏误中形近字偏误占比最大，多音字偏误和顺序偏误的数量和占比最小，其他偏误的占比基本没有什么太多的变化。

在测试中，笔者观察到在认读单字时，三名学习者产生的偏误最多，相同汉字在词汇中比单字更容易认读，这证实了汉语中也存在词优效应，即当字出现在词中时，会比出现在没有关联的字符串中，更易辨认。比如：“超”以单字呈现时，学习者会误认为“起”，而在词语“超过”中，并没有认读失败。学习者在认读单字时，还不时利用组词来帮助自己认读，比如认读“趣”时，学习者下意识说出“感兴趣”，然后认读成功“趣”。

5. 结论

汉字认读偏误按主要成因可以分为六类：形近字偏误、形声旁偏误、近义偏误、预测偏误、顺序偏误、多音字偏误。结合课堂记录和测试结果很容易看出，三名中高水平汉语学习者产生的汉字认读偏误最多的类型是形近字偏误，这说明从汉字字形认读汉字是学习者使用最多的认读策略。相同字数材料下，高级学习者产生的形近字偏误最少，说明随着汉语水平等级的提高辨认字形的能力也在提高。形声旁的偏误产生说明三名学习者明白形旁和声旁的特殊作用，并且能够将其作为汉字认读的线索，只是不够熟练。近义偏误和预测偏误是跟认读策略有很大关联的两类偏误，它们的存在说明三名汉语学习者能够使用词语意义和组词等因素对汉字自上而下的加工。在收集偏误时。相比其他偏误，顺序偏误和多音字的偏误占比最小。

另外，笔者也发现，某些汉字认读偏误并不能简单地归为某一类，它们的成因较复杂。如：“保持”被误读成“特别”，学习者表示，自己辨认“持”的字形失败，将其认读为形近字“特”，同时，又采用了预测策略，猜测出词语“特别”，从而造成这个认读偏误，此偏误是由形近字和预测策略引起的。

最后，不得不说的是，造成学习者汉字认读偏误产生的原因很多，除了本文重点提到正字法、学习者记忆和认读策略的影响外。汉语独特的构词法、词本位教学模式的流行、双音节词的优势地位、教材编排、课程设计等都是导致汉字认读偏误产生的客观因素。

6. 对于汉字教学的建议

首先，也是最重要的一点，作为汉语教师，我们要意识到偏误的产生是正常的，它们揭示了学习者的学习特点，也会指导我们接下来的教学安排。但是，我们也不能将学习者汉字认读的产生都自然而然地都归因于汉字本身，导致汉字认读偏误的其他原因产生原因有很多，学习者的学习策略、记忆策略、汉字本身的特点、教师的教学策略、教材的编写安排等等。具体建议如下：

首先，汉字教学应该是围绕汉字为中心全方位的教学，不能只停留在读音和意义的方面。字形、结构、构词、记忆方法、认读方法都是对学习者来说很重要的内容。对相似字形和结构的字要进行对比教学；还可以通过笔画拟物化的方式帮助学习者记忆汉字结构，如：“并”有“头发”、“开”没有“头发”；对于意义相近的字词，一定要进行尽可能多的例句展示，帮助学习者识记词义；汉字教学不能轻视构字法的教学，特别是形声字的学习，引导学生对学习到的相同声旁的形声字进行总结和归类，让学习者充分了解声旁的发音规则。多方位的教学才利于学习者汉字认读策略的多样性发展。

最后，对外汉语教师要坚持词为主，字为辅的教学模式。要认识到单字教学的重要性。帮助学习者的单字组词能力的发展，避免“离词不认字”这种现象发生。可以以字本位教学模式为核心，将汉字书写和认读相结合，设置专门的汉字课程，以单个汉字为切入点，教授汉字的形体、组词和书写。本文认为词本位和字本位都有自己的优势，汉字和汉语的特殊性要求我们要做到博采众长，对不同的课程采取不同的模式才可以更好地完成教学目标。

参考文献

[1]	张晓涛. 非汉字文化圈学生汉字认读偏误及对策研究[J]. 汉字文化, 2005(1): 46-49.
[2]	王玲, 张健. 中级阶段留学生汉字认读偏误调查及教学对策研究[J]. 语言与翻译, 2014(4): 89-93.
[3]	郝美玲. 高级汉语水平留学生汉字认读影响因素研究[J]. 语言教学与研究, 2018(5): 1-12.
[4]	(美)卡罗尔. 语言心理学[M]. 缪小春, 等, 译. 上海: 华东师范大学出版社, 2006: 12.
[5]	(德)温格尔, (德)施密特. 认知语言学导论[M]. 上海: 复旦大学出版社, 2008.
[6]	徐彩华, 刘婷, 刘燕君. 汉语二语学习者汉字识别中的整体/成分加工倾向研究[J]. 语言文字应用, 2022(1): 56-69. [Google Scholar] [CrossRef]
[7]	杨珲, 彭聃龄, Charles A. Perfetti, 等. 汉字阅读中语音的通达与表征(I)——字水平与亚字水平的语音及其交互作用[J]. 心理学报, 2000(2): 144-151.
[8]	张亚旭, 周晓林, 舒华, 等. 汉字识别中声旁与整字语音激活的相对优势[J]. 北京大学学报(自然科学版), 2003(1): 126-133. [Google Scholar] [CrossRef]
[9]	李力红, 刘宏艳, 刘秀丽. 汉字结构对汉字识别加工的影响[J]. 心理学探新, 2005, 25(1): 23-27.
[10]	郝美玲, 厉玲. 初级阶段留学生汉语复合词加工影响因素研究[J]. 语言教学与研究, 2015(2): 8-18.

为你推荐

友情链接