1. 引言
“电写”指以电子设备为载体、以拼音输入法为主要书写方式的汉字输入新阶段,主要的电写方式有:键盘输入、语音转写等。随着手机等智能电子设备的普及,电写逐渐替代笔写,书面交际进入“电写时代”[1]。在国际中文教育领域,电写成为解决汉字难学的新尝试。对于汉语学习者而言,电写时代的到来为其汉语学习与交流提供了便利,拼音输入法作为外国人学习汉语、进行网络社交时最常用的输入工具。社交媒体平台作为新兴的传播场域,正逐渐成为中外文化交流、碰撞与融合的关键阵地[2]。小红书用户群体广泛,其中有不少处于不同汉语水平阶段的外国汉语学习者,他们在小红书上分享个人学习日常、记录生活等,所表达的文字内容更多以拼音输入法为载体。汉语学习者在使用拼音输入法进行网络社交时,既受汉语水平、母语背景的影响,也受平台交流语境、输入法的干扰,进而出现各种偏误类型。
目前,对电写偏误研究主要集中在以下三个方面。一是基于中文教学场景下的拼音输入错误分类研究,中文教学中拼音输入错误进行分类研究,认为主要集中于同音错误、元音打错、辅音打错、漏打字母、不知如何输入、其他等六类。二是基于拼打练习场景下的偏误类型研究,陈勇(2016)把拼打练习出现的偏误分为三类:“音同或音近”出现的错误、“形近或形似”出现的错误、“空”字错误,并且学生利用声旁相似的字相互替代,产生的偏误现象更多[3]。三是基于特定群体的汉字拼打错误类型研究,陈蒙(2023)调查了学习汉语六个月的美国学生的汉字拼打错误,并从汉字发音、字形和含义的方面构筑了一个拼写错误类型的系统[4]。翟乃刚(2024)以加拿大小学生“拼音打字”的偏误为研究对象,分析出字形、语音、语法、输入法四大类(二十一小类)偏误类型,分析成因并提出教学对策[5]。
本研究的研究对象涵盖不同国别、不同汉语水平等级并使用拼音输入法在小红书平台进行汉语表达的汉语学习者,本人对研究对象及语料进行严格筛选以确保其真实性。实施步骤主要分为两阶段,语料搜集阶段通过“HSK3-6”等关键词检索筛选符合条件的笔记,收集有效语料309条,同一句的不同错误形式记不同偏误,共397处偏误;语料整理与归纳阶段则将搜集到的偏误语料录入Excel表格,标注信息后,按国别、汉语水平等级及偏误类型进行划分,最终确定语料的偏误类型。并对偏误语料呈现的特点进行归纳,以期为电写汉字教学提供实践参考。
2. 偏误分类
(一) 语音偏误
在所有语料中,共有53条语料为语音偏误语料,其中语音偏误又分韵母、声母、儿化三小类偏误,韵母偏误有24条,声母偏误有23条,儿化偏误有6条。
1) 韵母
例(1)~(6)是韵母偏误。主要有单韵母、复韵母、鼻韵母三类偏误。
(1) 你的粉色更多(俄罗斯)
(2) 她跟我都住在中国生化(韩国)
(3) 我很喜欢拍照所以一打开这个礼物就特别卡心(美国)
(4) 又有了一些成绩感(越南)
(5) 今天批改盆友在我评论区发的日语字体(日本)
(6) 你是哪个水果名族呢(俄罗斯)
例(1)是单韵母偏误,“粉丝”误选“粉色”。偏误表现为将“i”打成“e”。例(2)~(4)为复韵母偏误,例(2)中“生活”误选“生化”,偏误表现为将“uo”打成“ua”,属于复韵母“uo”与“ua”的混淆;例(3)中“开心”误选“卡心”,偏误表现为将“ai”打成“a”。例(4)中“成就”误选“成绩”,偏误表现为将“iu”打成“i”。例(5)~(6)为鼻韵母偏误,例(5)中“朋”误选“盆”,偏误表现为将“eng”打成“en”。例(6)中“民族”误选“名族”,偏误表现为将“in”打成“ing”。
2) 声母
例(7)~(11)是声母偏误,主要有双唇音、舌尖前后音、送气音三类偏误。
(7) 次川菜(俄罗斯)
(8) 难得一逼(韩国)
(9) 哈哈哈很的吗(德国)
(10) 大家好,我系美国人(英国)
(11) 我也开始了练习中文,因为寒假我没有寂寞考试(俄罗斯)
例(7)中“吃”误选“次”,“ch”打成“c”,舌尖后音发音偏误。例(8)中“批”误选“逼”,偏误表现为将“p”打成“b”,双唇音发音错误。例(9)中“真”误选“很”,偏误表现为将“zh”打成“h”,舌尖后音发音偏误。例(10)“是”误选“系”,偏误表现为将“sh”打成“x”,舌尖后音发音偏误。例(11)中“寂寞”(jimo)代替了正确的“期末”(qimo),将送气的“qi”发成不送气的“ji”,是汉语声母学习中送气\不送气对立。
3) 儿化
儿化音是汉语普通话中的一种特殊音变现象,偏误表现特征为儿化音的冗余。
(12) 我想去公园儿里散步(韩国)
(13) 好的以后儿我要改变头发(韩国)
例(12)中“公园儿”典型儿化误用,正确表达:“我想去公园里散步”或“我想去公园儿散步”),但不可既儿化又叠加“里”字,该句子属于“不当儿化 + 冗余”;例(13)中“以后儿”是将时间副词错误儿化,属于儿化音的冗余。
(二) 字形偏误
在所有语料中,共有95条语料为字形偏误语料,其中字形偏误又分同音字、同音词、形近同音字、形近同音词四小类偏误,同音字偏误有34条,同音词偏误有8条,形近同音字偏误有48条、形近同音词有5条。
1) 同音字
(14) 在等他我就饿死了(俄罗斯)
(15) 哈哈哈我也试试法这样视频(俄罗斯)
例(14)~(15)为同音字偏误。例(14)中“再”误选“在”,例(15)中“发”误选“法”。同音不同形,是输入法输出产生的识字问题。
2) 同音词
(16) 因为我的大学没有好好惯例我的课程表(日本)
(17) 德语写得很不错!Insbesondere这个词都用对了,我跟你同意(德国)
例(16)~(17)为同音词偏误,例(16)“管理”误选“惯例”,例(17)“统一”误选“同意”。同音且字形无关联。也是输入法输出产生的识字问题。
3) 形近同音字
(18) 老师说hsk5级有的同学都觉得这颗很难(俄罗斯)
(19) 我想再去卖豆沙麻花(韩国)
(20) 这些天那个健身房可以去(俄罗斯)
例(18)~(20)属于形近同音字偏误。例(18)“课”误作“颗”,字形相近,均含“果”字部件。例(19)中“卖”与“买”,字形结构相似度高,语音形式相近,二字语义涉及商品交易行为,是常见的“买、卖”混用偏误。例(20)中结合语境该句是疑问句,正确表达为“哪”,两字部件相同,出现形近字混淆情况。
4) 形近同音词
(21) 感谢你的注意(俄罗斯)
例(21)是形近同音词偏误,“主意”误作“注意”,两字有相同部件“主”,因音同与部件相似而选词混淆。
(三) 语法偏误
在所有语料中,共有175条语料为语法偏误语料,其中语法偏误又分词法、句法、标点符号三小类偏误,词法偏误有95条,句法偏误有51条,标点符号偏误有29条。
1) 词法
(22) 我已经学习汉语2年,我的靶子是参加中国的高考语文(英国)
(23) 她们都没有问题!已经疫苗了,也不会咬人(美国)
(24) 我是从2021年开始的知道我的hsk级不高,可惜,头几个年学习不太努力(俄罗斯)
(25) 可能也是你自己都不发现你英语到底有多好呀(德国)
(26) 他被我吃掉了(日本)
(27) 学习语言好玩哈哈,而有时很麻烦(日本)
(28) 这样会更快找到了俄罗斯女朋友(俄罗斯)
(29) 那样的行动让我地心理很平静(俄罗斯)
(30) 他跑的很快(日本)
(31) 我考得hsk3级考试(俄罗斯)
(32) 今天formal,这样可以参加开会(俄罗斯)
例(22)是实词中的名词词义混淆,语料中实际上表达的应该是“目标”,而非“靶子”,在英语中“target”的中文意思包含这种意思。
例(23)中缺少动词“打”,是常见基础偏误。
例(24)是量词多加,“头几个年”正确表达为“头几年”。
例(25)是否定副词误用,“不”和“没”发生混淆,在英语中“No”涵盖这两种意思,但在中文中,“不”和“没”的使用有严格的界限。
例(26)是人称代词误用,“他”“她”“它”经常发生误代,属于高频偏误。
例(27)是关联词偏误,前半句和后半句语义存在对比,应使用转折联词“但”。
例(28)是常见语法点“了”的使用偏误,“了”用在动词、形容词后面表示动作或形状的实现,即已成为事实。
例(29)~(31)是常见语法点“的地得”混用。
例(32)是动宾搭配不当,动词“参加”后接名词而非动词,正确表达是“参加会议”或是“参会”。
2) 句法
(33) 虽然因为时间不多,没能去很多地方,但知道了为什么是世界经济城市(韩国-hsk5级)
(34) 你需要马上被救你的命(德国)
例(33)属于句法成分残缺,“为什么是世界经济城市”缺少主语,是常见语法偏误。例(34)句式错误,硬套“被字句”。
3) 标点符号
(35) 好吧,不去了。在北京(俄罗斯)
例(35)是标点符号错误。属于中英文句号混淆。句末应使用中文全角句号“。”,而非英文半角句点“.”。
(四) 词汇偏误
在所有语料中,共有37条语料为词汇偏误语料,其中词汇偏误又分词义、结构、色彩三小类偏误,词义偏误有14条,结构偏误有18条,色彩偏误有5条。
1) 词义
(36) 寒假终结了,快乐飞走了,我又要开中国学了(白俄罗斯)
(37) 中国人都是多么有目的和勤奋(俄罗斯)
例(36)~(37)属于词义混淆。例(36)混淆“终结”的使用场景。例(37)混淆“目的”与“目标”的语法功能和搭配习惯。
2) 结构
(38) 成都周末人海人山(俄罗斯)
例(38)是结构错序,人山人海是固定成语,结构为“人山”和“人海”的并列,其语序是约定俗成的,不能随意调换。
3) 色彩
(39) 哪里哪里、就是成都本地的小人(俄罗斯)
例(39)中“小人”的感情色彩与语境不符。“小人”在汉语中多为贬义词,指品行不端、心胸狭隘的人;此处想表达“成都本地人”,无贬义,属于感情色彩使用错误。
(五) 输入法偏误
在所有语料中,共有37条语料为输入法偏误语料,其中输入法偏误又分高频候选词偏误、输入法规则两小类偏误,高频候选词偏误有30条,输入法规则偏误有7条。
(40) 没有你帮(德国)
(41) 你喜欢不喜欢喝录茶(俄罗斯)
例(40)属于高频候选词首位误选,从语境角度看,输入“bang”首位候选词为“帮”,而非“棒”,是高频候选词常见偏误。例(41)中输入法规则导致的偏误,“lǜsè”应输入为“lvse”,类似的输入规则有“lüe”–“lve”等。
3. 网络用字偏误呈现的特点
(一) 语法偏误居多且类型多样
在收集的语料中,语法偏误出现的频次远高于语音、汉字、词汇、输入法类偏误,语法偏误涉及词法、句法、标点符号三小类,其中包含了词法和句法成分的误用,充分体现了语法偏误类型的多样。具体而言,词法层面的偏误主要表现为助词、介词、连词等虚词的误用与省略,句法层面则集中在句式语序混乱、句式误用、成分残缺等,标点符号偏误则多体现为中英文标点混用、逗号与顿号滥用等。这既源于汉语语法本身的系统性和复杂性,也与小红书平台交流相关——学习者为追求交流效率,往往会简化语法表达,进而加剧了语法偏误的出现,也使得语法偏误的类型更加多样。
(二) 偏误语料随习得水平与网络使用频率变化
外国人网络用字偏误并非固定不变,与学习者的汉语习得水平、网络使用频率密切相关。随着学习者汉语水平的提升,字形、字音等基础类偏误的频次逐渐降低,而语法偏误、用词偏误的占比会有所调整(中高级学习者更易出现复杂句式语法偏误);同时,网络使用频率越高的学习者,越易出现输入法偏误、口语化简约性偏误,但也会因社交互动频次多,逐步修正部分偏误,形成“使用频次越高,偏误类型越集中于语境适配”的规律。此外,随着网络语言的更新,偏误类型也会随之变化,如新型网络流行词的误用会成为新的偏误点,体现了偏误的动态适配性。
(三) 偏误语料口语化、简约化倾向明显
与书面语用字偏误不同,外国人网络用字偏误多适配网络交流的口语化、简约化需求。一方面,学习者为追求交流效率,会主动简化句子表达,进而产生偏误,如省略助词、连词使用缩写或简略表达;另一方面,受网络流行语、口语化表达的影响,学习者易出现用词、句式的误用,或使用口语化句式却混淆语法规则,此类偏误既体现了网络语境对汉语学习者影响,也反映了其对汉语口语化表达规范掌握不足的问题。
4. 结论
本研究以电写时代为背景,选取小红书平台上HSK3-6级、不同国别的外国汉语学习者为研究对象,通过检索筛选真实的网络发布语料,系统归纳出语音、字形、语法、词汇以及输入法五类电写偏误,各类型偏误均有其典型表现形式,如语音偏误集中于声韵母混淆,字形偏误以同音字、形近字混用为主,语法偏误则涵盖词法、句法、标点等多方面问题。同时总结出语法偏误居多且类型多样、偏误随学习者汉语习得水平与网络使用频率动态变化及偏误语料口语化倾向明显的特点,以期为电写时代国际中文教学提供实践参考。
本研究仍存在一定局限性,语料仅来源于小红书平台,未对不同母语背景学习者的偏误差异展开分析。后续可扩大语料搜集的范围,开展不同母语背景的偏误语料对比研究,也可结合教学实践开展行动研究,进一步完善电写时代国际中文汉字教学策略,助力国际中文教育教学模式的革新与实践。
基金项目
新疆师范大学研究生2025年度校级科研创新项目“基于短视频平台的外国人电写偏误语料库建构研究”(项目编号:XSY202501020)。