1. 绪论
在全球化背景下,汉语作为一种重要的国际交流语言,国际中文教育的重要性日益凸显。语料库作为语言学研究的重要工具,通过收集和分析大量真实语言数据来揭示语言规律,在国际中文教育中发挥着重要的作用。
我国语料库的研究起步于20世纪70年代末80年代初,而真正将语料库将教学实践相关联是在20世纪90年代。目前国际中文教学相关语料库规模逐渐壮大,标注范围和内容逐渐全面丰富,例如,“汉语中介语语料库系统”熟语料104万字,“只经过断句、分词和词性标注等加工处理”[1] (p. 460)。HSK语料库熟语料424万字,对字、词、句、篇、标点符号等5个层面进行了穷尽性标注。“全球汉语中介语语料库”基础语料达2367万字,标注语料总规模约1.26亿字;在字、词、短语、句、篇、语体、辞格、标点符号、口语和视频语料的语音、视频语料的体态语等10个层面进行标注[2] (p. 92)。
近年来,语料库的发展为第二语言学习者提供了大量的真实语言案例,帮助学习者更好地理解语言的实际运用方式,为国际中文教师提供丰富的语言素材,帮助教师更科学地设计教学内容,推动国际中文教育的发展。为了探析语料库运用于国际中文教学中的实际情况,本文对近三十年来国内公开发表的关于语料库下国际中文教学研究的文章进行统计、整理和分析,在分析评价的基础上指出当前相关语料库在国际中文教学中的不足与缺陷,并尝试提出建议。
2. 语料库研究情况综述
2.1. 语料库发展概况
18世纪至20世纪50年代为语料库的萌芽阶段,纸质语言文本经过人工收集整理后,形成手工语料库。随着计算机技术的发展,语言研究的统计工作走向自动化,语料库的存储方式也发生变革,电子语料库出现。国外最后一个手工语料库为伦敦大学Quirk教授于1959年建设完成的SEU。自此,电子语料库完全取代手工语料库。目前所指的语料库均为电子语料库。
王钢在《国外的语料库建设》一文中提到,国外语料库于上世纪六十年代发展起来,其中,美国的Brown语料库、英国和挪威共同建成的LOB语料库、英国的伦敦-隆德语料库和英国的伯明翰语料库是最具有代表性的[3] (p. 43)。
在我国,20世纪20年代以来,便有学者统计语料,用文本的形式制成语料库,如陈鹤琴在统计语料的基础上编写了《语体文应用字汇》一书。该时期的语料库规模较小,且不可为机器所读,是现代语料库的雏形。
自1979年起,我国开始建设机器可读的语料库,该类早期语料库有武汉大学的汉语现代文学作品语料库、北京航天航空大学的现代汉语语料库、北京师范大学的中学语文教材语料库、北京语言大学的现代汉语词频统计语料库。语料库建设初有成效。但在同一时期,国外在进行语料统计时,所用语料规模远远大于我国。我国语料库建设落后于世界。
2.2. 国际中文教学相关语料库研究
在国际中文教学研究中,使用统计学方法对特定语料进行定量分析,可以发现语言的实际使用规律,揭示语言最典型的特征,进而启发国际中文教学。在国际中文教学中,收集汉语作为第二语言教学和习得相关研究所需的语料,一般会用到三类语料库:汉语母语者语料库、汉外平行语料库及外国人学汉语的中介语料库。
汉语母语者语料库可提供汉语母语者对特定项目的使用情况的真实材料,区分汉语语言项目的差异,为相应内容的教学提供帮助。较典型的汉语母语者语料库有北京大学CCL现代汉语语料库、北京语言大学BCC语料库、国家语委现代汉语语料库、北京语言大学口语语料查询系统、中国传媒大学有声媒体文本语料库、新时代人民日报分词语料库等。
汉外平行语料库收录了大量汉外跨语言对比材料,可为研究者提供同一语言项目在不同语言中表达形式的异同,进而研究者能有效预测在教学中二语学习者可能会出现的偏误,并提前准备相应的教学对策,提高国际中文教育的效率。具有代表性的汉外平行语料库有北京大学CCL汉英双语语料库、清华大学中英平行语料库、二语星空英汉双语平行语料库、《红楼梦》汉英平行语料库等。
汉语中介语语料库包含大量将汉语作为二语习得的学习者的语料,为研究者提供了习得研究与偏误分析的真实语料,有利于研究者得出二语习得者对语言项目的习得顺序,进而指导教材编写与教学课程安排。常见的汉语中介语语料库有全球汉语中介语文本语料库、北京语言大学HSK动态作文语料库、中山大学汉字偏误标注的汉语连续性中介语语料库、台湾师范大学汉字偏误库等。
杨慧中曾指出,语料库具有极强的应用性与实践性,与外语教学具有直接关系,“对真实语言交际的各个方面,包括词汇的、句法的、语义的、语用的、语篇的”可产生实质性的影响。以上语料库各有特色,学习者与教学者可各按所需选用语料库[4] (p. 421)。
3. 语料库对于国际中文教学的多方面作用
3.1. 宏观层面
语料库在语言教学中发挥着重要的作用,对教师的教学安排、学生的成绩测试设计以及汉语教学模式、智能化汉语教学系统和远程汉语教学设计等产生了积极的影响[5] (p. 131)。近年来,关于国际中文教育的语料库发展取得了一定程度上的成就,但基于语料库进行国际中文教育的研究和应用尚未形成体系。
3.1.1. 语料库对国际中文教学理念建设的作用
汉语中介语语料库建设的目的是为国际中文教育与研究服务[6] (p. 19)。1995年“汉语中介语语料库系统”研制成功,其中收录了大量汉语二语学习者的语料,为偏误分析和习得研究提供了丰富的真实材料,填补了汉语中介语研究方面的空白,在国际中文教育领域当中取得了开创性的成果,其后以“全球汉语中介语语料库”、“HSK动态作文语料库”为代表的多个语料库相继建成。
随着对语料库的探索逐渐深入,许多学者开始对现有语料库进行反思、质疑,如扩大汉语中介语语料库语料来源途径[2] (p. 98)站在已有的研究基础上提出建设全球汉语学习者语料库的设想[7] (p. 9)。郑艳群从应用汉语中介语语料库的偏误分析角度总结出外国人学习汉语的规律,根据这些规律我们可以提出相应的教学建议[5] (p. 136)。周小兵在“全球汉语教材库”的基础上制成汉语文本指难针在线分析软件以及汉语字词档案在线分析软件,实现教材语料的字词分析以及教材文本语料的定级、评估[8] (p. 130)。许多学者在现有工具书的基础上进行研究时发现许多词语的解释并不明晰,沈敏、范开泰基于国家语委语料库对“赶紧”“赶快”“连忙”这一组近义词进行辨析,揭示其句法功能、语义特征、时体特征及其使用语境的异同[9] (p. 52)。将语料库的研究与教材编写相结合,我们可以通过对语料库的研究来发现不同母语背景的学生的学习特点,将其与汉语进行对比,所得结果可用来指导国别化教材、双语词典的编写。但近年来关于如何把国际中文教育的研究成果转化为教学资源的相关研究并不广泛。
3.1.2. 语料库对国际中文教学资源开拓的作用
何常丽在语料库与语言教学的研究中指出,课本中所教授的内容与讲本族语的人所真正在日常生活中使用的语言存在着较大的差异,有些课本会忽视一些重要的内容却又过分强调一些不常用或已过时的用法,如《HSK标准教程》中仍将DVD作为对话练习的词语[10] (p. 150)。而如果教师运用语料库对当中的语料进行分析,就可以发现哪些表达是人们日常生活常用到的,能够有效减少语言教学中的盲目性。
许葵花、张卫平和陈建生等学者指出语料库也为编写教材和确定教学重点提供了数据支撑[11] (p. 22)、[12] (p. 61)。2009年,国家汉办与中山大学共同建立“全球汉语教材库”,该教材库提供国际汉语教材信息的在线查询服务,为国际中文教育资源提供了夯实的基础。
在实际教学当中,语料库可以帮助教师进行教学资源的筛选,并可以辅助教师进行词汇、语法、口语等多方面教学。例如四川师范大学国际中文教育学院在教授留学生时就使用了多种语料库进行辅助教学,语料库为国际中文教学提供了真实、丰富的语言材料,使教学更加贴近实际语言使用情况,同时教师根据教学目标和需求,从语料库中筛选出合适的语料,进行加工和整理,形成具有针对性的教学材料和练习,以帮助学生巩固所学知识,提高语言应用能力。
我们不仅仅应该把语料库看作是一种有助于教师决定教什么的资源,而且还应该把它看作是一种学生直接可以从中学习的资源。通过对学生使用语料库的情况进行分析和评估,教师可以了解学生的学习进度和存在的问题,从而及时调整教学策略和方法。这有助于实现个性化教学和精准教学,提高教学质量和效果。肖忠华、许家金等学者指出,在语料库的背景下,可以运用3I教学法,将“教语料库”归为学生学习的一环,指教给学生如何研究语料库,让学生从接受者转变为学习的主导者(即发现式学习) [13] (p. 55)。
3.2. 微观层面
3.2.1. 语料库在教学模式创新中的作用
在教学中应用语料库有利于提高语言教学的质量、丰富语言教学形式。国际中文教学和研究的相关观念应该更新,几十年来一直延用“语文并进”的教学模式,几乎没有教学改革意向,多年来把英语为代表的二语教学理论作为汉语教学研究的依据,而忽视汉语的独特性,缺乏具有特色的教学模式[14] (p. 5)。在教学时将语音、语法、听力、阅读、写作等课程的学习齐头并进,并未考虑汉字形态带来的阻碍和拼音带来的便利,同时汉语的语音教学也有一定的特殊性,如声调、儿化、舌尖音的辨别,这些都是汉语教学中的重点和难点。要进行教学模式的改革,在教学当中我们就必须要解决三个基本问题:“教什么、怎么教、怎么学”。
而不同的语料库将对国际中文教学起着不同的作用。汉语中介语语料库的建立为汉语语音教学填补了空白,将具有汉语特点的语音属性加入中介语语料库之中,为国际中文教学提供丰富真实的音频语料。周小兵认为,可以使用“目标语语料库”考察“教什么”,如当学习者使用中介语进行表达时,可以通过语料库知道所说中介语与目标语母语使用者的异同[8] (p. 128)。用“国际汉语教材语料库”考察“怎么教”,如使用国际汉语教材语料库统计教材中对于目的语的呈现情况,分析教材和教学可能对学习产生什么样的影响。用“学习者母语语料库”考察“怎么学”。如将学习者的母语与目标语相对比,观察其异同,把握其正负迁移的情况。
国际中文教学的最终目的是培养学习者能够正确地运用汉语进行言语交际,所以在国际中文课堂教学时,我们会进行大量的口头交际练习,我们可以利用相关语料库进行练习素材的选择,以让学生能够学到地道的汉语,保证其交际价值。同时我们也可以运用“中介语语料库”更加全面系统地观察第二语言学习者的习得规律,在中介语语料库的基础上建立偏误分析,预测和纠正学生的言语错误。
3.2.2. 语料库在词汇教学中的作用
吴福焕等指出:“建设语料库的其中一项核心用途就是梳理和描述语言的基本使用规律,找出语言成分(如:字、词、句、篇)的基本形态、搭配、使用范围和使用方法等。”[15] (p. 42)国际中文教学语料库在词汇方面,尤其是平行语料库,对学习者与教学者的帮助极为突出,一方面有利于教学者了解汉语与学习者母语在具体语言项目上的异同,调查不同背景的学生的语言特征,在教学前提前预知其偏误,另一方面有利于学习者在学习过程中自觉查询某一语言成分的使用,并在大量语料的输入中,对比其在不同真实语境下的不同含义或不同用法。
以上谈到语料库对词汇教学最典型的两个影响:一为学习者提供高频词表与本族语者相对常用的表达,二为帮助学习者避免母语负迁移产生的表达[16] (p. 220)。笈文婷还曾提到:“随着语料库介入词汇研究,词汇教学早已不仅仅局限于发音、形式、语义,词汇学习的深度及宽度都得到了很大的拓展。”[17] (p. 36)词义辨析、词语搭配、语义韵等方面都有所涉及。例如,我们可运用《三国演义》汉英平行语料库,对“对”字的含义进行深入探讨,通过中英文对比,加深学生对“对”这一同形多义字的不同含义的理解与记忆。语料库扩展了词汇教学范围,增加了学习者学习词汇的深度与广度,国际中文教学的效率得以提升。
3.2.3. 语料库在语法教学中的作用
在国际中文教学中,语法教学是重要的一环。在以往的课堂上,演绎法与归纳法是国际中文教师常用的方法,李征娅指出:“许多研究表明传统的演示–操练的模式已经得不到支持,而运用电脑语料库来描述和分析语言结构,不仅使语法教学重新得到重视,并且从另一个更为全面、客观的角度来界定语法教学。”[18] (p. 44)在对某一具体的语法点进行教学时,教师可在语料库中找到与该语法点相关的语料文本,并将其作为课堂教学中的案例,引导学生观察该语法点在使用中的各项特征,把学习者自己对语法现象的发现作为学习的焦点,培养其语法意识,加深其对语法点的掌握程度,并提升其学习的主动性。
与此同时,教师通过分析学习者语料库中的语料,可推理学生的习得,在以学生为中心的研究中充当指导者、协调者,在语料库中检索出典型的母语负迁移现象,预先推测学生可能会出现的问题,为解答其在学习中的疑惑做好准备。除此之外,基于语料库对某词展开研究,通过词频统计,我们能发现其句法功能的演化倾向。在进行国际中文教学时,须注意其使用的倾向性。
3.2.4. 语料库在语用教学中的作用
近年来,国内外基于语料库的话语研究的成果数量在不断增加,语料库与话语研究相结合已经成为语料库研究的最新热点。笈文婷提到:“目前与教学相关的研究主要集中在基于语料库的二语语用研究和话语标记语研究等方面。”[17] (p. 36)但此处所提教学为英语教学,与国际中文教学相关的研究近乎为零。
许葵花、张卫平曾谈到,教材中的内容与现实中的用语往往有较大差异[11] (p. 21)。若国际中文教学仅仅停留在运用教材进行教学,则学生很难在现实生活中运用汉语实现无障碍交际。语料库提供了大量口语和书面交际的真实材料,将这些语料应用到教学中,学生可自由探索地道、实用的表达,解决真实交际问题。闫萌萌,马文韬还指出:“语料库驱动的外语教学,确保学生接触到最新的语言现象,并且帮助学生避免不当的语用失误,增强学生正确使用语言的意识。”[16] (p. 221)例如,在北京语言大学口语语料查询系统中,我们不仅可以查询到具体的口语语料,还能查询到该语料的说话人属性与话题,学习者可在如此真实的语境中进行学习,其对语用的掌握将更加深刻与准确。国际中文教学语料库为在国外学习汉语、远离真实语境的学生提供了便利,让学生真正面对交际语言。
4. 国际中文教育语料库建设存在的问题
4.1. 现有语料库的不足
4.1.1. 语料库语料采样不平衡
语料库的平衡性指“构成特定语料库中各部分语料的类型和比例相对适当,以满足语料库建设和使用中的合理性和可靠性等方面要求”[19] (p. 120)。语料的采集是国际中文教学相关语料库建设过程当中十分困难的一项工作,将汉语作为第二语言的学习者来自不同的国家和地区,不同的母语、不同的学习能力所产出的语料都是不同的,其中语料的国家和地区分布不平衡的问题最为突出,在我们常见的语料库如“HSK动态作文语料库”也存在这样的问题,该语料库虽然覆盖一百个国家和地区,但其语料的国别分布差异巨大,东南亚留学生的语料较多,而欧美国家的留学生语料较少。针对这样的问题我们可以积极采取相关措施,如邀请国外教学的相关教师参与语料库的建设,外派高校教师与当地高校进行合作采集或合理利用海外孔子学院的平台进行常规收集。
4.1.2. 语料库软件处理技术不成熟
国内语料库在软件处理技术方面都不够深入,应用系统缺乏多样化的功能,大多只能提供简单的检索功能,但这远远无法满足语料库在教学上或在其他方面的应用,比如在语法标注、分词、字句对齐、对比分析等方面都仍有欠缺,大部分语法标注仍需要人工来进行,在庞大的语料面前这样的处理方式效率是十分低下的,不同语言之间的语法、词汇、文化背景等差异使得语料信息更为复杂。语料库软件处理的优化升级离不开计算机等先进软件技术的辅助,针对多样化的语料库可以对应开发多模态的数据处理技术和工具,可以采取开放数据共享和合作的方式吸引更多研究者参与到语料库处理技术的改进和创新当中。
4.1.3. 与国际中文教育相关的语料库规模小、类别少
由以上内容可知,可直接应用到国际中文教育的语料库数量较少,且目前国内规模最大的国际汉语教材语料库,中山大学国际汉语教材语料库,仅有500万字。总体而言,与国际中文教育相关的语料库建设规模有待提升。与此同时现有类别的语料库相互较为独立,且并未完全覆盖国际中文教育在教材编写、实际教学等方面的需求,在国际中文教育这一领域,亟待综合性、大规模的语料库的出现。
4.2. 现有语料库在国际中文教学应用中的不足
现目前,关于语料库的研究与建设与其实际在国际中文教育中的运用有了进一步的发展,但这之间仍有较远距离,一方面,与国际中文教育相关的语料库本身完成度不高。另一方面,语料库在标注、分类以及语境呈现等方面存在不足,使得这些语料库难以直接应用于课堂教学。
4.2.1. 适应性不足
尽管语料库在语言学习和教学当中有一定的运用价值,但并不能完全满足教师和课堂的使用需求。不同国家和地区的中文学习者在文化背景、学习习惯等方面存在着很大的差异,而现有语料库在内容及检索分类上并未有区分,缺乏针对不同学习者群体的定制化内容,使得这些语料难以直接应用于课堂教学。同时,在国际中文教育当中我们的教学目标涉及多个领域,如口语、听力、阅读等,每个领域的教学目标和内容都有所不同,而现有语料库如BCC语料库,虽然拥有丰富的语料资源,但其语料过于泛化,缺乏针对特定教学目标及学习者的分类,其中大量复杂的句子和词汇是难以适应初级学习者的需求的。
4.2.2. 完成度不高
现有大部分语料库并不是专门针对于国际中文教育而建设的,使得教师在运用这些语料库进行教学时往往需要进行大量的二次加工才能将语料库中的语料转化为适合课堂教学的材料,这无疑增加了教师的工作量,与通过语料库寻找语料以节省备课时间的初衷相悖。如中山大学留学生口语语料库,可以用来帮助教师分析留学生口语特点、常见错误,但其中缺乏真实的对话场景和语境信息,导致学生在学习中难以接触到真实的语言运用环境,不能满足多样化的教学需求。且语料库的标注和分类较为模糊,教师在使用时难以快速定位合适的教学材料。
5. 结语
本文就语料库运用于国际中文教学的情况展开调查,从语料库建设情况、语料库对于国际中文教学的多方面作用、国际中文教学语料库建设存在的问题展开阐述。在此前,少有学者对此进行研究。语料库起步于上世纪八十年代,近年来发展较快,与国际中文教学相关的语料库有汉语母语者语料库、汉外平行语料库及外国人学汉语的中介语料库,其在国际中文教学理论建设、教学资源开拓等宏观层面与教学模式创新、词汇教学、语法教学、语用教学等微观层面产生重要影响。但现目前语料库仍存在语料采样不平衡、软件处理技术不成熟、利用率低下、规模小、类别少等问题,在国际中文教学中,语料库适应性不足且完成度不高,国际中文教学语料库的发展任重道远。在此后的研究中,笔者将重点关注语料库在具体教学中的使用,并探索出其在国际中文教育行业的独特应用模式,突破语料库仅对英文教学产生广泛积极作用的局面,提高语料库在国际中文教学中的应用率。由于笔者能力有限,无法更详尽、更具辩证性地讨论此课题,研究较为浅表,因此欢迎大家指正。
致 谢
本论文为大学生创新创业训练计划《国际中文教学语言点语料库建设运行项目》(编号S202310636112)成果,论文由四川师范大学国际中文教育学院学生蔺微涵、罗心悦在通讯作者四川师范大学王飞华老师指导下完成,特此致谢。
NOTES
*通讯作者。