1. 引言
语料库是一个借助计算机技术,专门收集一定规模真实语言材料的语料集合。研究者可应用语料库开展相关的语言理论及应用研究。随着计算机技术的发展,现代语料库显露出勃勃的生机,语料库的研究方法已经应用到语言学领域的各个方面。
然而,俄罗斯对现代语料库的研究相对较晚,直到21世纪之前,俄语没有一个可供世界俄语研究者访问的语料库。目前,真正面向公众开放使用的俄语语料库仅有四个:图宾根俄语语料库(ТК)、20世纪末俄语报纸语料库(КГТ)、赫尔辛基标注语料库(ХАНКО)和俄语国家语料库(НКРЯ) [1]。受到俄语语料库发展的限制,国内俄语学界关于语料库的研究较为薄弱。截至2021年12月31日,在中国知网上将主题限定为“语料库”和“俄语”时,仅检索出二百余篇文章。
本文选取中国学术期刊网络出版总库(CNKI)数据库中截至2021年12月31日语料库背景下国内所有俄语相关研究,借助文献计量软件CiteSpace可视化分析作者、探究机构、关键词等内容,以发现国内应用语料库进行的俄语相关研究现状和研究主题,国内俄语语料库建设的发展脉络,并对其进行评价。
2. 研究设计
研究旨在探索国内俄语学界对语料库进行的相关研究总体发文概况、语料库建设发展脉络,以及国内俄语学界应用语料库进行的相关研究热点分布。本文所用数据为CNKI数据库收录的与“俄语”和“语料库”有关的论文。借助中国知网的高级检索功能,输入主题“语料库”和主题“俄语”,截至2021年12月31日,国内涉及语料库的俄语相关研究文献共275篇,为符合“国内”这一研究限定范围,增强研究数据的严谨性,剔除了外文文献和其他无效文献后,最终共检索出261篇有效文献。其中有关俄语语料库建设的共29篇,应用俄语语料库进行研究的共232篇。
本文将261篇文献导入CiteSpace软件中,对作者和机构进行可视化分析,从而整体把握发文的概况;对29篇有关语料库建设的相关文献进行梳理,得出国内俄语学界对语料库的建设发展脉络,最后再次应用CiteSpace软件进行对232篇基于语料库进行俄语研究的文献进行可视化分析,节点选择为“关键词”,从而绘制出关键词聚类、共时网络和时区演变等可视化图谱,以便于了解国内俄语学界对语料库的研究现状和发展脉络,把握研究热点,并得以对国内俄语学界语料库的研究进行客观评价。
3. 研究结果
3.1. 整体发文概况
在CNKI数据库里,利用系统内自带的计量可视化分析已选文献得到:国内涉及语料库的俄语相关研究基本是由国家社科基金支持,可见国家对俄语前置词的研究十分重视。借助CiteSpace软件对261条数据选择节点类型(Node Types)为作者(Author)和机构(Institution)的可视化图谱分析(见图1、图2),发现国内涉及俄语语料库研究的学者较多,存在突出学者,比如周震、原伟。部分学者之间存在相互联系,但联系并不广泛。国内俄语语料库的研究机构主要有上海外国语大学、解放军外国语大学等,但研究机构之间几乎没有联系,缺少合作。
对261篇文献进行整体把握可得:语料库背景下,国内俄语相关研究主要分为语料库建设研究和基于俄语语料库所做的研究。下文将分析俄语语料库建设的发展脉络和基于俄语语料库所做相关研究的主要热点。
3.2. 俄语语料库建设的发展脉络
在261篇文献中,有关俄语语料库建设研究的共29篇,包括俄语语料库的介绍、标注研究和具体语料库的构建。
3.2.1. 俄语语料库的引入(1991~2005年)
1991年,王钢的《国外的语料库建设》一文中首次提到了“俄语库”,介绍了当时苏联正在进行的语料库的建设与研究 [2],这是俄语语料库首次进入中国学界。随后许汉成深化了俄语语料库的引介 [3],在辨析了“语料库”和“语料库语言学”概念的基础上,详尽介绍了莫斯科大学报纸文本语料库和俄语国家语料库,为当时中国学者了解俄语语料库提供了有益的参考。
3.2.2. 俄语语料库研究发展期(2006~2014年)
在对俄语语料库有一个整体了解后,国内学者开始关注俄语语料库的标注问题,宋余亮在概述了俄语语料库的研究后,从词法、句法、语义标注三个方面进行说明和对比,并重点探讨利用过滤器进行语义消歧的方法 [4]。这是国内首次对俄语语料库进行的标注问题研究。随后吕红周 [5]、陈虹 [6] 发展了俄语语料库的标注研究,吕红周 [5] 将语义标注研究扩展到俄汉双语语料库。在这一阶段,国内对俄语语料库的研究发展成俄语语料库语言学,王臻 [7] 总结了对2006年以前俄语语料库的研究现状,鼓励学者们开拓新的研究领域,不仅着眼于俄语语料库的引介和建设,更应积极应用俄语语料库进行相关语言和教学研究,这一时期,国内学者不再局限于单语语料库,将目光转向俄汉平行语料库。
总的来说,这一时期在对俄语语料库有一个基本了解的基础上,发展研究了俄汉平行语料库和语料库的标注问题,并出现了俄语语料库语言学这一独立研究方向。
3.2.3. 俄语语料库语言学研究繁荣期(2015~2021年)
这一阶段,国内学界继续发展了对俄语语料库的基本研究,张禄彭、孙爽梳理总结俄罗斯新型语料库建设情况,引进介绍了六类新型语料库:包括大型互联网语料库、声音言语语料库、视频多媒体语料库、开放式语料库、平行语料库、专门用途语料库等 [8]。李勤、常翔宇 [9] 系统分析总结俄罗斯学者关于语料库语言学的研究状况。
同时,国内学者也关注着各类具体俄语语料库的构建。这一时期具体俄语语料库的建设包括文学翻译、新闻评论和旅游地标等方面。事实上,早在2012年陈兵探索了高校林业俄语教学语料库建设问题 [10]。刘淼、邵青应用契诃夫短篇小说作品及其中文译本为语料构建一个俄汉文学翻译双语平行语料库 [11],为这一阶段具体俄语语料库的构建研究提供了参考。这一时期,国内部分学者通过构建小型词汇文本库来服务于基础俄语教学 [12]。
值得注意的是,这一研究时期出现了突出学者原伟,侧重俄汉可比语料库的构建研究,包括基于维基百科的俄汉可比语料库构建,并对这一语料库进行评估和应用展望 [13]。随后几年,发展了俄汉可比语料库的研究,将其应用于翻译 [14] 和情感分析 [15]。同一时期,他构建了俄汉大型动态网络语料库和俄语多模态情感语料库 [16]。
总的来说,这一阶段在深化发展俄语语料库的基本研究的同时,探索了各类具体语料库的构建和应用。
3.3. 研究热点
以关键词(Keyword)为节点,应用CiteSpace软件对232篇文献进行可视化分析,由此得到关键词共现图谱。将图谱中的关键词进行聚类总结,得到关键词共现与聚类图谱(如图3)。CiteSpace依据网络结构和聚类的清晰度,提供了模块值(Q值,即Modularity Q)和平均轮廓值(S值,Mean Silhouette)两个指标,当Q值 > 0.3时,聚类结构就是显著的;当S值达到0.7及以上就可认为聚类是令人信服的 [17]。在本次运算中,Q值 = 0.8784 > 0.3,S值 = 0.9646 > 0.7,因此该聚类图谱的聚类结构具有较强的科学性。
CiteSpace的“时区视图(Timezone)是另一种侧重于从时间维度上来表示知识演进的视图,它可以清晰地展示出文献的更新和相互影响” [17]。运行“Timezone View”选项,得到俄语应用俄语语料库的研究关键词时区图(如图4)在本次运算中,Q值与S值均超过标准值,因此该聚类结构可信度很高。
刘则渊、陈超美、侯海燕等 [18] 认为,通过一组突现的动态概念和潜在的研究概念能够解释某个学科的研究前沿,由此利用CiteSpace的突变检测功能 [19],绘制关键词突现图(如图5),探析其研究热点。
分析关键词共现聚类图(图3)能够得出:国内应用俄语语料库的研究则主要包括:俄语翻译研究、俄语教学研究、俄汉语义研究和俄语对比研究。以上四大主题各有发展又互相影响,不可完全割裂开来。通过关键词时区图(图4)和突现图(图5)可得:在不同时期内,四个主题的研究各有侧重,由此对四大研究主题进行时间脉络上的梳理和具体研究内容的分析。
3.3.1. 基于语料库的俄语翻译研究
如图5所示,2005年起就突现了关键词“机器翻译”,结合上文对俄语语料库建设发展脉络的梳理,可知自俄语语料库引入国内后,最先应用于俄语翻译领域。2005年于水 [20] 在中国首届“海峡两岸俄语教学与研究学术讨论会”上发表了有关俄汉机器翻译的几点看法后,他与王利众共同梳理了俄汉机器翻译发展的历史,展望了俄汉机器翻译的大好前景 [21]。武斌 [22] 发展了俄汉机器翻译的应用,做了面向俄文信息处理的机器翻译实验研究。但对俄语翻译的研究并不是昙花一现,从时区图(图4)和突现图(图5)中可以看到,直至今日,应用语料库进行俄语翻译研究仍是研究前沿,但目前的翻译研究侧重研究具体翻译问题,例如基于语料库的《政府工作报告》语言特点及翻译策略研究 [23]、基于语料库的现代汉语动结式“V了/动/得”的俄译研究 [24] 等。
由此可见,国内应用语料库进行俄语翻译的研究颇为积极,且研究内容广泛,从整体到部分,从一般到具体均有涉及。但我们也看到,应用俄语语料库进行翻译研究还有很大空间有待挖掘,这也是近年来应用语料库进行俄语相关研究的热点和趋势所在。
3.3.2. 基于语料库的俄语教学研究
时区图(图4)显示,关键词“俄语教学”几乎和关键词“机器翻译”同时出现,由此可知,自俄语语料库被引入国内后,国内学者就发现了俄语语料库对俄语教学的重大意义,并应用俄语语料库对俄语教学进行了探索。于丹红以одеть和надетъ为例,利用俄语国家语料库分析了俄语词汇教学法 [25]。而分析突现图(图5)可知,应用语料库对俄语教学进行的研究高潮出现在2013年后。这一时期众多学者将语料库应用于翻译教学、词汇教学和俄语测试等 [26] [27] [28]。国内学者并不局限于现有的语料库进行教学研究,近年来开始探索自建语料库来服务于教学实践。刘梦晨 [29] 探索了自建语料库辅助下的俄语教学。
可以看到,国内应用俄语语料库对俄语教学进行的探索不断深入和革新,但大体较为笼统,缺乏对具体教学问题的探索和深化。
3.3.3. 基于语料库的俄语语义研究
俄语语料库的性质和功能决定了基于语料库进行俄语语义研究必然是研究的重点。尽管在突现图(图5)中并没有语义相关的关键词突现,但从时区图(图4)可知,有关俄语语义的研究始终是重中之重,贯穿应用俄语语料库研究发展的始终。
因为语义是俄语翻译和教学的重难点,因此应用俄语语料库进行俄语语义研究往往与俄语翻译、俄语教学研究相结合。例如倪璐璐、朱英丽、董燕基于俄语语料库,以очень + рассердить为例,分析俄语“程度副词 + 情绪类心理动词”汉译副词语义指向,由此总结出这一结构的汉译理据,服务于俄语翻译 [30]。
当然,除了与俄语翻译和教学研究相结合外,国内学界基于俄语语料库对俄语语义进行了多视角的探索。
其一,传统语言学视角。该视角侧重语义理论本身,例如,李侠探索了配价理论和语义词典 [31],胡应祥对俄语言语类和心理类抽象名词进行语义配价研究 [32]。同时传统视角下,学者们应用语料库真实语料对俄语各类词的语义进行研究。包括感知动词、同义词、抽象名词、温度词和触觉词 [33] [34] [35] [36] [37] 等。
其二,认知语言学视角。该视角下,应用俄语语料库侧重对俄语词汇的认知语义研究。张凤 [38] 基于俄语国家语料库对俄语核心体态动词стоять进行认知语义分析。随着认知语言学的发展,应用俄语语料库对俄语认知语义的探索越来越多样化,包括语言文化场的构建 [39] [40]、隐喻研究 [41] [42]、观念阈 [43] 和认知模型 [44] 等。近年来,也有学者利用语料库对具体俄语词的认知语义进行了探索,田秀坤、原有玮 [45] 基于俄语国家语料库,通过分析俄语基本颜色词чёрный各义项之间的扩展和延伸机制,揭示其认知机制。
总的来说,应用俄语语料库进行语义研究成果丰富,视角多样,研究对象众多,与其他研究结合较多,联系密切。但是我们也能看到每一层面和视角的研究都是浅尝辄止,且基本是硕博论文,研究不够深入。
3.3.4. 基于语料库的俄汉对比研究
关键词“俄汉对比”“汉俄对比”自2005年突现后一直延续至今。可见基于俄语语料库进行俄汉对比研究是近年来的研究趋势。国内学界主要应用俄汉平行语料库进行俄汉对比研究。研究的主要层面包括类型学 [46]、传统语言学视角下词义对比 [47] 和俄汉认知语义对比。其中俄汉语认知语义的对比研究较多,选取一类词或某一具体词,应用俄语语料库大量科学的语料,发掘俄汉民族认知上的差异,并探索造成这种差距的原因 [48] [49] [50]。应用语料库进行俄汉对比研究主要服务于翻译 [51] 和教学。将基于语料库的俄汉对比研究服务于教学主要包括对俄汉语的教学 [52] 和国内俄语教学 [53]。
总而言之,基于语料库进行俄汉对比研究是一种更为科学的方法,也是俄语语料库应用的主要方式。作为应用俄语语料库研究的前沿,期待更多不同领域的学者使用语料库进行对比研究。
4. 研究评价
如上梳理了国内俄语学界语料库建设的发展脉络和应用俄语语料库所做相关研究的主要热点。国内俄语学界的语料库建设经历了“从外引入——研究标注问题——具体语料库的构建”的阶段。国内基于语料库进行的俄语相关研究包括翻译研究、教学研究、语义研究和与其他语种的对比研究。目前应用俄语语料库进行的研究趋向俄语翻译和俄汉对比,由此可对国内前置词研究的发展做出三点评价:
其一,国内相关研究学者众多,但突出学者较少,学者之间、机构之间需要加强合作与联系。
其二,目前俄语语料库相关的研究主要把俄语语料库作为一种工具进行其他研究,俄语语料库建设的研究基数小,包括语料库的标注和构建都较少。应借鉴英语语料库的建设经验,加强俄语语料库的建设研究,与计算机等领域相结合,进行跨学科发展。
其三,国内应用语料库进行俄语相关研究主题众多,涉猎广泛,且各种主题的研究结合地较好,但每一主题和视角的研究都不够深入,还有众多值得挖掘的研究空白;研究缺乏传承性,应用语料库进行的俄语相关研究都在“开新坑”,而不是“挖深坑”。因此需要需深入发掘应用语料库在俄语词义、翻译、教学和对比上的可研究之处,继承发展前期研究,也可横向学习英语语料库的应用研究,发掘俄语语料库在俄语相关研究上的可用之处。
5. 结语
在信息化和技术化的今天,语料库的发展以其独特的优势促进了语言学的发展,并很快成为语言学研究的前沿。俄语语料库虽引入国内较晚,但近年来使用十分活跃。CiteSpace软件为开展该研究提供了可靠的依据。本文梳理了国内俄语语料库建设的发展脉络、俄语语料库相关研究的主题和热点,发现了研究的不足,并提出相应建议,为相关研究的学者从不同研究视角了解该领域的研究现状提供了参考。由于本文文献搜索和解读过程中存在一定的片面性和主观性,今后的研究还可着眼于俄语语料库的国外研究情况,并将国内外研究现状相结合进行对比研究。
基金项目
海南大学科研启动项目(项目编号:kyqd(sk)1912)。