基于BLEU指标的机器翻译译文差异对比——以China Daily新闻为例
A BLEU-Based Comparative Study of Machine Translation Output Variations—A Case Study of China Daily
DOI: 10.12677/ml.2025.13101030, PDF,    科研立项经费支持
作者: 李 杭:上海海事大学外国语学院,上海;湛 军:上海海事大学经济管理学院,上海
关键词: 机器翻译新闻翻译量化分析Machine Translation News Translation Quantitative Analysis
摘要: 随着全球化进程的加速,机器翻译技术在跨语言交流中扮演着至关重要的角色。本文以China Daily新闻为源文本,选用Google Translate、DeepL、有道翻译、微软翻译四款机器翻译工具以及新兴翻译工具ChatGPT对中文和英文新闻进行翻译,并采用BLEU指标对译文进行量化分析。研究重点探讨不同翻译工具在处理中文和英文新闻时的表现差异,研究这些工具在处理不同源语言新闻时是否存在显著差异。结果表明,尽管不同翻译工具在BLEU值上的差异不显著,ChatGPT在中译英任务中表现略优于其他机器翻译工具,但在英译中任务中并未展现明显的优势。本文通过量化分析不同翻译引擎在新闻翻译中的表现并为实际应用中翻译工具的选择提供了实证依据。
Abstract: With the acceleration of globalization, machine translation technology plays a crucial role in cross-linguistic communication. This study takes China Daily news articles as the source texts and selects four mainstream machine translation tools—Google Translate, DeepL, Youdao, and Microsoft Translator—along with the emerging tool ChatGPT to translate Chinese and English news. The BLEU metric is applied to conduct a quantitative analysis of the outputs. The research focuses on the performance differences of these tools when handling Chinese and English news, examining whether significant variations exist depending on the source language. Results show that although the BLEU score differences among the tools are not substantial, ChatGPT performs slightly better than other machine translation systems in Chinese-to-English tasks, while it does not demonstrate a clear advantage in English-to-Chinese tasks. By quantitatively analyzing the performance of different translation engines in news translation, this paper provides empirical evidence and offers practical guidance for the selection of translation tools in real-world applications.
文章引用:李杭, 湛军. 基于BLEU指标的机器翻译译文差异对比——以China Daily新闻为例 [J]. 现代语言学, 2025, 13(10): 92-96. https://doi.org/10.12677/ml.2025.13101030

参考文献

[1] 何三宁. 再探翻译质量评估参数[J]. 中国翻译, 2012, 33(2): 27-31.
[2] 王华树, 张彦希. 技术视角下的翻译质量控制研究[J]. 语文学刊(外语教育教学), 2015(4): 1-5.
[3] 刘亚猛. 翻译质量评估的理想与现实[J]. 中国翻译, 2018, 39(2): 8-16, 128.
[4] 王金铨, 万昕, 董子云. 翻译质量评价方法及其在计算机翻译评价系统中的应用[J]. 中国翻译, 2018, 39(4): 73-78.
[5] 王均松. 翻译质量评估新方向: DQF动态质量评估框架[J]. 中国科技翻译, 2019, 32(3): 27-29.
[6] 王金铨, 牛永一. 计算机辅助翻译评价系统中的翻译质量评估[J]. 上海翻译, 2023(6): 52-57.
[7] 王金铨, 何泊稼. 基于神经网络模型的翻译语义质量量化评价[J]. 中国外语, 2024, 21(1): 92-101.