You need to enable JavaScript to run this app.

机翻测评 | 如何快速解决数字翻译痛点?

最近更新时间2021.09.17 10:34:46

首次发布时间2021.09.17 10:34:46

我们在学习、工作时常常需要翻译数字,这项工作对于准确度的要求极高——“差之毫厘谬以千里”,商业条款中如果翻译错一个数字,可能会带来成千上万的损失;建筑图纸中一个数字翻译的疏漏,就可能导致一项庞大建筑工程轰然倒塌。值得注意的是,想要保证数字翻译的准确度,远不是誊写一串阿拉伯数字再翻译单位这么简单。

数字翻译哪里难?

以日常生活中比较常见的语向——中英语向为例,中英数字翻译可大致分为以下几类:需要换算数词的翻译、数词组成的常用短语翻译、概数的翻译、倍数的翻译等。其中 换算数词的翻译 最为棘手:中文的“百、千、万、十万、百万”和英文的 "hundred, thousand, million, billion, trillion" 的转换不仅是广大英语学习者的痛,就连一些英语翻译从业者及英语编辑面对庞大数字也会咬牙切齿。

数字翻译对翻译者关于目标语言数字表达的理解要求较高,加上数字翻译工作容不得一点差错,如今大多数翻译工作者都会求助于机器翻译来完成数字翻译。那么,是不是所有的机器翻译引擎都可以胜任此任务呢?

image

测评对象及测评计划

测评对象:

本次测评仅供探究、学习,因此不公布具体机器翻译引擎产品名称。由于篇幅有限,本期我们仅分析 友商A、友商B和火山翻译 的英译中情况。

测评标准:

本次评测仅比对数字翻译效果,因此我们重点关注 准确性 :不能出现错译、增译、漏译、过译、欠译现象。

测评内容:

本次测评主要观测机器翻译引擎对 英文数字单位 的转化,将评估在不同「英文数字单位」、「小数位」的情况下机器翻译引擎的数字翻译效果。

不同英文数字单位

image

以上翻译可见 友商A 对 thousand 的含义有夸大嫌疑;而 友商B 翻译的方法也稍微随意了一点:直接把 "thousand" 替换成了“万”,把 "million" 译成“百万”直接加在数字后,将 "billion"用“亿”代替。 火山翻译 关于thousand, million, billion, trillion 的翻译表现都不错,数字准确且表述符合中文习惯。

image

image

不同小数位

image

image

当小数位变多以后一些引擎更转不过弯了……两位友商“情急之下”时而采用直译方法:用“千”替代 "thousand"(然而中文里我们从来不会说“一百二十三千”),时而还顺带把小数点去掉(13.4752 thousand→134752万)。相比之下火山翻译表现还是比较稳定的。

根据以上评测结果,友商A与友商B在翻译需要换算的英语数词或小数位较多的小数时,会出现错译的问题,而火山翻译翻译结果比较理想,也符合中文表述。

数字的精准度在医疗、商务、外交等场景都尤为重要,一点疏漏都可能带来极大损失。而不同语言关于数字的表达不尽相同,这增加了信息在不同国界传递的难度。

火山翻译一直致力于提升信息互通水平,数字翻译也是我们非常重视的优化方向。如果想要获得准确的数字翻译结果,火山翻译会是一个不错的选择。