Horizonal lines of varying thickness on a black background

自动化质量检查避免机器翻译为公司招致重大错误

运用自动化质量检查,避免重大翻译错误给公司造成严重损失

翻译实在是举足轻重。表意准确的译文可以让您有力触及使用不同语言的各个目标市场。越来越多的公司借机器翻译 (MT) 的东风扩大触及范围,向新市场进发,更快地为其受众提供更多翻译内容,然而这其中的风险也与日俱增,因为此方法很容易出现重大翻译错误。

MT 瑕瑜互见,其短处可能会对您的业务造成巨大损失,因此,了解这些短处并避免您的受众受其所害可谓至关重要。Lionbridge 等睿智的 MT 提供商可以在翻译期间执行自动化质量检查,筛查严重错误,在保证 MT 速度的同时减少对人工干预的需求。

机器翻译会出现哪两大类错误?

MT 系统可以从大量文本中学习,神经网络的出现也使神经网络机器翻译 (NMT) 成为现实,由此看来,MT 变得越来越可靠。尽管如此,MT 引擎仍然容易出错。以下是与机器翻译相关的两大类错误,其危害程度各不相同。

普通错误:什么是普通错误?是否应当留心?

在这两大类错误中,普通 MT 错误的危害程度相对较轻。目标语言中的这些错误与内容的语言特征有关。普通错误包括语法、拼写和标点符号错误。虽然母语人士能够轻易注意到这些错误,但它们一般不会给公司造成重大损失。

实际上,大量研究结果表明,最终用户愿意接受稍有瑕疵的译文。

针对 29 个国家/地区 8,709 名消费者的一项调查发现:

  • 65% 的消费者倾向于购买以母语提供信息的产品,即使产品内容含有一些错误
  • 在了解以其他语言提供信息的产品时,66% 的用户会借助在线 MT 工具
  • 40% 的消费者不会购买以其他语言提供信息的产品

(来源:“Can’t Read, Won’t Buy - B2C,”(看不懂就不会买 - B2C),CSA Research,2020 年 6 月)

许多应用场景都不需要十全十美的译文,在这些情况下,公司无需过度担忧偶尔出现的普通错误。

重大错误的严重性远远超过字词标点类的错误,因为这种错误会扭曲源文本的意思。这样就会产生虚假信息或造成误解,有可能让公司面临声誉、财务或法律方面的问题,还会危害公共安全或健康。

重大错误:什么是重大错误?是否应当留心?

重大 MT 错误,顾名思义,是非常严重的错误。包含重大错误的翻译内容一经传播,公司很可能要承担灾难性后果,

问题严重性远远超过字词标点类的错误,因为这种错误会扭曲源文本的意思。如果译文偏离源文本要传达的信息,则可能会传播错误信息,造成混淆和误解,甚至可能引发冲突。

例如,如果执法部门或医疗健康部门官员向公众发出的指令中有 MT 导致的重大错误,那么民众福祉可能会因此受到损害,政府机构的公信力也会因此丧失。公司如果偶然传播了包含重大翻译错误的内容,可能会在声誉、财务或法律方面受到负面影响。

哪些因素会造成重大错误?

重大错误源于 MT 引擎失灵。如果引擎不理解文本背景,比如说某单词有两个词义或源文本中有拼写错误,就有可能造成重大错误。如果引擎训练不当或使用了有缺陷的词汇表,就可能导致这类相同的错误反复出现。

之所以会发生重大错误,是因为 MT 引擎尽管精妙,但并不完美,机器不能像人那样进行判断。

城市摩天大楼夜景

经常出现的重大错误有哪些?

出现重大错误的情况有很多。在预测可能出现的重大翻译错误时,需要注意三类主要错误:关键元素错译、黑白颠倒和无中生有。

关键元素错译

关键元素错译是指在翻译专有名称(个人或组织)、重要数字或计量单位时所犯的错误。

如果某个专有名词同时也是普通名词,就很有可能引发误译。多年前,西班牙政府机构网站上就曾出现了这种情况导致的重大错误,引发了广泛关注。当时,政府部门的官方网站上没有出现部门负责人 Dolores del Campo 的名字,取而代之的是这个名字的英语直译 — It is pain of field(田野之痛)。

MT 引擎可能会翻译货币单位(例如将“日元”翻译成“美元”),但在处理数字时可能会忽视两种货币之间的汇率转换(例如将“5 万日元”直接翻译成了“5 万美元”)。这将导致重大错误,可能引发混乱并导致负面经济后果。

翻译测量单位时也很有可能出错。如果医疗文件以毫克为单位指定了一定的剂量,但引擎错误地将剂量转换为克,那么阅读译文的患者有可能读到错误的剂量信息,损害身体健康。这样一来,公司就需要对错误负责,还可能需要支付法律费用和损害赔偿金。

黑白颠倒

黑白颠倒是指目标文本与源文本表达的含义相反,这也是一项重大错误。

举个例子,MT 引擎将公司股东备忘录从英语翻译成西班牙语后,西班牙语译文表明股价下跌,而实际上,该公司的股价上涨。

无中生有

极少数情况下,MT 译文会增译源文中根本不存在的内容。我们将这种情况称为无中生有。如果发生了这类重大错误,说明 MT 引擎软件本身就存在问题。在某些情况下,引擎可能会生成冒犯性、亵渎性、攻击性或高度敏感的字词。

一串串珠状的橙色灯光交织在一起,在黑暗的隧道中通向一个明亮的出口

自动化方法如何防止机器翻译出现重大错误?

我们必须设法避免重大错误,以免您的内容遭到曲解。但这并非易事。如果计算机科学家能够对目前的 MT 技术加以改进,消除这些问题,那么公司出现重大错误的几率就会更低。但在此之前,我们可以利用自动化技术来识别翻译流程中的潜在问题,修改有问题的句子,更准确地表达句意。

Lionbridge 可以将 Smart MT™ 服务Smart Content 语言人工智能 (AI) 搭配使用,对译文进行特定的自动化质量检查,检测错误,同时保持 MT 速度,并更大限度地减少人工翻译人员进行译后编辑的需要。

这些自动化方法可以:

  • 通过在源文本中标识既是专有名词又是常用词的字词,检测人名或组织名称等专有名称误译
  • 结合使用监督式机器学习 (ML) 算法和冒犯性术语列表,检测冒犯性、亵渎性或高度敏感的词语
  • 通过识别原始文本或翻译文本中的否定词(但无法同时识别两处),包括单词 not 和其缩写形式 n't,检测原始文本和翻译文本相反的含义
  • 通过运用词典或冒犯性用词的词汇表检测译文中的冒犯性增译词 

自动质量检查并不能保证消除重大错误,它可能会遗漏错误,出现误判。尽管如此,这一流程依然能够帮助我们有效地发现问题。通过这种方法,我们可以让专业翻译人员重点处理带标记的句子,这样就不需要重新处理整个文档了。只要能够为专业翻译人员指出最有可能出现问题的地方,我们就能够提高本地化流程的效率。

联系我们

如需详细了解 Lionbridge 如何帮助您制定卓有成效的 MT 战略来避免重大错误,请立即联系我们

linkedin sharing button

Luis Javier Santiago 和 Janette Mandell
作者
Luis Javier Santiago 和 Janette Mandell
  • #blog_posts
  • #translation_localization