Black background illuminated by swirls of light, numbers nd letters

语言技术的未来:机器翻译的未来

机器翻译将进一步发展,如果运用得当,会在提高翻译效率方面发挥更大的作用

本文是“语言技术的未来”系列的第三篇,该系列探索了技术发展在语言交付方面带来的变化。

由于创建的内容量前所未有地增多,企业不得不寻找方法来快速高效地翻译其文本。机器翻译 (MT) 得到越来越广泛的应用,但远未达到相当成熟和完善的程度。机器翻译译文质量低下一直是长期存在的问题。不过,改进后的机器翻译将能为您切实优化本地化工作。 

我们将在下文中探讨影响机器翻译发展的因素,并阐释如何充分利用这项技术来制定卓有成效的本地化战略。

什么是机器翻译 (MT)?

机器翻译是指将源语言材料自动翻译成目标语言,无需人工翻译。尽管机器翻译对大众而言是一个相对较新的概念,但实际上它已有数十年的发展历史。 

SYSTRAN 是 20 世纪 60 年代末最早开发机器翻译系统的公司之一。该公司与美国空军合作,在冷战期间帮助其翻译情报材料。二者合作的目标是尽可能提升机器翻译内容的质量,从而让人工译者能够理解文本含义并轻松加以润色。早期的机器翻译引擎使用基于规则的方法,即需要依赖于人为制定的规则或借鉴字典规则来执行翻译。此后,语言技术不断发展完善。  

影响机器翻译发展的因素有哪些?

统计模型和混合引擎

20 世纪 90 年代是机器翻译发展的一个重要时期,当时 IBM 等公司开始在机器翻译中使用统计模型,翻译质量得到显著提升。统计机器翻译引擎在当时是一门新兴的技术。此类引擎专注于使用先进的统计方法和互联网上的大量数据来翻译日渐增长的内容。随后,Google 大规模部署这项技术,以期实现所有人类知识的可搜索化。  

早期的统计机器翻译引擎要远远优于基于规则的翻译引擎,但是其生成的译文仍然存在很多错误。因此,企业开始尝试使用混合机器翻译引擎,这种引擎通常是将统计机器翻译和基于规则的机器翻译相结合来生成译文。这些发展促进了机器翻译技术的普及和在全球范围内的采用。 

神经网络机器翻译

2017 年,随着神经网络机器翻译 (NMT) 的出现,机器翻译又实现了一次重大的技术飞跃。神经网络机器翻译借助人工智能 (AI) 的强大力量,并利用神经网络生成译文。 

与上文中提及的方法有所不同,神经网络尝试模仿译者的思维过程,而不是“猜测”可能的译文结果。因此,神经网络机器翻译能够生成看起来更加自然流畅的译文,可以更准确地呈现语句的含义和细微差别。这一发展很好地改善了机器翻译,使其不仅能够用于处理大量文档,帮助人们理解文档和把握其核心含义,还可以用于处理不是很重要的常规业务文档。 

神经网络机器翻译解决了机器翻译长期存在的一些缺点,比如自动翻译的可读性差以及与某些语言(如韩语)的不兼容问题。行业对神经网络机器翻译的探索并没有就此止步,相关研究仍在继续以不断完善这门技术。要了解有关神经网络机器翻译的详细信息,请阅读我们的博客文章《神经网络机器翻译:人工智能在语言翻译中的作用》。  

Smiling man looking at laptop screen

神经网络机器翻译的改进程度如何?

Lionbridge 研发团队估计,神经网络机器翻译正以每年 3% 至 7% 的比率不断发展和完善。我们的专家通过一种被称为“编辑距离”的标准来衡量改进。编辑距离会计算为使最终的机器翻译译文达到如同人工翻译般的高质量水准,人工译者必须对机器翻译输出执行多少次编辑。

随着翻译服务需求的增加以及机器学习在自动训练神经网络机器翻译引擎方面越做越好,神经网络机器翻译将不断进步和完善。

提高神经网络机器翻译未来采用率的推动因素是什么?

随着需要本地化的内容量呈爆炸性增长,神经网络机器翻译在未来将以更快的速度得到更广泛的采用。

新冠肺炎疫情加速了许多企业的数字化转型,也催生了对翻译服务的更多需求。同时,内容需要更具针对性和更加多样化。这些市场条件使人们在对某些内容进行本地化时更倾向于使用机器翻译,有时甚至可以不需要人工翻译监督。

人工翻译监督通过机器翻译后期编辑 (MTPE) 来执行,MTPE 是结合机器翻译和传统人工翻译的混合流程。它在机器翻译流程之后,增加一道后期编辑流程来提高译文质量。我们的博客文章针对什么情况下应结合使用机器翻译和后期编辑这一问题进行了探讨。

神经网络机器翻译的广泛采用对翻译服务有何影响?

借助神经网络机器翻译,企业至少可以就某些语言获得更经济实惠的翻译服务。由此带来的成本节约将使企业能够开发更多目标市场,并帮助他们更快地将其产品推向这些市场。

随着神经网络机器翻译的广泛应用以及全球经济的数字化转型,将会出现竞争更加激烈的市场环境。终端用户会越来越希望以其母语来接收产品信息。对于企业而言,在所有市场中满足用户的这种期望将成为常态,而非偶然情况。

自动化工具包:什么是翻译记忆库?

机器翻译并不是自动翻译工具包中的唯一工具。翻译记忆库 (TM) 是机器翻译的重要前身,并将继续服务于本地化工作。我们往往会将机器翻译和翻译记忆库结合使用。不过,翻译记忆库的作用将发生转变。

翻译记忆库是 20 世纪 90 年代初开发的存储以往翻译内容的数据库,可以帮助企业减少新内容的翻译工作量。

翻译记忆库技术是通过计算机辅助翻译 (CAT) 工具或翻译记忆库工具(TM 工具)实现的。这些工具允许协同处理同一项目的多个译者重复使用该项目中已经翻译过的单词或短语。

翻译记忆库使得企业能够:

  • 统一术语翻译的一致性
  • 降低成本
  • 提高翻译流程的速度和效率

从以往的经验来看,翻译记忆库在节省成本方面发挥着至关重要的作用。

Woman wearing glasses and sitting on couch looks away from her laptop

机器翻译和翻译记忆库有何不同?

尽管机器翻译和翻译记忆库均可以实现翻译流程的自动化,但是二者之间有着本质上的区别。 

翻译记忆库是以往翻译内容的存储库或数据库,因此它是通过将整个句子或句子片段与源文本进行匹配来生成译文,这是一种相对被动的功能。相比之下,机器翻译是一种更为复杂的技术。机器翻译借助以往的翻译内容和各种自然语言处理技术,主动地尝试猜测源文本可能的译文。

这两种技术是相辅相成的。它们共同提升了译者的翻译速度和工作效率。并且,有助于解决术语一致性等质量问题。通过将这两种技术紧密结合,可以提供更高质量的译文。 

机器翻译和翻译记忆库技术如何实现共同发展? 

在过去几年里,企业已经开始结合使用机器翻译和翻译记忆库进行翻译。在实施这一措施的过程中,企业重点关注这些技术的执行和有效实施。

由于机器翻译的效率要远远高于翻译记忆库,并且根据定义,机器翻译也是基于某种翻译记忆库而产生,因此这两种技术正在日益融合。机器翻译正逐渐成为主要的翻译生产工具,已被深度集成到许多翻译工作站中。 

随着机器翻译技术成为翻译与本地化行业中应用的主要生产工具,翻译记忆库的作用将会发生改变。翻译记忆库将逐渐从之前简单的译文数据库转变为机器翻译引擎的训练工具。 

机器翻译的优势是什么?

无监督机器翻译是指在没有人工译者参与的情况下完成机器翻译,最适合翻译读者有限且相对简单的文本。传统上,它会应用于用户生成内容的翻译,比如评论、论坛和购物网站(如 eBay)。机器翻译能够就某些语言出色地完成简单的常规业务文档翻译。当然,这种“出色”是相对的,具体要看您对翻译质量的期望、内容类型和内容的用途。机器翻译的使用越来越广泛,为更多的企业带来与翻译记忆库类似但却更为显著的诸多优势,比如:

  • 能够更快地将内容投放到市场中
  • 统一术语一致性
  • 提高译者的工作效率
  • 降低翻译的成本

非常值得注意的一点是,译者是一种有限的资源。译者借助机器翻译可减少在某些任务上花费的时间,从而能将更多精力投入到更多其他项目之中,随着越来越多的公司争相获取他们的翻译服务,机器翻译也将缓解翻译市场的压力。 

在某些情况下,机器翻译能够将译者的效率提升 3 至 5 倍,从而可以在较短的时间内完成更多内容的本地化。随着生产效率的提高和成本的降低,企业能够将更多的内容翻译成更多的语言。 

机器翻译技术如何帮助您制定卓有成效的本地化战略? 

在制定内容战略和确定目标市场时,需考虑的重要一点是现代机器翻译及其相关技术带来的效率提升水平。

与经验丰富的本地化服务提供商 (LSP) 合作有助于您更好地利用机器翻译并出色地获得理想的优质译文。重要的是,开展这种合作可以让您更好地创作和改进内容,并制定更加有效的市场投放战略。包括 Lionbridge 等在内的一些 LSP 正不断拓展其在数字营销领域的业务,帮助企业管理其整体内容流程,而不仅仅是提供本地化服务。 

在强大的本地化合作伙伴的指导下,精心规划并顺畅执行的本地化战略将帮助您充分利用机器翻译技术的所有优势。这也将帮助您释放更多资源来创作更多内容和/或以相同的预算将内容投放到更多市场。 

单击下图了解有关机器翻译的重要定义。 

联系我们

要了解有关我们所有的机器翻译服务的详细信息,请下载我们的《机器翻译》白皮书 。如果您想要了解如何确保在机器翻译、翻译记忆库和人工翻译之间保持适当平衡,请联系我们。

  

请输入企业邮箱地址
勾选以下复选框即表示,您同意接收我们的营销电子邮件。您将收到 Lionbridge 提供的有关语言服务前沿思想、最佳实践和市场趋势的信息。

如需取消订阅以及了解我们如何处理您的个人数据,请参阅我们的隐私政策

linkedin sharing button
  • #retail
  • #translation_localization
  • #resources
  • #blog_posts

Kajetan Malinowski 和 Janette Mandell
作者
Kajetan Malinowski 和 Janette Mandell