Binary code around and emanating from a globe

机器翻译正式语体和非正式语体

应用机器翻译时加强语言正式性控制,确保与全球受众建立紧密联系

试想一下,您正在向朋友描述一部有趣的电影。接下来,再试想一下您正在向一家大型公司的总裁讲述同一部电影。在这两个场景下,您是否会使用相同的语言表达?当然不会。人类擅长根据情境场合来选用符合时宜的语体。而机器翻译 (MT) 引擎通常无法灵活应对这种情况,除非使用其他辅助。

如果想要与您的目标受众建立牢固关系,则必须意识到 MT 的这一局限性,并采取相应措施来克服它。

什么是语言正式性?

语域或语言风格是指我们根据社会文化背景、习俗和沟通渠道使用语言的方式。换句话说,它可以展现我们表达自己想法时的语言正式程度。正如前文所述,在面对朋友与面对公司总裁时,我们的表达方式必定有所不同。

语言正式性(正式语体与非正式语体)可用于奠定特定语篇的基调。不同的写作风格、习语、代词变体和动词形态可能体现着不同的语言正式程度,具体因所用语言、所在国家/地区、面对的社会团体或专业环境而异。

如何确定书面内容需要何种语言正式程度? 

在撰写内容时,请先考虑清楚以下问题,从而帮助自己采用适宜的语体。

  • 我与受众沟通的意图是什么?
  • 我希望他们在使用我的产品时有何感受?

  • 他们是否有具体画像?

在将内容翻译成不同语言时,客户通常会为此创建语言风格说明,其中包括目标受众画像、项目的背景以及要求的语气和语言正式程度。

为什么机器翻译引擎难以使用合适的用语正式程度?

MT 引擎产出的译文很难确保前后一致的正式性。尤其是当目标语言的正式性区分细于源语言时,想要通过 MT 获得正确译文,则更是难上加难。 

这是因为 MT 模型在处理每个输入句段时,通常只能返回一种译文。当输入句段本身表意模糊时,模型必须在众多有效的译文版本中选出一种,而不会顾及目标受众的感受。

让模型在不同的有效译文版本中进行选择,就有可能导致译文不一致或译文正式程度不正确的情况。 

Geometric shapes and patterns on a dark background

为什么正式语体和非正式语体在翻译中至关重要? 

翻译内容必须要采用合适的语言正式程度。 

因为在某些文化背景下,人们可能会将用语正式程度不正确视为粗鲁无礼。但这并不意味着在所有情景下都要使用正式语体。在许多情况下,使用正式语言可能反而是错的,不是因为正式语言具有冒犯意味,只是因为不合时宜。此类错误会导致您与受众之间心生嫌隙。例如,在翻译电脑游戏和面向学生的程序时需要采用轻松随意的语气。 

在翻译过程中,如果公司花费时间与精力根据目标语言采取适当的语言风格,则很能说明他们重视客户。这些努力可能会吸引更多潜在客户。而与受众建立有效联系有助于您取得成功。

在翻译过程中,尤其是在使用机器翻译时,为什么很难针对受众采用合适的目标语言正式程度?

在翻译过程中,尤其是在使用 MT 时,很难针对受众采用合适的目标语言正式程度。将英文内容翻译成正式性区分更细的语言并通过语法语域体现出来时,问题可能会相应而生。 

不同的语言可能会通过不同的语法和词汇表达手段来体现用语正式程度。 

有些语言的用语正式性十分明确,例如西班牙语明确区分了 "tú"(你)和 "usted"(您),德语明确区分了 "du"(你)和 "Sie"(您),法语明确区分了 "tu"(你)和 "vous"(您)等。而在简体或繁体中文中也存在这种差异。韩语至少有六种正式性区分。在日语和其他语言中,可能会通过主要动词的形态以及某些名词、形容词、特定用词等形式区分用语正式与否。

在其他情况下,如在英语中无法使用代词来展现这些区别时,我们必须依靠上下文来表达不同的正式程度。 

MT 引擎无法一致地辨别前后文的语体风格,因此仅依靠上下文进行表达的方式让大多数 MT 引擎面临新的问题。 

应用机器翻译时可以如何控制语言正式程度? 

以下几种策略可以帮助 MT 系统生成正式程度不同的语言风格。

基于规则的方法

基于规则的方法可以根据所需的语言风格或正式性生成风格一致的机器翻译。 这些规则能够可靠地使用第三方系统返回的恰当翻译替换掉确定不需要的语言风格要素,同时保留源语言的含义。

不基于规则的方法 

不基于规则的方法可用于开发自定义机器翻译模型,以不断产出一致地使用所需语言风格或正式程度的译文。此方法可使用受监督训练和语料库中的礼貌用语标注来获取礼貌用语特征,  

其目标是获得经过不同数据训练而成的单个系统,该系统可以根据特定用语正式程度灵活地生成翻译。

Binary code in sunburst pattern

哪些商用 MT 系统可提供控制正式语体和非正式语体的功能? 

大多数 MT 系统不支持语言正式性或阴阳性参数。但是,部分引擎可提供此功能,并且我们预计对这些功能的需求会更胜以往。 

目前,DeepL (API) 和 Amazon(控制台和 SDK)都具备在有限语种翻译过程中控制语言正式性的功能。 

为了控制译文正式性,此功能具有三种选项:默认、正式和非正式。

在默认选项下,引擎不会更改神经机器翻译 (NMT) 译文的用语正式程度。正式/非正式功能允许用户在正式或非正式语气之间进行选择。具体来说,该功能用于设置翻译中使用的代词和相关词语。 

Lionbridge 通过哪些解决方案产出用语正式性适宜的 MT 译文? 

Lionbridge 的 Smart MT™,这是一款企业级机器翻译解决方案,能够将语言规则应用到目标文本中,让机器翻译也能够产出在语言风格和语言正式性方面都令人满意的译文。 

我们的专家正在维护一个新版规则数据库,这些规则会用于 MT 译文分析以控制译文用语的正式性。 

只要拥有足够的语料,我们即可将基于规则的策略与自定义机器翻译模型相结合,以取得理想结果。 

联系我们

如需详细了解 Lionbridge 的新一代机器翻译技术以及 Lionbridge 如何帮助您充分利用机器翻译,请立即联系我们

linkedin sharing button

作者
Yolanda Martin 和 Janette Mandell
  • #technology
  • #blog_posts
  • #translation_localization