Binary code around and emanating from a globe

기계번역과 격식에 맞는 표현

글로벌 고객과의 굳건한 관계 유지를 위한 기계번역의 언어 격식 표현 조절

재미있게 본 영화를 친구에게 설명할 때와 직장 상사에게 설명할 때 같은 말투를 쓸 수 있을까요? 아마도 그럴 수는 없겠지요. 인간은 격식체와 비격식체를 가려서 상황에 맞게 사용하는 데 능숙합니다. 반면 기계번역(MT) 엔진은 사람이 개입하지 않는 이상 이를 구분하지 못합니다. 

대상 고객층과의 굳건한 관계를 잘 발전시키려면 반드시 이러한 MT의 한계를 인식하고 이를 극복할 조치를 취해야 합니다.

언어 격식이란?

우리가 사용하는 언어 습관이나 어조는 사회문화적 맥락, 관습, 의사소통 채널에 따라 달라집니다. 이때 의사 표현을 위해 구사하는 언어에서 드러나는 격식의 정도를 언어 격식이라고 합니다. 앞서 말한 것처럼 우리는 직장 상사를 대할 때는 친구를 대할 때와 다른 방식으로 말합니다.

격식을 차리는 정도에 따른 격식체/비격식체는 대화의 어조를 결정하는 근간이 됩니다. 글의 문체, 관용적 표현, 대명사 종류, 동사형 등은 언어, 국가, 사회집단 또는 직업적 배경에 따라 격식 수준이 달라질 수 있습니다.

콘텐츠 작성 시 격식체/비격식체 수위 조절은 어떻게 할 수 있는가?

콘텐츠를 작성할 때 다음과 같은 질문을 통해 어느 정도의 격식이 적절할지 판단해 보세요.

  • 어떤 의도로 고객과 소통하려고 하나요?
  • 제품을 사용한 고객이 어떤 기분을 느끼길 바라나요?

  • 고객에게 구체적인 프로필이 있나요?

콘텐츠를 다른 언어로 번역할 때 고객사는 종종 타겟이 되는 고객층의 프로필과 프로젝트의 배경, 기대하는 어조와 격식 수준 등을 기술한 스타일가이드를 만듭니다.

기계번역 엔진은 왜 언어 격식을 잘 파악하지 못하는가?

MT 엔진을 활용할 경우 원문과 동일한 격식을 갖춘 번역 콘텐츠를 생성하기 어렵습니다. 특히 소스 언어의 격식체 종류가 대상 언어보다 적을 경우 더욱 어려워집니다. 

MT 모델에서는 보통 세그먼트 하나를 입력하면 한 개의 번역을 반환합니다. 입력한 세그먼트가 여러 의미로 해석될 수 있는 경우에도 이 모델에서는 대상 고객에 관계없이 여러 개의 유효한 번역 중에서 하나만 선택됩니다.

이처럼 여러 가지 유효한 번역 중에서 선택하게 만들면 번역에 일관성이 떨어지거나 격식에 맞지 않는 번역이 될 수 있습니다. 

Geometric shapes and patterns on a dark background

번역에서 왜 격식체/비격식체가 중요한가?

번역 콘텐츠는 격식체 여부를 올바로 맞춰서 작성해야 합니다. 

특정 문화권에 속하는 사용자의 경우 격식에 맞지 않은 표현을 무례하다고 여길 수도 있습니다. 또한 격식체를 쓴 것이 단지 불쾌한 게 아니라 전혀 상황에 맞지 않아서 잘못된 경우도 많습니다. 이러한 오류가 발생하면 고객은 소외감을 느낄 수 있습니다. 가령 컴퓨터 게임이나 학생용 프로그램을 번역할 때는 격식체가 아닌 친근한 어조를 사용해야 합니다. 

기업은 대상 고객에게 맞는 어조로 콘텐츠를 번역하는 데 시간과 노력을 들임으로써 회사가 고객을 배려하고 있다는 강력한 메시지를 전할 수 있습니다. 이러한 노력은 특히 잠재고객에게 더 호소력 있게 와닿을 수 있습니다. 고객과의 효과적인 소통이야말로 기업 성공의 지름길입니다.

기계번역을 사용할 때 왜 대상 언어의 격식 수준을 잠재고객에게 맞추기 어려운가?

기계번역을 사용할 때는 대상 언어의 격식 수준을 고객에게 맞추기 어려울 수 있습니다. 특히 영어로 된 콘텐츠를 문법적 격식 수준이 다양한 언어로 번역할 경우 문제가 발생할 수 있습니다. 

문법, 어휘에 따라 격식 표현이 달라지는 방식은 언어에 따라 상당히 다릅니다. 

일부 언어의 경우 격식체 표현이 명확합니다. 가령 스페인어는 "tú"와 "usted"로, 독일어는 "du"와 "Sie"로, 프랑스어는 "tu"와 "vous"로 격식체가 구분됩니다. 중국어도 번체와 간체 모두 이처럼 격식체를 구분할 수 있습니다. 한국어의 격식체는 최소 6단계나 됩니다. 일본어를 비롯한 일부 언어의 경우 공손한 어조의 표현이 주동사를 비롯해 일부 명사나 형용사, 특정 어휘 선택 등에 따라 달라질 수 있습니다.

반면 영어의 경우에는 이러한 구분을 만드는 대명사가 없으므로 문맥에 의존해 격식 여부를 파악해야 합니다. 

이로 인해 대부분의 MT 엔진에서는 격식체와 비격식체를 구분할 경우 또 다른 일관성 문제가 발생합니다. 

기계번역 사용 시 격식은 어떻게 조절하는가?

MT 시스템에서는 다양한 격식체를 만들기 위해 몇 가지 전략을 사용합니다.

규칙 기반 기법

규칙 기반 기법을 사용하면 원하는 어조나 격식에 맞게 일관성 있는 기계번역 결과를 생성할 수 있습니다. 이러한 규칙은 원문의 의미를 유지하면서 어울리지 않는 어조로 표현된 요소를 타사 시스템에서 가져온 올바른 번역으로 확실하게 대체합니다.

비규칙 기반 기법  

비규칙 기반 기법은 원하는 어조나 격식으로 일관성 있는 번역을 만들어 내는 맞춤식 기계번역 모델을 개발하는 데 사용할 수 있습니다. 이 방식에서는 경어 표현을 얻기 위해 지도 학습법을 사용하고 말뭉치 세트의 경어 표현에 주석을 붙입니다.  

여기서는 주어진 격식체 어조에 맞춰 번역 결과를 조정할 수 있도록 다양한 데이터로 학습된 단일 시스템의 구축을 목표로 합니다.

Binary code in sunburst pattern

격식체/비격식체를 조절할 수 있는 상용 MT 시스템이 있는가?

대부분의 MT 시스템은 언어의 격식이나 성별 매개변수를 지원하지 않습니다. 그러나 이러한 기능을 지원하는 엔진도 일부 존재하며, 향후 이러한 기능에 대한 요구가 더 높아질 것으로 예상됩니다. 

현재 DeepL(API) 및 Amazon(콘솔 및 SDK)에서는 몇몇 특정 언어에 한해 번역 중에 격식에 맞게 조절할 수 있는 기능을 제공합니다. 

결과물의 격식 수준은 기본, 격식, 비격식 등 세 가지 옵션으로 조절할 수 있습니다.

기본 옵션에서는 신경망 기계번역(NMT) 결과물의 격식을 바꾸지 않습니다. 격식/비격식 옵션에서는 사용자가 격식체와 비격식체 중에서 선택할 수 있습니다. 특히 이 옵션에서는 번역 시에 사용할 대명사 및 연관어들을 미리 설정할 수 있습니다. 

MT 결과물의 격식을 최적으로 맞추기 위한 라이온브리지의 솔루션은?

라이온브리지(Lionbridge)의 Smart MT™는 엔터프라이즈급의 기계번역 솔루션으로, 번역된 대상 텍스트에 언어 규칙을 적용함으로써 원하는 어조나 격식에 맞게 기계번역을 생성할 수 있습니다.

당사 전문가들은 MT 결과물 분석에 피드백을 제공하는 규칙 데이터베이스를 지속적으로 업데이트하고 관리합니다. 

학습 자료만 충분하다면 맞춤식 기계번역 모델에 규칙 기반 전략을 결합하여 최적의 결과물을 만들어 낼 수 있습니다. 

문의하기

라이온브리지의 차세대 기계번역 기술이 무엇인지, 그리고 기계번역을 최대한 활용하려면 어떻게 해야 하는지 궁금하지 않으세요? 지금 바로 문의하세요.

linkedin sharing button

작성자
Yolanda Martin, Janette Mandell
  • #technology
  • #blog_posts
  • #translation_localization