언어:
언어:
콘텐츠 서비스
- 기술문서 작성
- 교육 및 이러닝
- 재무 보고서
- 디지털 마케팅
- 검색 엔진 최적화(SEO) 및 콘텐츠 최적화
번역 서비스
- 비디오 로컬라이제이션
- 소프트웨어 로컬라이제이션
- 웹사이트 로컬라이제이션
- 규제 관련 기업을 위한 번역
- 통역
- 라이브 이벤트
테스팅 서비스
- 기능 QA 및 테스팅
- 호환성 테스팅
- 상호 운용성 테스팅
- 성능 테스팅
- 액세스 가능성 테스팅
- UX/CX 테스팅
솔루션
- 번역 서비스 모델
- 기계번역
- Smart Onboarding™
- Aurora AI Studio™
라이온브리지 지식 허브
- 긍정적 환자 결과
- 로컬라이제이션의 미래
- 혁신에서 면역으로
- 코로나19 리소스 센터
- 대혼란 시리즈
- 환자 참여
- 라이온브리지 인사이트
언어 선택 :
라이온브리지는 한동안 기계번역(MT) 패러다임에 판도가 뒤바뀔 시기가 다가오고 있다고 말해왔습니다. 그 이유를 당사 전문가 해설에서 확인할 수 있습니다.
당사의 자동 번역 전문가가 다양한 주제에 대해 인사이트를 전달합니다.
MT와 생성형 AI에 대한 이해가 깊어지면 보다 자신의 필요에 맞는 도구를 선택하여 활용할 수 있습니다. 각 패러다임의 이점을 활용하여 궁극적으로 번역 효율을 높이고, 콘텐츠의 품질을 개선하고, 비용을 절감하세요.
라이온브리지는 생성형 AI(GenAI)/대규모 언어 모델(LLM)의 유행과 그 잠재력을 반영하여 기계번역(MT) 품질 추적 도구 보고서를 개선했습니다. 이제 GPT-3.5 및 Davinci의 번역 결과를 비롯해 GPT-4 번역 결과와 신경망 MT(NMT) 엔진의 성능도 보고서에 포함됩니다.
당사의 조사 결과 GPT-4는 느린 성능을 비롯해 여러 이유로 번역 결과를 내지 못하거나 일부 실행에서 번역을 누락하는 등 일관되지 못한 동작을 보이는 문제가 있었습니다.
GPT-4는 당사의 테스트 세트에서 특정 문장을 번역하지 못했습니다.
살펴본 결과, 성적인 의미가 있는 용어가 특정 문맥에서 문제를 일으킨 것으로 확인되었습니다. 명확히 밝히지만 당사에서 사용한 테스트 세트는 표준적이며 전적으로 허용 가능한 문장만 사용되었습니다. 그럼에도 불구하고 일부 용어로 인해 GPT-4의 성적 콘텐츠 필터링이 작동했으며 이후 AI는 해당 문장의 번역을 검열하여 아무런 결과도 출력하지 않았습니다. 당사는 이 결과에 대해 두 가지 이유로 놀랐습니다.
이 용어를 일반적인 용례로서 단독 사용할 때는 아무런 문제가 없었습니다.
이 특정 문장의 문맥은 문제가 될 만한 방식으로 해석되지 않았습니다.
이러한 관찰을 통해 당사는 GPT-4의 필터링 메커니즘이 단순히 모호한 용어도 포함된 금지 단어 목록을 토대로 작동하는 것일 수 있다는 결론을 내렸습니다. 이러한 접근방식은 오류를 과도하게 감지하고 거짓양성(실제로는 음성이지만 검사 결과 양성으로 나오는 경우)을 유발하기 쉽고, 따라서 전문 번역에 심각한 문제를 야기할 수 있다는 점에서 문제가 됩니다.
신경망 MT 엔진과 같은 초기 기계번역 기술에는 이러한 콘텐츠 필터링 문제가 없었으므로 이 오류는 LLM 기술의 한계라고 결론내릴 수 있습니다.
이러한 한계는 실제 상황에도 문제를 야기할 수 있습니다. 가령 부인과학이나 성교육과 관련된 의학 콘텐츠를 번역한다고 생각해 보세요. 당혹스럽게도 LLM은 본문 중 일부를 번역하지 않을 수 있습니다.
흥미롭게도 이 문제는 문장을 중국어로 번역할 때 발생했을 뿐 다른 언어로 번역할 때는 발생하지 않았습니다. 이는 해당 필터가 GPT-4의 출력물에 대해 적용된다는 것을 나타냅니다. 이 문제는 번역 작업을 할 때 콘텐츠 필터를 사용 해제함으로써 해결할 수 있습니다.
라이온브리지에서 지난 5주 동안 LLM 기계번역을 추적한 결과, 특히 GPT-4의 경우 출력물의 변동성이 매우 큰 것으로 나타났습니다.
생성형 AI가 이러한 결과를 낼 것이라고 예상은 했지만, 그 변동성은 우리의 예상을 훨씬 뛰어넘었습니다. 심지어 온도(Temperature)와 Top_p(상위 확률) 매개변수 설정을 사용하여 창의성을 줄이고 출력물의 확정성을 높였을 때도 마찬가지였습니다. GPT를 실행할 때마다 번역 결과는 서로 달랐으며, 번역을 연달아 실행해도 결과물이 동일하지 않았습니다.
결과물 간에 차이는 있지만 모든 결과가 허용 가능할 수도 있습니다. 그럼에도 불구하고 결과물의 비일관성은 통제할 필요가 있습니다.이는 이전의 신경망 MT 패러다임과 차이를 보이는 또 다른 특성입니다.
어쩌면 NMT에서 LLM MT로의 패러다임 전환은 단지 기술의 변화에 그치는 것이 아니라 우리의 사고방식 자체를 바꾸어야 하는 일이 될 수도 있다는 직감이 들기 시작했습니다. 현재 우리는 자동화 기술의 결과물에 익숙해 있지만 이제는 결과물의 변동성이 높아질 것을 예측하고, 동일한 입력과 동일한 매개변수를 사용하더라도 매번 동일한 결과를 얻지 못할 수 있다는 것을 받아들여야 할 수 있습니다.
이제 어느 정도의 불확실성은 감수해야겠지만 몇 가지 메커니즘과 권고사항을 적용하면 변동성을 일부 통제할 수도 있습니다.
마지막으로 유의할 점은 당사가 제공하는 차트에서 GPT-4의 편집 거리 감소가 품질 저하를 의미하지는 않는다는 것입니다. 이는 단지 GPT 출력의 가변성을 보여주는 것입니다. 다음 달에는 이 거리가 더 늘어날 수도 있습니다. 이 보고서에서 발전 상황을 계속 확인하고 더 많은 인사이트를 얻으십시오.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
다음 요약본을 살펴보고 이전 전문가 해설에서 어떤 주제를 다루었는지 알아보세요.
2023년 3월 — 신경망 기계번역(MT) 엔진의 성능을 능가한 대규모 언어 모델(LLM), 그 의미는?
2023년 2월 — 기계번역(MT) 품질 향상: MT 맞춤화 및 MT 학습
2023년 1월 — 챗GPT와 주요 MT 엔진들의 번역 품질 비교
2022년 11월 — Microsoft MT 기능 개선
2022년 10월 — MT와 언어 격식
2022년 9월 — MT 품질 개선을 위한 용어 사용
2022년 8월 — MT 중 치명적인 오류 문제 해결
2022년 7월 — 기계 번역(MT) 언어 순위
2022년 6월 — MT 품질의 정확한 분석
2022년 5월 — Amazon과 Yandex의 5월 성과
2022년 4월 — Yandex 4월 성과
2022년 3월 — 맞춤 MT 비교 평가
2022년 2월 — 신경망 기계 번역(NMT)의 미래
2022년 1월 — 1월의 MT 엔진 성능
2021년 12월 — 라이온브리지, MT 품질 추적기 경쟁력 검사에 Yandex MT 추가
2021년 11월 — Bing Translator 성능 개선
2021년 10월 — Amazon MT 엔진의 발전 과정
2021년 9월 — Amazon MT 품질 개선
2021년 8월 — 최고의 테크 기업 및 해당 MT 엔진 개발
당사의 자동 번역 전문가가 인사이트를 전달합니다.
생성형 인공지능(AI)이 중요한 이정표를 달성했습니다. 당사의 비교 평가 결과, 생성형 AI가 한 분야에서 신경망 기계번역(MT) 엔진을 능가하는 성능을 보였습니다. 구체적으로, 그림 1에서 볼 수 있듯이 대규모 언어 모델(LLM)인 GPT-4는 영어-중국어 쌍에 대해 Yandex보다 약간 더 우수한 번역 품질을 보였습니다.
이러한 발전은 신경망 MT가 등장한 이후로 다른 유형의 MT 방식이 신경망 MT 엔진을 능가한 것은 처음이라는 점에서 주목할 만합니다. 심지어 신경망 MT 엔진 성능을 능가한 것은 '비 MT' 방식으로, 특별히 기계번역 용도로 고안된 것이 아닌 다목적 자동 언어 생성 모델이라는 점도 중요합니다.
왜 이 사건에 관심을 가져야 할까요? MT 제공업체는 기술 발전의 최전선에서 경쟁력을 유지하기 위해 이러한 기술이 현재의 MT 엔진에 어떤 영향을 미칠지 고민해야 합니다. 또한 MT 구매자의 경우에는 올바른 MT 투자를 위해 이러한 개발 동향을 명확히 파악해야 합니다. 여기에는 신경망 MT만 사용하는 서비스가 아닌 일부 LLM 기반 기술을 도입한 서비스가 포함될 가능성이 높습니다.
생성형 AI는 아직 초기 단계에 있다는 점에 주목해야 합니다. 그렇다 보니 일부 핵심 영역에서 한계를 보이기도 합니다. 예를 들어, 번역을 여러 번 실행하는 동안 결과에 가변성이 생길 수 있고, 애플리케이션 프로그래밍 인터페이스(API)가 불안정하며, 신경망 MT 엔진보다 더 많은 오류가 발생하는 등의 문제가 있습니다. 생성형 AI 기술이 보다 성숙하기 위해서는 이러한 문제가 반드시 해결되어야 하며, 이미 급속도로 개선이 이루어지고 있습니다.
LLM이 보여주는 놀라운 개선 속도는 LLM이 기계번역의 차세대 패러다임이 될 것이라는 주장을 뒷받침합니다. 향후 패러다임의 진화에 따라 신경망 MT 제공업체가 LLM의 일부 특성을 신경망 MT 아키텍처에 통합하는 식으로 두 방식이 혼재된 시기가 이어질 것으로 예상됩니다.
라이온브리지 블로그에서 더 많은 언어쌍에 대해 신경망 MT와 LLM의 번역 품질을 비교한 결과를 살펴보고 신경망 기계번역 패러다임의 종말이 시작되었는지에 관한 또 다른 의견에 대해 알아보세요.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
번역을 자동화하려는 기업은 일반 기계번역(MT) 엔진을 활용해 적절한 품질의 출력물을 얻을 수 있습니다. 그러나 이러한 엔진이 기술 콘텐츠나 고도로 전문화된 콘텐츠를 처리하는 경우에는 수준 이하의 출력물이 나올 수 있습니다.
특정 목표를 달성하기 위해 기계번역(MT) 결과를 개선하고자 하는 기업은 다음 두 가지 옵션을 고려할 수 있습니다. 바로 MT 맞춤화와 MT 학습입니다. 이 중 하나를 사용하거나 두 가지를 함께 사용하면 자동번역 프로세스의 성능을 개선할 수 있습니다.
그러나 두 접근법은 서로 다르며 하나로 다른 하나를 대체할 수 없습니다. 표 1에서는 MT 맞춤화와 MT 학습을 간략히 요약하고 각 방법을 평가할 때 고려해야 할 몇 가지 사항을 제시합니다.
MT 맞춤화 | |
---|---|
정의 및 작동 방식 | 기존 기계번역 엔진에 용어집 및 번역 제외(DNT) 목록을 적용하여 기계번역 결과의 정확도 개선 |
효과 | MT가 제공하는 번역을 개선하여 결과물의 정확도를 높이고 사후 편집의 필요성을 줄임 |
구체적인 이점 | 기업이 브랜드 이름 및 용어 일관성을 유지하고 지역별 변이를 번역에 반영할 수 있도록 지원 |
사용 시 우려사항 | 제대로 구현하지 못할 경우 MT가 질 낮은 번역을 제공하여 전반적인 품질에 부정적인 영향을 미칠 수 있음 |
적합한 경우 | 기술 콘텐츠나 상세 설명 콘텐츠, 다음에 해당하는 모든 콘텐츠에 적합 *용어를 정확하게 번역해야 하는 경우 *지역별 변이가 있으나 MT 학습에 필요한 데이터가 충분치 않은 경우 |
성공 요인 | 입력 및 출력 정규화 규칙, 용어집, DNT를 원활히 관리할 수 있는 숙련된 MT 전문가의 존재 여부 |
비용 관련 고려사항 | MT 엔진에 들어가는 프로필의 업데이트 시 일회성 비용 및 지속적인 용어집 유지에 비용 발생. 잠재적 이점을 고려할 때 비교적 저렴한 편이며 일반적으로 MT 학습보다 비용이 적게 듬 |
표 1. MT 맞춤화와 MT 학습 비교
MT 학습 | |
---|---|
정의 및 작동 방식 | 말뭉치 및 번역 메모리(TM)에서 추출한 방대한 양의 이중 언어 데이터를 사용하여 MT 엔진을 구축 및 학습시켜 기계번역 결과의 정확도 개선 |
효과 | MT가 제공하는 번역을 개선하여 결과물의 정확도를 높이고 사후 편집의 필요성을 줄임 |
구체적인 이점 | 기업이 고유의 브랜드 보이스, 어조, 스타일을 유지하고 지역별 변이를 번역에 반영할 수 있도록 지원 |
사용 시 우려사항 | 엔진 학습에 필요한 양질의 데이터가 충분치 않을 경우 MT 학습이 번역 결과에 영향을 미치지 못할 수 있음. 콘텐츠 작성자가 경험 부족으로 용어를 잘못 사용할 경우 MT가 질 낮은 번역을 생성하여 전반적인 품질에 부정적인 영향을 미칠 수 있음 |
적합한 경우 | 고도로 전문화된 콘텐츠나 마케팅 및 크리에이티브 콘텐츠, 다음에 해당하는 모든 콘텐츠에 적합 *고유의 브랜드 보이스, 어조, 스타일을 유지해야 하는 경우 *지역별 변이가 있으며 MT 학습에 필요한 데이터가 충분한 경우 |
성공 요인 | 충분한 엔진 학습에 필요한 최소 15,000개 이상의 고유 세그먼트 보유 여부 |
비용 관련 고려사항 | 최초 학습 시 및 추가 학습을 진행하게 될 경우 비용 발생. 시간을 두고 MT 성과를 모니터링하여 개선의 여지가 있다면 검토해 볼 수 있음. 잠재적 이점을 고려할 때 특정한 경우에는 MT 학습에 투자 가치가 있을 수 있음 |
표 1. MT 맞춤화와 MT 학습 비교
MT 맞춤화 | MT 학습 | |
---|---|---|
정의 및 작동 방식 | 기존 기계번역 엔진에 용어집 및 번역 제외(DNT) 목록을 적용하여 기계번역 결과의 정확도 개선 | 말뭉치 및 번역 메모리(TM)에서 추출한 방대한 양의 이중 언어 데이터를 사용하여 MT 엔진을 구축 및 학습시켜 기계번역 결과의 정확도 개선 |
효과 | MT가 제공하는 번역을 개선하여 결과물의 정확도를 높이고 사후 편집의 필요성을 줄임 | MT가 제공하는 번역을 개선하여 결과물의 정확도를 높이고 사후 편집의 필요성을 줄임 |
구체적인 이점 | 기업이 브랜드 이름 및 용어 일관성을 유지하고 지역별 변이를 번역에 반영할 수 있도록 지원 | 기업이 고유의 브랜드 보이스, 어조, 스타일을 유지하고 지역별 변이를 번역에 반영할 수 있도록 지원 |
사용 시 우려사항 | 제대로 구현하지 못할 경우 MT가 질 낮은 번역을 제공하여 전반적인 품질에 부정적인 영향을 미칠 수 있음 | 엔진 학습에 필요한 양질의 데이터가 충분치 않을 경우 MT 학습이 번역 결과에 영향을 미치지 못할 수 있음. 콘텐츠 작성자가 경험 부족으로 용어를 잘못 사용할 경우 MT가 질 낮은 번역을 생성하여 전반적인 품질에 부정적인 영향을 미칠 수 있음 |
적합한 경우 | 기술 콘텐츠나 상세 설명 콘텐츠, 다음에 해당하는 모든 콘텐츠에 적합 *용어를 정확하게 번역해야 하는 경우 *지역별 변이가 있으나 MT 학습에 필요한 데이터가 충분치 않은 경우 |
고도로 전문화된 콘텐츠나 마케팅 및 크리에이티브 콘텐츠, 다음에 해당하는 모든 콘텐츠에 적합 *고유의 브랜드 보이스, 어조, 스타일을 유지해야 하는 경우 *지역별 변이가 있으며 MT 학습에 필요한 데이터가 충분한 경우 |
성공 요인 | 입력 및 출력 정규화 규칙, 용어집, DNT를 원활히 관리할 수 있는 숙련된 MT 전문가의 존재 여부 | 충분한 엔진 학습에 필요한 최소 15,000개 이상의 고유 세그먼트 보유 여부 |
비용 관련 고려사항 | MT 엔진에 들어가는 프로필의 업데이트 시 일회성 비용 및 지속적인 용어집 유지에 비용 발생. 잠재적 이점을 고려할 때 비교적 저렴한 편이며 일반적으로 MT 학습보다 비용이 적게 듬 | 최초 학습 시 및 추가 학습을 진행하게 될 경우 비용 발생. 시간을 두고 MT 성과를 모니터링하여 개선의 여지가 있다면 검토해 볼 수 있음. 잠재적 이점을 고려할 때 특정한 경우에는 MT 학습에 투자 가치가 있을 수 있음 |
표 1. MT 맞춤화와 MT 학습 비교
기계번역 맞춤화와 기계번역 학습에 대해 자세히 알아보려면 라이온브리지 블로그를 읽어보세요..
- Thomas McCarthy, 라이온브리지 MT 비즈니스 애널리스트
기계번역(MT)에서 대규모 언어 모델(LLM)이 신경망 기계번역(NMT) 패러다임을 대체할 수 있을까요? 이를 알아보기 위해 라이온브리지(Lionbridge)는 OpenAI가 개발한 GPT-3 LLM 제품군의 최신 버전인 챗GPT의 번역 성능을 당사가 MT 품질 추적에 사용하고 있는 5가지 주요 MT 엔진과 비교했습니다.
예상한 대로 챗GPT는 전문적인 NMT 엔진보다는 번역 성능이 떨어집니다. 그럼에도 챗GPT는 기대보다 훌륭한 결과를 보여주었습니다. 그림 1에서 볼 수 있듯이 챗GPT는 전문 엔진에 버금가는 성능을 보였습니다.
여기서는 역편집 거리를 기준으로 영어-스페인어 언어쌍에 대한 복수 참조를 통해 품질 수준을 계산했습니다. 편집 거리는 MT에서 번역한 결과물을 사람에 의한 번역과 같은 수준으로 만들기 위해 사람이 MT 결과물을 수정해야 하는 횟수를 측정합니다. 이 계산에서는 원시 MT 결과물을 사람 한 명이 아닌 10명의 다른 사람이 번역한 결과물과 비교(복수 참조)했습니다. 역편집 거리의 수치가 높을수록 품질이 좋다는 것을 의미합니다.
그림 1. 챗GPT와 주요 기계번역 엔진의 자동번역 품질 비교. 영어-스페인어 언어쌍에 대해 복수 참조를 사용한 역편집 거리를 기준으로 평가함.
이러한 일반 모델은 자연어 처리(NLP) 작업을 수행하도록 학습되었을 뿐 특별히 번역을 위해 학습되지는 않았다는 점에서 놀라운 결과입니다. 챗GPT의 성능은 2~3년 전에 출시된 MT 엔진의 품질과 유사합니다.
이 기술에 대한 대중의 관심과 IT 기업들의 엄청난 투자를 기반으로 펼쳐질 LLM의 진화를 통해 챗GPT가 MT 엔진을 추월할지, 아니면 MT에 새로운 LLM 패러다임이 도래할지는 곧 드러날 것입니다. MT는 LLM을 기본으로 내장할 수 있으나 이러한 경우 기술을 기계번역에 특화되도록 미세 조정할 필요가 있습니다. OpenAI와 기타 LLM 기업은 가령 기계가 대화 방식으로 사람과 소통할 수 있도록 하는 등 일반 모델을 특정 용도에 특화되도록 개선하기 위해 이와 비슷한 연구를 수행하고 있습니다. 기계 모델은 이러한 전문화를 통해 과제를 더욱 정확히 수행할 수 있습니다.
이러한 대규모 '일반' 언어 모델의 한 가지 장점은 다양한 작업을 수행할 수 있으며 작업 대부분을 우수한 품질로 수행한다는 점입니다. 예를 들어, 또 다른 일반 지능 모델인 DeepMind의 GATO는 600개 이상의 작업에 대한 테스트를 거쳤으며, 그중 400개 작업에서 '최첨단(SOTA)' 결과를 달성했습니다.
이 기술은 GPT, Megatron, GATO와 같은 일반 모델과 이러한 일반 모델을 기반으로 특정 목적에 특화된 전문 모델의 두 가지 형태로 지속될 것으로 보입니다. 일반 모델은 인공일반지능(AGI)을 개선하고 장기적으로 더 인상적인 성과를 구현하는 데 있어 중요합니다. 반면 전문 모델은 단기적으로 특정 영역에서 실용적 목적으로 사용하기 위한 것입니다. LLM의 놀라운 점 중 하나는 두 모델을 동시에 개발하면서 서로 병행하여 작동시킬 수 있다는 점입니다.
앞으로 어떤 미래가 기다리고 있을까요? 라이온브리지는 계속해서 LLM을 평가하고 그 결과를 게시하여 이 흥미로운 진전에 대한 최신 정보를 계속 전달하겠습니다. 당사의 블로그에서 챗GPT의 번역 성능에 대한 심층 분석을 읽어보고 챗GTP와 로컬라이제이션 그리고 챗GPT가 어떻게 업계의 판도를 바꿀 수 있을지에 대해 자세히 알아보세요.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
10월 11일부터 11월 1일까지 Microsoft의 기계번역(MT) 결과가 전반적으로 크게 개선되었습니다. 최근 Bing Translator가 품질 향상을 보여준 가운데 다른 주요 MT 엔진들도 유사한 결과를 보이고 있습니다. 이에 따라 최고의 엔진 자리를 놓고 치열한 경쟁이 벌어지고 있습니다.
지난 몇 달간 주요 MT 엔진들 사이에 특기할 만한 진전은 없었습니다. 이번 달 Microsoft에서 보여준 발전이 이러한 추세를 깨고 주요 엔진들이 새로운 발전을 보여주는 시작점이 되기를 기대합니다.
이번 측정에서는 통상적인 단일 참조 번역 측정을 넘어 복수 참조를 포함한 2차 트래킹을 통해 Microsoft에서 이루어진 개선 결과를 확인했습니다. 이 MT 평가에서는 최종 결과에서 올바른 번역이 여러 개 있을 수 있다는 사실을 고려해 '황금 기준'으로, 즉 사람에 의한 참조 번역을 하나가 아니라 10개를 사용해 편집 거리의 정밀도를 높였습니다.
한 해가 마무리되는 지금 되돌아보면 2022년 동안 MT는 매우 더딘 진전을 보였습니다. 변화는 거의 관찰되지 않았으며 이번 Microsoft Bing에서 확인된 MT의 발전이 올해 가장 주목할 만한 진전으로 보입니다. 올해 초에 언급했듯이 MT 패러다임은 현재 정체기에 접어들었습니다. 2023년에는 기계번역에서 새로운 변화가 나타나기를 기대하고 있습니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
이번 달에는 언어 형식을 중심으로, 기계번역(MT)을 제대로 사용하는 것이 불가능은 아니더라도 얼마나 어려운지를 살펴보고자 합니다.
기계번역(MT) 엔진에서 생성된 형식은 부정확하고 일관되지 않을 수 있습니다. 그 이유는 MT 모델은 일반적으로 각 입력 세그먼트마다 단일 번역 하나를 보내주기 때문입니다. 입력 세그먼트가 여러 의미로 해석될 수 있는 경우 이 모델에서는 대상 고객에 관계없이 여러 유효한 옵션 중에서 번역 하나를 선택해야 합니다. 여러 개의 유효한 옵션 중에서 선택할 수 있게 하면 번역에 일관성이 없어지거나 번역의 형식 수준이 잘못될 수 있습니다.
소스 언어의 형식 수준이 대상 언어보다 낮으면 정확한 결과를 얻기가 특히 더 어렵습니다. 예를 들어 프랑스어와 같은 언어는 형식이 잘 정의되어 있지만(예: tu vs. vous) 영어는 그렇지 않습니다.
대부분의 MT 시스템은 언어 형식이나 성별 매개변수를 지원하지 않지만, 이 분야도 진척을 보이고 있습니다. 현재 DeepL(API)과 Amazon(콘솔 및 SDK)은 형식을 조정하는 기능을 제공합니다. 라이온브리지(Lionbridge)의 Smart MT™는 엔터프라이즈급의 기계번역 솔루션으로, 대상 텍스트에 언어 규칙을 적용함으로써 원하는 양식이나 형식의 기계번역을 생성할 수 있습니다.
대상 고객층의 요구를 충족하기 위해서는 소스 언어를 효과적으로 번역하는 것이 중요하며, 여기에는 MT 결과물의 형식 언어와 일상 언어를 처리하는 것도 포함됩니다. 번역이 맥락에 어긋나거나 심지어 무례하다고 보일 경우 고객에게 외면당할 우려가 있습니다.
라이온브리지 블로그에서 MT 및 형식 언어와 일상 언어에 대해 자세히 알아보세요.
- Yolanda Martin, 라이온브리지 MT 전문가
기계 번역(MT)에는 많은 장점이 있지만 이를 사용할 때 주의해야 할 점이 있습니다. 일반 MT 엔진은 번역 결과물에 오류가 있을 수 있으며, 특히 특정 도메인에서는 용어 관점에서 바람직하지 못한 결과가 산출될 수 있습니다. 그 영향은 특히 의료 분야와 법률 분야에서 치명적일 수 있습니다. 하지만 MT 결과를 개선하기 위해 할 수 있는 일이 있습니다.
용어집을 사용하면 MT 품질을 개선하고 정확하고 일관성 있는 번역 결과를 얻을 수 있습니다.
이를 위해서는 전문 용어를 포함하는 도메인별 이중 언어 텍스트로 맞춤 MT 시스템을 학습시켜야 합니다. 그러나 용어를 일관성 있게 사용하지 않는다면 아무리 전문적인 텍스트로 엔진을 훈련시킨다 하더라도 번역의 정확성을 보장할 수 없습니다. 이 분야의 연구자들은 신경망 기계 번역(NMT) 시스템에 언어 정보를 주입할 때 주석 방식을 사용하는 것을 제안하고 있습니다. 주석법의 수동 또는 반자동식 구현은 용어집과 같은 가용 리소스를 비롯해, 시간, 비용 및 사람에 의한 주석 가능 여부와 같은 제약 조건에 따라 달라집니다.
라이온브리지(Lionbridge)의 Smart MT™에서는 원문과 대상 텍스트에 언어 규칙을 적용하는 것은 물론, 특정 프로파일에 추가된 번역 제외 용어(DNT) 및 용어 목록을 바탕으로 용어집을 만들 수 있습니다. 라이온브리지는 고객이 용어집을 만들고 유지할 수 있도록 지원하여 새로운 관련 용어를 추가하고 오래된 용어는 폐기하는 등 주기적으로 용어집을 관리해 드립니다. 일단 Smart MT에서 용어집이 생성되면 모든 MT 엔진에서 이 용어집을 사용할 수 있으므로 시간과 비용을 절감할 수 있습니다.
MT 프로젝트에서 용어집을 사용하기는 생각만큼 간단하지 않습니다. 용어집을 올바로 사용하지 않으면 기계 번역의 전체 품질에 부정적인 영향을 미칠 수 있습니다. MT에서 용어집의 용어를 따르게 하는 가장 좋은 방법은 MT를 학습시키는 것입니다. 학습된 MT 엔진과 맞춤 용어집 그리고 전처리 및 후처리 규칙 식별을 조합하면 MT 결과물에 적절한 용어가 사용되고 고객 문서와 유사한 스타일로 번역되도록 할 수 있습니다.
라이온브리지 블로그에서 용어집 사용을 통해 MT 결과를 개선하는 방법을 자세히 알아보세요.
- Yolanda Martin, 라이온브리지 MT 전문가
기업의 표준 관행으로서 기계 번역(MT)에 대한 의존도가 높아짐에 따라 직원들은 치명적인 오류의 확산을 방지할 필요가 있습니다.
치명적인 오류는 맞춤법이나 문법, 구두점 등 언어 기능과 관련된 유형의 표준 MT 오류에 비해 훨씬 큰 문제를 야기할 수 있습니다. 치명적 오류는 언어적 문제를 넘어 엔진에서 도출한 결과가 원래 의도한 메시지에서 크게 벗어날 때 발생합니다. 결과적으로 도출되는 잘못된 정보나 오해는 회사의 평판을 해치거나 재정 또는 법적 문제를 야기할 수 있으며 공공 안전이나 보건에 부정적인 영향을 미칠 수도 있습니다. 따라서 이러한 오류를 식별하고 기업의 소통을 저해하지 않도록 방지하기 위한 방법을 찾을 필요가 있습니다.
라이온브리지(Lionbridge)는 번역된 텍스트에 따라 특정한 자동 품질 검사를 수행하여 중요한 오류를 감지하는 한편 MT 속도는 유지하고 사람의 개입 필요성을 줄입니다.
자동화 기법에서는 다음 오류를 식별할 수 있습니다.
기업은 컴퓨터 공학을 통해 기존 MT 기술을 개선하여 이러한 번역 오류를 방지함으로써 치명적인 오류를 예방할 수 있습니다. 그러한 기술이 가능해질 때까지 당사는 번역 프로세스 중 자동화 기술을 사용하여 잠재적인 문제를 식별하고 문제가 있는 문장을 수정하여 정확도를 높일 수 있습니다.
기계 번역 중에 겪는 치명적인 오류에 대한 심층 조사를 살펴보려면 당사 블로그를 확인해 주세요.
- Luis Javier Santiago, MT 그룹 본부장
과 Rafa Moral, 라이온브리지 혁신 담당 부사장
Google NMT, Bing NMT, Amazon, DeepL, Yandex 중 최고의 엔진은 무엇일까요? 지난 달 데이터와 현재의 전반적인 추세에 따르면 주요 엔진의 성능은 비슷한 것으로 나타났습니다. 따라서 MT 전략을 수립할 때는 어떤 MT 엔진이 특정 언어쌍을 더 쉽게 번역하는지 등 추가적인 요인도 고려할 필요가 있습니다.
특정 언어쌍을 처리하는 데 각 엔진에 어떤 어려움이 있는지 파악하면 언어별로 번역 비용을 계획하고 예산을 할당할 때 참고할 수 있습니다. 예를 들어, 복잡한 언어쌍을 처리할 때는 고품질 번역을 위해서는 더 많은 노력을 기울여야 합니다. 이처럼 기업은 언어 복잡성에 대한 분석을 바탕으로 비즈니스 의사 결정을 내릴 수 있습니다.
번역 용이성에 따라 언어의 순위를 매기기는 간단한 일이 아니지만, 다른 측정 기준을 통해 평가 할 수는 있습니다. 최종 번역 결과가 사람이 번역했을 때와 동일한 수준의 품질을 가지기 위해 사후 편집 과정에서 가한 변경 횟수를 의미하는 편집 거리(Edit Distance)를 활용하면 각 언어쌍에 대한 MT 복잡도와 번역 용이성(기계 번역 용이성)을 파악할 수 있습니다.
포르투갈어, 스페인어, 프랑스어, 이탈리아어 등 대부분의 로망스어는 영어에서 번역할 때 고품질 수준에 도달하기 위해 필요한 변경의 수가 더 적습니다. 이러한 대상 언어는 기계가 처리하기 가장 쉬운 언어인 것으로 나타났으며, 당사의 기계 번역 용이성 순위에서 1위부터 4위까지 차지했습니다. 우랄어인 헝가리어와 핀란드어는 다소 복잡한 언어로, 당사의 순위에서 가장 낮은 27위와 28위를 차지했습니다. 같은 어족에 속하는 다른 언어인 에스토니아어도 상당히 복잡한 언어 중 하나입니다. 라이온브리지(Lionbridge)에서 처리한 수백만 개의 문장을 기반으로 할 때, 이러한 결과는 MT 결과에서 어족의 중요성을 보여줍니다.
언어 내 비교는 한계가 있지만 이러한 순위는 다국어 프로젝트 관리를 개선하기 위한 몇 가지 흥미로운 인사이트를 제공합니다. 라이온브리지 블로그에서 전체 언어 순위표를 확인하세요.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
6월에는 Yandex MT 엔진의 러시아어 번역에 소폭의 개선이 관찰되었으며 Microsoft Bing MT 엔진은 번역 결과가 약간 저하된 것으로 나타났습니다. 이것이 특기할 만한 변화인지 그저 중요하지 않은 허위 결과인지 확인하기 위해 이 결과를 다른 방식으로도 분석했습니다.
단 하나의 황금 기준을 채택하여 MT 번역과 사람에 의한 하나의 '완벽한' 번역 사이의 격차를 측정하는 대신 여러 기준 번역을 채택했습니다. 이를 위해 전문 번역사가 작업한 10개의 번역을 MT 기계별 번역 결과와 비교했습니다. 이 접근법을 취했을 때 6월 Yandex와 Microsoft Bing에서 나타난 번역 품질의 작은 변동은 사라졌습니다. 이에 따라 MT 번역 품질에는 변화가 없었다는 결론을 내리게 되었습니다. 즉, 6월 결과는 평탄하게 유지되었습니다.
데이터와 해당 그래픽 표현에서는 다소 오해의 소지가 있습니다. 특히 서로 다른 측정치 간에 변화가 경미할 때 이러한 오해가 자주 발생합니다. 결과를 정확히 해석하기 위해서는 데이터를 평가할 때 둘 이상의 접근법을 취하는 것이 좋습니다.
다음 달에도 MT 엔진 품질에는 거의 변화가 없을 전망입니다. 이 섹션에서는 전반적인 MT 결과를 제공하고 분석할 예정입니다. 다음 달에는 MT 언어쌍을 비교해 보겠습니다. 데이터를 사용하여 MT 복잡도에 따라 언어와 언어군을 분류할 수 있는지 알아보고 기계 번역에서 어떤 언어쌍은 다른 언어쌍보다 더 쉽게 번역되는지 등을 살펴보고자 합니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
이번 달도 MT 엔진의 발전은 대체로 정체되었습니다.
Amazon 엔진에서는 영어-스페인어 쌍을 처리하는 방식이 점차 개선되고 있는 것으로 확인되었습니다. 이제 Amazon 엔진은 이 언어쌍에 대해 가장 앞선 엔진이 되었습니다. Amazon은 영어-스페인어 쌍에서의 개선보다는 덜하지는 다른 언어쌍에 대해서도 소폭의 발전을 보였습니다. 이러한 발전은 몇 가지 일반적인 설정 변경과 영어-스페인어 쌍에 대한 작업의 결과인 것으로 추측됩니다. 개선 결과, 일부 특수문자와 측정 표시가 있는 문자열의 처리가 영향을 받은 것으로 보입니다.
Yandex는 두 달 연속으로 소폭의 개선을 보였습니다. 흥미롭게도 이때의 개선도 스페인어에서 일어났습니다.
앞서 언급했듯이, 중요한 변화는 없었습니다. 모든 엔진은 유사한 성능을 보이고 있습니다. 다음 달에는 일부 구체적인 MT 영역을 분석하고 전반적인 관찰 결과를 제공할 예정입니다. 물론 주요 진행 상황도 추적할 것입니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
지난 몇 달 동안 MT 엔진 성능에 큰 변화가 없었다가 요즘 들어 Yandex가 약간의 진전을, 특히 독일어 엔진에서 다소 진전을 보였습니다.
한 상세 분석 결과에 따르면 Yandex 엔진은 구두점 문자(예: 물음표, 느낌표, 괄호, 슬래시)와 측정 단위 처리 등 문장 처리에서 개선을 보인 것으로 나타났습니다. 이러한 발전은 해당 모델이 개선된 결과라기보다는 MT 설정을 일부 미세 조정한 결과로 보입니다. 하지만 희귀 용어 추적 역시 개선된 것으로 봐서 Yandex의 진전은 모델의 일부 조정 내지는 더 많은 데이터 학습 때문일 수도 있습니다.
지난해 동 기간에는 여러 MT 엔진이 흥미로운 몇 가지 개선을 보였습니다. 이러한 개선에는 관련된 어떤 시간 패턴이 있을까요? 2021년에 관찰된 경향성이 올해도 나타날까요? 라이온브리지(Lionbridge)는 이 엔진들의 MT 성능을 추적하고 있으며, 다음달 무렵에 그 결과를 보고할 예정입니다.
전반적으로 MT 엔진 평가에 대한 관심이 높아지고 있습니다. 오늘날 MT 기술이 충분히 성숙했다는 데는 대부분의 사람이 의견을 같이하며, 사람의 개입 여부나 하이브리드 방식 유무와 관계없이 이러한 기술은 거의 모든 번역 사례에서 유용한 것으로 인식되고 있습니다. 그러나 MT 사용자들은 여전히 MT 결과를 평가, 측정, 개선하기 위한 적절한 방법을 찾는 데 어려움을 겪고 있습니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
지금까지 이 페이지를 계속 읽어 보셨다면 일반적인 MT 비교 평가에는 이제 친숙하실 것입니다. 라이온브리지(Lionbridge)는 매월 특정 언어쌍에 대해 어떤 MT 엔진이 가장 좋은 성과를 보이는지 파악하고 엔진 개선 현황을 추적하고 있습니다. 3월, 여러 다양한 MT 엔진의 성능은 계속해서 현 상태를 유지하고 있습니다. 이러한 추세는 이미 한동안 주목하고 있었습니다. 지난달에도 언급했듯이, 이는 새로운 MT 패러다임의 필요성을 의미하는 것일 수 있습니다.
여기서는 일반적인 결과를 공유하고 있지만 맞춤 MT 비교 평가를 추진하는 기업들이 점점 늘어나고 있습니다. 일반 평가와는 달리 이러한 평가에서는 기업의 특정 요구사항을 고려해 가장 효과적인 MT 엔진을 결정합니다.
기업이 MT를 사용하기 시작하거나 현재 MT를 사용하는 방식을 개선하고자 하는 경우, 어떤 MT 엔진이 가장 효과적인지 파악하는 것이 매우 중요합니다. 라이온브리지는 맞춤 평가를 실행할 때 본 페이지에서 설명한 것과 유사한 방식을 취하되, 기업의 콘텐츠 유형과 언어쌍 요건을 토대로 권고 사항을 제시합니다.
맞춤 MT 비교 평가는 수년 동안 제공되어 왔지만 최근 들어 그 수요가 더욱 커지고 있습니다. 이러한 추세는 기업이 디지털 시장에서 성공을 거두는 데 MT가 중요한 역할을 하기 때문인 것으로 판단됩니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
2022년 1월과 2월, Google MT 엔진만 약간의 개선을 보인 가운데 추적 중인 다른 엔진들은 거의 정체 상태입니다. 이러한 관찰에 따라 몇 가지 중요한 질문을 던질 수 있습니다. 신경망 기계 번역(NMT) 패러다임은 정체기에 도달한 것일까? 엔진 성능에 이렇다 할 진전을 보이지 못하는 상황에서 이제 새로운 패러다임 전환이 필요한 시점이 온 것일까? NMT가 통계적 MT를 대체할 때도 비슷한 추세가 관찰되었습니다.
통계적 MT의 시대가 끝날 무렵, MT 출력물의 품질에는 사실상 거의 변화가 일어나지 않았습니다. 또한 서로 다른 MT 엔진 간의 출력물 품질도 유사해졌으며, 현재에도 유사한 추세가 확인되고 있습니다. 당장 NMT가 대체되지는 않겠지만, 기하급수적 성장과 수확 가속의 법칙이 옳다고 전제하면 규칙 기반 MT가 30년간 운영되었고 통계적 MT가 10여 년간 주도권을 이어갔으며 NMT가 현재 6년째를 맞이한 것을 고려할 때 새로운 패러다임 전환도 멀지 않은 것으로 보입니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
1월 한 달 동안 주요 기계 번역(MT) 엔진의 성능에는 큰 변화가 관찰되지 않았습니다.
Google은 일부 언어 및 도메인에 대해 약간의 점진적인 개선을 보였습니다. 그 밖에 대부분의 엔진은 성능이 제자리걸음을 보였습니다. Microsoft는 지난 몇 개월에 걸쳐 성능이 개선되었으나 1월에는 큰 변화를 보이지 않았습니다. 전반적으로 범용 MT 기술 중에서는 Google 번역이 품질 면에서 계속 선두를 달리고 있습니다.
12월에는 추가로 다섯 번째 MT 엔진을 추적하기 시작했으며, Yandex를 모니터링함으로써 러시아어에 대한 MT 품질 분석을 개선할 수 있게 되었습니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
12월에는 MT Quality Tracker 비교 점검에 Yandex MT를 추가했습니다.
지금까지 테스트 결과에 따르면 Yandex는 다음과 같은 특징을 가집니다.
다른 관찰에 따르면 MS Bing은 2021년 마지막 달 동안 놀랄 만큼 출력이 향상되었으며 특히 중국어로의 번역이 개선되었습니다. Amazon 또한 몇 가지 발전을 이루었습니다. 새해가 시작되면서 Google이 바톤을 넘겨 받아 출력을 높이고 있습니다. 특히 스페인어, 러시아어, 독일어로의 번역이 향상되었습니다. Yandex는 우리가 추적한 지난 5주 동안 평탄한 성능을 보였습니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장
Microsoft NLP 엔지니어들이 몇 주간 전반적인 성능 변화를 위한 여러 가지 실험을 수행한 후 뭔가 놀라운 성과를 이룬 것으로 보입니다. Bing Translator는 지난 몇 주간 특히 중국어에 대한 개선을 비롯해 성능이 전반적으로 개선되어 지난달 최고의 MT 엔진이 되었습니다. Bing Translator는 대부분의 분야에서 다른 엔진과의 격차를 좁혔으며 심지어 일부 경쟁 엔진을 능가하기도 했습니다. Bing Translator는 학습 가능성이 가장 높은 엔진 중 하나로서 입지가 더욱 강화되고 있어 콘텐츠에 특화된 맞춤형 모델을 구축하려는 회사에는 좋은 선택이 될 수 있습니다.
- Jordi Macias, 라이온브리지 언어 탁월성 부문 부사장
Amazon의 기계 번역(MT) 엔진은 약 한 달 전에 시작된 작업을 토대로 10월 한 달 동안 긍정적인 변화를 이어갔습니다. 이러한 지속적인 개선은 지난 몇 달 동안 확인된 점진적 개선의 두 번째 단계입니다.
참고로 지난 몇 달간 Amazon MT 엔진에서 지속적인 발전을 보인 분야 몇 가지를 소개합니다.
- Jordi Macias, 라이온브리지 언어 탁월성 부문 부사장
이번 9월은 Amazon의 기계 번역(MT) 엔진이 큰 약진을 보인 달로 기록될 전망입니다. 우선 Amazon은 독일어와 러시아어에 대한 MT 품질 출력을 향상시켰으며 스페인어와 중국어 쌍에 대해서도 큰 개선을 이루었습니다. 지난 몇 달간 Amazon은 두 단계에 걸쳐 점진적으로 MT 성능을 향상시켰고 지난 9월에 확인된 변화는 그 두 번째 단계였습니다.
Amazon MT 엔진에서 일어난 몇 가지 추가 변경 사항은 다음과 같습니다.
- Yolanda Martin, 라이온브리지 MT 전문가
Microsoft, Google, Amazon, Facebook 그리고 이제는 Apple까지, 모든 거대 기술 전문 회사가 독자적인 MT 엔진을 개발했습니다. 미국 이외 지역에서도 많은 대기업이 가세해 경쟁하고 있습니다. 거대 기술 회사들이 MT와 자연 언어 처리(NLP)를 오늘날의 상호 연결된 글로벌 세계에 꼭 필요한 도구로 여기고 있음이 분명해 보입니다.
라이온브리지 또한 이 경쟁에서 선두에 서기 위해 노력하고 있습니다. 라이온브리지에서는 기업의 구체적인 요구에 근거하여 원하는 언어 쌍과 콘텐츠 유형을 고려해 최적의 MT 엔진 옵션을 파악할 수 있습니다.
수많은 주요 기술 전문 회사의 투자가 활발해짐에 따라 MT/NLP 경쟁은 더욱 가속화될 전망입니다. 섬세함과 품질 경쟁력을 지닌 Apple의 가세로 다른 기업들 또한 이 경쟁에서 승리하기 위해 더욱 박차를 가할 전망입니다.
- Rafa Moral, 라이온브리지 혁신 담당 부사장