ウェビナー
臨床試験における包括性の向上: COA の作成と翻訳
ライオンブリッジの TRUST フレームワーク
AI 活用のための確かな基盤の構築
生成 AI
- AI 翻訳サービス
- Content Remix
AI トレーニング
- Aurora AI Studio™
機械翻訳
- MT トラッカー
Smart Onboarding
翻訳サービス モデル
コンテンツ サービス
- テクニカル ライティング
- トレーニング/eラーニング
- 財務報告書
- デジタル マーケティング
- SEO/コンテンツ最適化
翻訳サービス
- 動画ローカリゼーション
- ソフトウェア ローカリゼーション
- Web サイト ローカリゼーション
- 規制対象企業向け翻訳
- 通訳
- 迅速な通訳サービス
- ライブ イベント
- 言語品質サービス
テスティング サービス
- 機能 QA/テスト
- 互換性テスト
- 相互運用性テスト
- パフォーマンス テスト
- アクセシビリティ テスト
- UX/CX テスティング
インサイト
- ブログ記事
- ケース スタディ
- ホワイトペーパー
- ソリューション概要
- インフォグラフィック
- eBook
- 動画
ウェビナー
ライオンブリッジのナレッジ ハブ
- 良好な患者アウトカム
- 最新の臨床試験ソリューション
- 患者エンゲージメント
言語を選択:
無料で利用できる汎用の機械翻訳 (MT) システムを、一般ユーザーや専門家を含む誰もが使用するようになりつつある今日、そういったエンジンで生成される翻訳には不備がある可能性があることを認識しておくことが重要です。品質の問題や重大な誤りにより、ビジネスに甚大な影響が及ぶことがあるためです。本記事では、MT の品質を改善する方法として注目されている効果的な MT 用語管理についてご紹介します。
概念と「用語」を通じたその表現との間には複雑な関係性があるため、用語は機械翻訳における最大の課題分野の一つとなっています。
用語の観点から見ると、特定の専門分野では、無料の MT システムの利用が望ましくない結果につながる可能性が特に高くなる傾向にあります。とりわけ医療や法律の分野では、この影響がマイナスに作用するおそれがあります。
特定分野のコーパスを使って MT システムのトレーニングを行うことで、品質の低下をある程度抑えることはできますが、汎用の MT システムを使用した場合、用語の一貫性や正確性は保証されない可能性があります。
MT エンジンによる翻訳の品質は、何よりもバイリンガルのトレーニング コーパスの品質に左右されます。そのため、用語の正確な翻訳が保証されるのは、トレーニング コーパス内に原文の用語とその翻訳の両方が含まれている場合のみということになります。
ニューラル機械翻訳 (NMT) システムでは用語の確率分布情報が用いられます。これは高品質な翻訳を実現する上で必要なものですが、それだけでは十分ではありません。デコーダーで用語の対訳を正確に抽出するためには、コーパス内で一定の出現頻度が満たされている必要があります。用語の出現頻度が十分でないと、対訳の候補と判定するための十分な重み付けが行われず、不正確な翻訳につながります。
汎用の MT システムは多くの場合、さまざまなコンテンツを含む大規模なコーパスを使ってトレーニングされています。その結果、出現頻度が最も高い用語候補とその潜在的な対訳が、実際に翻訳されている用語とは別の分野向けのものとなる場合があり、その用語が誤った形でターゲット言語 (翻訳先の言語) に翻訳される可能性があります。
たとえば、スペイン語の fósforo を英語に翻訳する場合、match (火をつける道具の「マッチ」) とも phosphorus (化学元素の「リン」) とも訳すことができます。汎用の MT エンジンでは、原文で意図されている内容を容易に判別できないため、翻訳結果が誤りとなる可能性があります。
この問題を解決するには、特定の分野に特化し、専門用語を含むバイリンガル テキストを使ってカスタム MT システムをトレーニングします。
しかし、特定の分野に特化したテキストでエンジンのトレーニングを行ったとしても、用語が一貫性のある形で使用されていない場合、翻訳の正確性は必ずしも保証されません。
この分野の研究では、アノテーションを付加することで NMT システムに言語情報を取り入れることが提案されています。
手動または半自動のアノテーションの導入は、用語集などのリソースの有無や、時間、コスト、アノテーションを担当する人員といった制約に左右されます。
ライオンブリッジの Smart MT™ では、ソース言語 (翻訳元の言語) とターゲット言語 (翻訳先の言語) のテキストへの言語ルールの適用を可能にし、特定のプロファイルに加えられた「翻訳しない語句 (DNT)」と用語集のリストに基づいて用語を適用できます。
当社は、新しい用語の追加や古くなった用語の除外などの用語集の定期的なメンテナンスや、新しい用語集の作成など、用語集に関連するあらゆるニーズに対応しています。また、Smart MT では用語集を一度作成するだけですべての MT エンジンで使用できるようになるため、時間とコストの節約につながります。
MT プロジェクトで用語集を使用するのは、想像するほど簡単ではありません。用語集が不適切に使用された場合、機械翻訳全体の品質にマイナスの影響を及ぼす可能性があります。MT における用語の順守を徹底するための最適な方法は MT のトレーニングです。
MT エンジンの十分なトレーニング、用語集のカスタマイズ、前処理と後処理のルールの明確化を組み合わせることで、MT による翻訳において適切な用語が使用され、お客様の文書と同様のスタイルに従った訳文が生成されるようになります。
機械翻訳ソリューションの用語管理機能を評価する場合は、次のような機能が備わっているかどうかを確認してください。
これらの機能を組み合わせることで、翻訳結果の品質を向上させることができます。
Smart MT は、コネクターを介してさまざまなサードパーティ製 MT システムと連動します。これは MT を活用するための道具と考えることができ、次のような機能を備えています。
当社ではこれら以外にも、用語集に含まれている用語と、トレーニング コーパスや MT の出力におけるその用語の使用との間の不一致を特定できる自動化機能を各種提供しています。これらの自動化機能は、トレーニング コーパスまたは MT の出力が承認済みの用語に従っていないケースの特定と修正に役立ちます。
MT で必要な用語が使用されていないことがわかった場合は、DNT、製品名、特定の主要分野やブランドの用語を含む用語集を使用することをお勧めします。
機械翻訳で期待どおりの結果を得るには、用語集を作成する際に次のガイドラインを参考にすることをお勧めします。
用語の適切な管理を通じて MT を有効活用するための当社の支援サービス ソリューションにご興味があれば、ぜひ当社までお問い合わせください。