Using a laptop for complicated computations

ChatGPT の長所と短所、そしてローカリゼーション業界に変革をもたらすと考えられる理由

この新しいテクノロジーに対するライオンブリッジの見解と、その真価を引き出すための次のステップ

最終更新日: 2023年1月17日 14:01

2022 年 11 月 30 日にリリースされた ChatGPT はかつてないような注目を集めており、このテクノロジーに関してさまざまな言説が飛び交っています。実際に数日間、昼夜を問わずに ChatGPT との会話を重ねてみて、重要なポイントは以下に尽きるのではないかという考えに至りました。

ChatGPT ができることは何か。
ChatGPT ができないことは何か。
どのような使い方ができるか。

お問い合わせ

これらの問いに対する答え、そしてこの新しいローカリゼーションツールに対する私の未来予測にご興味があれば、ぜひこの先をお読みください。このトピックに関するより詳細なホワイトペーパーも追って公開する予定です。

ChatGPT ができないことは何か

ChatGPT には、以下のような注意点があります。

ChatGPT は事実を語るわけではありません。ChatGPT は、与えられている情報から、人々が求めていそうなことを言うだけです。
ChatGPT は現実の世界を紐解くヒントを持っているわけではありません。現実の世界に関する人々の発言をキュレーションしたものを情報源として、非常に説得力のある言葉を紡ぎ出し、学習した内容を提示するだけです。
ChatGPT は数を数えることができません。私は Engraved で Jonas Degrave 氏が公開しているシミュレーションを、さらに複雑な計算式を使って再現しようとしましたが、得られた結果は誤ったのものでした。ChatGPT は、疑似的に再現する方法がわかっている Python コマンドから 2 つの数字を正しく乗算しており、この点は非常に優れています。ところが、数を数えることはできないのです。
ChatGPT は自分で考えることができません。私が質問したことについて、適切な前提に立って本当のことを簡単に説明するテキストを返してくれますが、自信満々に間違った応用をすることも少なくありません。基本的に推論ができず、有限状態機械ではありません。
ChatGPT の謙虚でありながら自慢げな態度はやや鼻に付きます。ChatGPT は落ち着き払って権威的な物言いをしますが、ユーザーをお手伝いするという慎ましい態度を示し、こちらが間違いを指摘すると戸惑うほどに反省して見せます。

The vast scope of human intelligence and reasoning

ChatGPT ができることは何か

ChatGPT にできないことを見てきましたが、それでは、テキストの解釈と生成が可能なこのプログラムで、何ができるのかを確認しましょう。ChatGPT では次のようなことが可能です。

人間よりも上手に文章をまとめることができます。ChatGPT とのやり取りを重ねた結果、私は強くこう思うようになりました。ChatGPT は豊富な語彙を使って、さまざまな難易度の文章を書くことができます。私の見解では、ChatGPT は人間のコンテンツライターの上位 1 割と同レベルの優れた文章を書くことができる生成 AI (ジェネレーティブ AI) です。
ChatGPT は指示に従うことができます。形式的にもコンテンツ的にも、指定されたとおり完璧にテキストを変更することができます。特に重要なのは、会話のコンテキストを保持し、非常に特有な表現であっても、以前の内容に言及するとそれを理解できることです。
ChatGPT は、意味を変えずにテキストを変更することができます。テキストが与えられると、指示に従ってコンテンツや形式、スタイルに変更を加えることができます。テキストの意味内容を維持することも、指定したとおりに変更することもできます。
ChatGPT では多言語の用語集を管理できます。これはローカリゼーションにおいて非常に重要な点です。大規模な翻訳プロジェクトにおいて実際にどこまで有効かどうかはまだわかりませんが、ChatGPT は、ChatGPT が翻訳したものかどうかにかかわらず、翻訳された文章の編集においても、指定された用語を適切に適用できるようです。
ChatGPT では、人々に不快感を与えるテキストを検知できます。私は、人種差別や同性愛嫌悪の要素を持つテキストメッセージを含む、連邦刑事裁判の申立書からの引用を ChatGPT に提示して、不快感を与えるテキストを特定するように指示しました。ChatGPT は優れた成果を上げ、その根拠を示すこともできました。
ChatGPT ではエンティティ抽出が可能です。典型的なパターンのエンティティ抽出を実行し、エンティティの前後にタグを配置するように ChatGPT に指示してみました。いくつかの見逃しがありましたが、さらにいくつかのプロンプトを経ると、見逃した分についてもタグを入れることが容易にできました。
ChatGPT は、分類法に従って分類することができます。一般的な知識を特定の状況に対してうまく適用できるところが、ChatGPT の非常に驚くべき能力の一つです。

ChatGPT の発言が正しいかどうかは信頼できないこと、ChatGPT は何が正しいかの判断はできないことは、すでにお伝えしたとおりです (そのため、コンテンツ制作に利用する場合、発言内容がおかしくないかどうかをチェックする必要があります)。しかし、満足できる意味内容が含まれているテキストがあれば、表現される意味を変えずに、ChatGPT で形式やコンテンツを操作、変換することができます。これにより、意味のあるコンテンツをゼロから生み出す必要がなくなるので、ローカリゼーションプロバイダーにとっては非常に大きな機会となる可能性があります。ローカリゼーションの取り組みの現状について確認し、ChatGPT によってどのような影響があり得るかを見てみましょう。この生成 AI については、次のようなことが言えるでしょう。

ChatGPT は翻訳スキルに長けています。大規模なコーパスが存在する言語については、すぐに利用できる機械翻訳の出力が得られる最先端のエンジンと比較して、優れているとまではいかない部分もありますが、肩を並べる程度にはなるでしょう。
用語に関する指示の順守においては、非常に有能と思われます。
広い範囲でも狭い範囲でも、スタイルに関する指示を適用できます。この種の作業を正しく実行するのが容易でない機械翻訳エンジンとは非常に対照的です。
さまざまな対象、特にテキストを任意の分類法に従って分類する能力が非常に優れています。ローカリゼーションでは、コンテンツの種類に応じて適用する指示が異なる場合があるため、このような能力は効果的です。
与えられたテキストの編集に秀でています。これは、品質の高いローカリゼーションを実現する上で非常に重要な要素となります。ChatGPT は、テキストのレビューと翻訳における主要な 4 つの要素に非常に長けています。
処理の効率化や改善、ROI 向上を目的としてテキストを分析するコンテンツ分析に役立ちます。翻訳品質の問題の予測や事前回避、リーチ拡大、SEO、CTA/CTR のパフォーマンスなどの効果を高めるための調整、ソース言語 (翻訳元) およびターゲット言語 (翻訳先) の読みやすさの向上などに役立てることができます。
実際に稼働するコードの記述と編集に役立ちます。トップクラスのプログラマーたちは自分たちと同レベルのコードを ChatGPT が書けるかどうかを議論しており、それは無理そうだということになっています。しかし、私がコンテンツを抽出する XML のコードを記述するように指示したところ、実際に実行可能なコードが生成されました。普段はコーディングを行わないユーザーでも容易にコードを作成でき、コーディングを学ぶ場合にも効果的です。

ChatGPT によって必要になる新たなスキルと手法

ChatGPT で必要になるプロンプトの種類について理解の糸口が掴めてきました。ChatGPT に対する入力は自然言語のみです。このテクノロジーを制作に利用するには、適切なプロンプトを使いこなすスキルを身に付ける必要があります。コンテンツを適切に変換するには、クリーンアップ、前処理、後処理などさまざまなタスクを実行する一連のプロンプトが必要になるでしょう。文脈上適切で十分に予測可能な出力を実現するための自動化のパイプラインで使用する自然言語のプロンプトを学ぶのは、興味深い経験になると思います。

これからどこへ向かうのか

この新しい生成 AI を無視できないことは明白です。ローカリゼーション業界に大きな変革をもたらす可能性が高いでしょう。言語サービスの自動化に向けて先進的な取り組みを積極的に進めていかなければ、遅れを取ることになります。ChatGPT は平均的な人間の編集担当者と変わらないレベルでテキストの変換や注釈の付加ができ、人間よりも効率的にこうしたタスクを実行できます。ChatGPT は、一人の人間では持ちえないような幅広いスキルを活かしてタスクを実行することができ、獲得した知識を新たな状況に援用することができます。

とりわけ重要なのは、ChatGPT によって、ローカリゼーションを自動化する上で長い間課題となっていたことを解決できる可能性があることです。もちろん、サンプルデータを使って ChatGPT と対話をすることと、ChatGPT を大規模に導入してこのような処理を実行することは、まったく違うことです。次の段階に進むには、以下のような作業や準備が必要になります。

実際の状況に即したテストを大規模に実施し、ここで取り上げたローカリゼーション/編集の各タスクについてエラー発生率の評価を行う。
ローカリゼーションのバリューチェーン内におけるユーザージャーニーをマクロとミクロの両面から詳細に分析し、このようなタイプのテキスト自動生成で混乱が生じる可能性が高いポイントを特定する。
大規模なプロジェクトでのプロンプトの使い方と、関連するコンテキストを ChatGPT に渡す方法を理解し、注意すべき点やベストプラクティスを文書化する。
自動化と人間による編集作業が混在するワークフローを新たに確立し、このような AI を取り入れることでポストエディットや QA が今後どのような役割を果たしていくのかを再考する。
改善の可能性があればその都度、ローカリゼーションエージェント向けと顧客向けの両方について、新しい自動化機能とユーザーエクスペリエンス (UX) のインタラクションコンテキストを設計する。
ライセンス、導入、保守のコストについて、自社のビジネスにおいて経済的合理性があるかどうかを確認する。

言語と ChatGPT の現実的な利用に関する考察

特に印象的だったことを一つ挙げれば、ChatGPT が数値を使った複雑な演算をほぼ正しく処理していながら、その結果は間違いに終わっていた点です。ChatGPT はズルができません。トレーニングに使用された言葉から学習したことがすべてです。規模の大小を問わず、演算についてほぼ正しい結果が得られることから、十分な規模の言語コーパスには現実世界に関して統計的に有意な情報が含まれることがわかります。ただし、現実世界に関して意味のある、信頼性と精度の高い情報を生成するには、(数学のような) 専用の形式体系が必要であることも示されています。

ChatGPT は、自己言及的で自己矛盾のない体系は、独立して存在する世界の真実を、それ自体では伝えることはできないことを思い出させてくれます。これは、ゲーデルの不完全性定理に沿うものです。人は意識を持つ存在であり、私たちが対峙する現実の世界を理解する土台となる形式的・物質的体系から自分の認識を切り離すことはできず、言語のみによって世界を規定することはできないのです。

お問い合わせ

正確性とスピードを確保しながら予算内で翻訳・ローカリゼーションプロジェクトを実施したいとお考えであれば、ChatGPT といった革新的な生成 AI や他の最先端テクノロジーを活用して当社がお手伝いいたします。ぜひ当社までお問い合わせください。当社が提供する翻訳・ローカリゼーションサービスについて、当社の担当者が詳しくご説明いたします。