言語を選択する:

Person partnering with a language provider for AI training solutions

AI トレーニング ソリューション: 市場投入までの時間を短縮し、リスクとバイアスを低減

プロンプト、出力テスト、データ セットの作成・注釈付けなどに対応

有用なデータセットの構築、トレーニング、テスト


多様でグローバルなコミュニティと定評のあるテクノロジーを基盤にしたサービス。

ライオンブリッジは、当社独自の最先端テクノロジーを活用し、以下をはじめとする多様でグローバルな専門家からなる 50 万人以上の人材を適材適所に採用することで、お客様のコンテンツ トレーニングを全面的にサポートいたします。

  • 翻訳者/言語専門家
  • テクノロジスト
  • テスター
  • 通訳者
  • 支援者
  • 文化専門家/リエゾン

ライオンブリッジが提供する AI トレーニング サービス

AI モデルの導入を成功させるためのカギ

データの注釈付け

データにラベルを付加したり分類したりすることで、AI モデルがデータを理解しやすくします。データの注釈付けは、AI モデルが注釈の付いたデータに基づいて予測できるようにするための基盤となる作業です。データの注釈付けの質と正確性が、AI モデルのトレーニング、ひいてはそのパフォーマンスに大きな影響を及ぼします。このサービスには以下が含まれます。

  • コンテンツの分類
  • 画像または動画の注釈付け
  • 固有表現抽出

データの収集

AI モデルのトレーニングとテストに使用する、関連性の高い高品質なデータを集約します。データベース、ソーシャル メディア、センサー、ユーザー インタラクション、テキスト、画像、音声、動画など、データのソースや形式はさまざまです。代表的なデータを幅広く収集することで、AI システムがさまざまな入力を正確に理解して応答できるようにします。これにより、効率性と有効性の向上につながります。このサービスでは以下を収集します。

  • 音声データセット
  • 動画データセット
  • テキスト データセット
  • トランスクリプション

データの作成

AI トレーニング用の新しいデータを生成します。これには、合成データ (現実世界のデータを模して人為的に作られたデータ) の作成のほか、バリエーションやノイズを加えた既存のデータの拡張も含まれる場合があります。データの作成によってトレーニング データの量を増やして多様性を高め、AI モデルのパフォーマンスを向上させます。このサービスには以下が含まれます。

  • テキスト読み上げ
  • 音声文字変換
  • 翻訳
  • コンテンツ キュレーション

出力の検証

AI モデルと LLM で生成された結果が正確かつ妥当で、文化的に適切であることを確認します。AI の応答を徹底的にレビューして、目標と要件の基準を満たしているかを検証します。検証によって全体的な品質が向上するとともに、AI システムの信頼性と効果が高まり、ユーザーからの信用も得られます。このサービスには以下が含まれます。

  • インテントの作成とレビュー
  • モデルの出力の検証
  • 文化的な適応の向上
  • ジオロケーションに関する検証

 

LLM 開発サポート

AI モデルが言語を理解、生成、操作する能力を形成・改善します。LLM をファインチューニング (微調整) してパフォーマンス、包括性、正確性、妥当性を向上させます。これには、自然言語処理とデータ エンジニアリングの高度な技術が要求されます。このサービスには以下が含まれます。

  • 多言語プロンプト エンジニアリング
  • RAG (Retrieval-Augmented Generation、検索拡張生成) パターンのサポート
  • 多様性と包括性のテスト
  • 現地市場に合わせた最適化
  • モデルのレビューと評価
  • 出力のファクトおよび関連性チェック

お客様事例: ライオンブリッジ AI の効果を実証

AI トレーニング: スマート応答データの収集

あるスマートフォン メーカーが、自社デバイスのメッセージング アプリで提示される「クイック応答」オプションの改善を望んでいました。このプロジェクトでは、AI が人間の会話の自然な流れやありがちな流れをもっと理解できるようにすることが求められており、リアルな会話のサンプル データを多言語で大量に収集する必要がありました。

当社のプラットフォームはこのタスクに最適な環境であり、会話ごとに最大 5 人が参加して、やりとりが最大 20 回続く会話を 200,000 話以上収録できました。それぞれのタスクは 8 つの主要言語でタイミングをずらしながら実施され、すべての会話データの収集と納品を 4 週間足らずで完遂しました。

AI トレーニング: 音声感情データの収集

モニタリングされた安全なメタバース体験を開発したある VR 企業が、同社の AI が感情的な要素をよりよく理解できるように、多くの言語や派生言語/方言を話す人の声のサンプルで AI をトレーニングしたいと希望していました。

当社では多くの話者を採用し、特定の感情 (怒り、悲しみ、喜びなど) を表現した 600,000 以上の文章を録音しました。話者の選定は必要とされている個々の言語に堪能かどうかを基準に行われ、すべての録音は当社のプラットフォームで収録し、納品されました。一括エクスポート オプションにより、それぞれの話者による送信直後からこれらの音声ファイルに簡単にアクセスできました。

AI トレーニング: プロンプト応答のレビュー

当社のプラットフォームで、考えられる応答を複数選択して大量のプロンプトをレビューする LLM のトレーニング プロジェクトを開始しました。人間のレビュー担当者が、プロンプトに最適な応答を選択し、以下を含む複数の要素に基づいて応答を評価しました。

  • 正確さ
  • 形式
  • 文法
  • 言語分析

レビュー担当者は、必要に応じて推奨される修正または改善を提案しました。当社は、このプロジェクトに 5,000 人以上のレビュー担当者を投じて、LLM で必要な多言語の大量の学習データを提供しました。

コンテンツ生成: 動画の翻訳とレビュー

あるオンライン動画サービス プロバイダーが、多言語から英語への大規模で迅速な動画翻訳を必要としていました。翻訳が迅速に行われれば、このお客様のコンテンツ モデレーターはコンテンツをより深く理解し、十分な情報を得たうえでポリシー違反に該当するかどうかを判断できるようになります。さらに、翻訳者は、卑わいな内容や不快な内容、憎悪、人種差別、または虐待に該当する内容を含むコンテンツにフラグを付けました。

ほとんどの動画は送信から 2 ~ 3 日間ですべての翻訳とレビューを終え、こうした当社の短納期対応により、お客様はプラットフォームのコンテンツを迅速かつ効果的にチェックすることができました。

コンテンツ レビュー: 字幕トランスクリプションの QA

ある eラーニング ソリューション プロバイダーが、機械で書き起こされた 300 本以上の動画のレビューに当社のプラットフォームを利用しました。次のような品質の問題がチェックされ、フラグが付けられました。

  • 字幕の文章構造
  • スペルや文法の問題
  • 翻訳の全体的な正確性

レビュー担当者は、AI で書き起こされた字幕に対し、必要なところは修正し、抜けや深刻な誤りのあるコンテンツにはフラグを付けました。このプロジェクトはスタートから 5 日後に完了し、精度の高い動画のトランスクリプションをお客様に納品することができました。

責任ある AI

ライオンブリッジは、人工知能 (AI) の倫理性、公平性を確保し、敬意を持って使用することに常に尽力しています。当社は、当社の AI を活用したソリューションが社会にメリットをもたらすよう、また害や差別の原因になったりそれらを助長したりすることがないよう取り組んでいます。

ここでは、お客様が責任を持って AI を使用できるよう支援する当社の取り組みをご紹介します。

AI トレーニングに関する FAQ

お客様からよく寄せられる質問とその回答をご覧ください。

当社の AI トレーニング サービスは、LLM の普及に伴ってこのテクノロジーの導入を検討しているものの、自社ではトレーニングを実施できないあらゆる企業のお客様に適しています。当社は 20 年以上にわたり、世界トップクラスのさまざまな IT 企業のお客様から、トレーニング データに関する業務をご依頼いただいています。またそのようなグローバルな大手企業のお客様だけでなく、小規模な AI 企業でも、エンドユーザー向けの AI アプリケーションを開発しているお客様や、AI のファインチューニングを通じてモデルを特定のタスクや分野向けに調整しようとしているお客様、人間によるフィードバックを通じた評価を求めているお客様などに対しても支援をご提供しています。

LLM の出力の正確性と妥当性が向上し、出力を信用できるという安心感が高まります。

— AI が不快感を与えるような応答を返さないようにするための、チャットボットのトレーニング。

— アプリが多言語環境で機能するかどうかを確認するための、多言語による出力の評価。

— どのモデルを使用すべきかを判断するための、モデルのパフォーマンス テスト (ローカリゼーション作業用を含む)。

はい。当社はマルチモーダル トレーニング サービスを提供しています (テキスト、音声、画像、動画に対応)。

はい。生成コンテンツの高品質な出力を維持するには、ユーザーやテスターからの「人間によるフィードバック」を継続的に LLM に取り入れることが重要です。継続的なトレーニングは、AI を言語の傾向や文化的ニュアンスに適応させ、長期にわたって出力の有効性と妥当性を確保するのに役立ちます。

AI トレーニングを実施し、AI から常に企業のブランド ボイスや価値観を反映した出力が生成されるようにすることで、ビジネス リスクを低減できるうえ、ポストエディット作業にかかる高いコストも節約できます。それによってコスト効率が高まるだけでなく、適切にトレーニングされた AI が生み出す質の高い出力によって、顧客の信頼とロイヤルティを獲得し、ビジネスを確かなものにすることができます。

当社は、AI に関する専門知識と人間参加型 (ヒューマンインザループ) の手法、グローバルなプレゼンスを活かして、トレーニング データ サービスを大規模に展開しています。当社のクラウドソーシング プラットフォームには、ほぼあらゆる地域、あらゆる属性の人材が揃っています。テキストや画像への言語ベースの注釈付けには、当社の言語専門家や特定分野の専門家が適任です。さらに、ローカリゼーションの QA プロセスは、AI トレーニングの QA 処理に相当します。

当社は、AI に関する専門知識、言語に関する実績、グローバルなプレゼンスを併せ持つ稀有な存在です。AI 関連のサービスを提供していたとしても、すべての言語サービス プロバイダー (LSP) が AI に関する専門知識を持ち、AI テストのベスト プラクティスを実践しているわけではありません。テスティング サービスを提供している AI 企業は通常、当社のような言語に関する知識やグローバルなプレゼンスを持ち合わせていません。そのため、比較的既存リソースの少ない言語で AI を使用する場合には特に、問題が生じやすくなります。また、当社では組織として全面的に AI を取り入れており、社内ではさまざまな AI ソリューションが利用されています。GPT ファミリーの最新バージョンの AI を導入し、ファイアウォール内部で安全に維持管理を行っています。当社ではワークフローに AI を取り入れる方針をとっており、お客様により多くの価値を提供できるよう、業務の変革に取り組んでいます。

当社では、センシティブなコンテンツや有害なコンテンツに長時間さらされると、ストレスや不安感、その他の精神衛生上の懸念につながる可能性があることを認識しています。そこで、そのような業務の担当者向けの包括的なウェルネス プログラムを開発しました。このプログラムでは、健全性促進のための心理面のサポートなどの対策を、守秘義務の下でいつでも利用することができます。

ライオンブリッジの AI トレーニング専門家のご紹介

スーザン モーガン、AI セールス担当バイス プレジデント

スーザンは、お客様の AI トレーニング ニーズに合わせたソリューションを開発する当社の専門 AI セールス ディレクターのチームを統括しています。ローカリゼーション業界における 15 年の経験と、AI トレーニングについての膨大な知識を活かして、お客様が独自のビジネス ケースに合わせて自社の LLM をファインチューニングできるようにするソリューションの開発に、情熱を持って取り組んでいます。

Share on LinkedIn

AI トレーニングおよびプラットフォーム イノベーション担当ディレクター、ポール ドブソン

ポール ドブソンは、AI トレーニングの提案と当社のテクノロジー プラットフォームである Aurora AI Studio を統括しています。このプラットフォームは、世界中の人材を活用して AI トレーニング用のデータを収集するための主要ツールです。ポールは、大規模なデータの注釈付けと AI 検証プロジェクトを推進するため、イノベーションと効率化に焦点を当てながら高度なテクノロジーのシームレスな統合に取り組んでいます。

Share on LinkedIn

アカシア デッカー、グローバル プログラム ディレクター – テック分野

アカシア デッカーはこの業界で 13 年以上の経験を持ち、現在はハイブリッド チーム プロジェクトと AI とのコラボレーションに取り組んでいます。アカシアが率いるチームの担当業務には、プレミアムな翻訳サービス、人材運用による HT、MTPE と評価、地政学的な言語的コンサルタント、感情によるラベル付けなどが含まれます。

Share on LinkedIn

マルゴルツァタ ゴルバッチ、AI プログラム ディレクター

マルゴルツァタは AI トレーニング サービスの運用化を担当しており、最適なプロセスの実装と、個々のお客様のニーズに合わせた AI ソリューションの開発を支援しています。10 年以上のローカリゼーション経験、言語とコミュニティ管理における経歴、そして AI に関する深い専門知識を活かして、お客様を成功に導いています。

Share on LinkedIn

お問い合わせ

勤務先のメール アドレスを入力してください