線上研討會
增進臨床試驗研究中的包容性:COA 開發與翻譯
Lionbridge TRUST 架構
建立對 AI 應用的信任
生成式 AI
- AI 翻譯服務
- Content Remix
AI 訓練
- Aurora AI Studio™
機器翻譯
- MT 追蹤工具
Smart Onboarding
翻譯服務模式
內容服務
- 技術文件編寫
- 訓練與線上學習
- 財務報告
- 數位行銷
- SEO 與內容最佳化
翻譯服務
- 影音內容本地化
- 軟體本地化
- 網站本地化
- 受監管公司適用的翻譯服務
- 口譯
- 即時口譯
- 現場活動
- Lionbridge Language Quality Services
測試服務
- 功能品管與測試
- 相容性測試
- 互操作性測試
- 效能測試
- 輔助使用性測試
- 使用者體驗 / 客戶體驗測試
選擇語言:
GPT-4 是撰寫本文時 GPT 系列中最先進、最實用的大型語言模型 (LLM),與舊版的 GPT 模型相較,更適合用於執行機器翻譯工作。
這個生成式 AI (GenAI)/LLM 模型目前執行機器翻譯 (MT) 的表現如何?
與主流的神經 MT 引擎相比,它的表現又如何?
Lionbridge 的機器翻譯追蹤工具是業界歷史最悠久的 MT 引擎表現評估工具,透過這項工具的分析結果,您將可得到上述問題的答案,並持續監看 LLM 隨時間過去的進展。
由於神經 MT典範將逐漸轉移為 LLM MT 典範,Lionbridge 因此已將 GPT-4 納入 MT 追蹤工具的追蹤對象,現在起也會評量 GPT-4 機器翻譯在特定領域和語言組合上的表現結果。此外,追蹤工具也會評量另外兩個 LLM 以及五大主流神經 MT (NMT) 引擎的結果。
大型語言模型 | 主流神經 MT 引擎 |
---|---|
GPT-4 | Google NMT |
GPT-3.5 | Bing NMT |
GPT-Davinci | Amazon |
DeepL | |
Yandex |
以目前來說,神經 MT 引擎一般而言表現優於 LLM,但領先幅度並不大。儘管 LLM 還未能取代神經 MT 引擎,其中有部分原因是目前的成本考量以及效率跟擴充能力相關的問題,不過若能以特定方式來應用這個技術,會有助增進翻譯工作流程的效率並降低成本。
我們曾在 2023 年 5 月,報告過 GPT-4 模型在某一個案例中的表現優於某個神經 MT 引擎。我們認為這是未來趨勢走向的一個前兆,隨著這個技術日漸成熟,其使用也只會日漸增加。
我們對 GenAI/LLM 模型做的測試越多,也就越了解它們的特質、侷限和機會。因此透過我們的 MT 追蹤工具及伴隨的評論,您將可從我們的原始研究獲得最新的 GPT-4 機器翻譯數據。
歡迎閱讀我們 2023 年 10 月的專家評論,進而了解:
與 GPT-4 相關、值得注意的一些不尋常表現。
使用這項技術時,一些有助降低發生不良問題的方法。
與其他引擎相比較,GPT-4 目前的翻譯表現如何。
「雖然在轉換至 LLM MT 典範時,我們得接受翻譯輸出不確定性增加這個事實,但或許也能利用一些機制和最佳實務做法,稍加控制這種變異性。」
— Lionbridge 創新副總裁 Rafa Moral
這個追蹤評估工具能提供有關引擎表現的重要數據,有助全球公司隨時掌握 GenAI/LLM 技術令人振奮的最新進展。
不過,開發能有效滿足貴公司需求的 MT 解決方案並不簡單,因為最有利、同級最佳的方法,往往會根據引擎的能力妥善搭配,運用多個引擎來處理內容的獨特面向。在這些選項中再加入 LLM,會讓已然深具挑戰性的這項工作變得更加複雜。
想深入了解 Lionbridge 如何運用 LLM/生成式 AI 機會及應用,量身打造解決方案並產出可評量的商業價值?歡迎立即與我們聯絡。