Webinar
Mehr Inklusion bei klinische Studien – COA-Entwicklung und -Übersetzung
Fallstudie
Neue Lösungen zur KI-Contenterstellung für einen Sport- und Bekleidungsgiganten
Lionbridge Knowledge Hubs
Lionbridge TRUST-Framework
Mehr Vertrauen in KI
Meet the Pride: Lex Parisi
Direktor für Gaming-Marketinglösungen bei Lionbridge Games
Generative KI
- KI-Übersetzungsservices
- Content Remix
KI-Training
- Aurora AI Studio™
Maschinelle Übersetzung
- MT Tracker
Smart Onboarding
Übersetzungsservicemodelle
Content-Services
- Technische Redaktion
- Schulungen
- Finanzberichte
- Digitales Marketing
- Content für SEO
Übersetzung und Lokalisierung
- Videolokalisierung
- Software-Lokalisierung
- Websitelokalisierung
- Übersetzung für regulierte Branchen
- Dolmetscherservices
- Live Events
- Sprachliche Qualitätssicherung
Testdienstleistungen<
- Testservice
- Kompatibilitätsprüfungen
- Interoperabilitätsprüfungen
- Performance-Tests
- Zugänglichkeits-Tests
- Überprüfen des Kundenerlebnisses
Life Sciences
- Pharmazeutik
- Klinisch
- Regulierung
- Nach der Zulassung
- Für Unternehmen
- Medizinprodukte
- Validierung und klinische Praxis
- Regulierung
- Nach der Zulassung
- Für Unternehmen
Bank- und Finanzwesen
Einzelhandel
Luxusgüter
E-Commerce
Lionbridge Games
Automobilbranche
Konsumgüter
Technologie
Industrielle Fertigung
Rechtsdienstleistungen
Tourismus & Gastgewerbe
Insights
- Blogbeiträge
- Fallstudien
- Whitepapers
- Lösungsübersichten
- Infografiken
- E-Books
- Videos
Webinare
Lionbridge Knowledge Hubs
- Positive Patientenergebnisse
- Moderne Lösungen für klinische Studien
- Patienteneinbindung
SPRACHE AUSWÄHLEN:
Wir sind schon seit geraumer Zeit der Meinung, dass die maschinelle Übersetzung (Machine Translation, MT) reif für einen Wandel ist. Unsere Experten erklären, warum das so ist.
Sie sprechen unter anderem über die folgenden Themen:
Je mehr Sie über MT und generative KI wissen, desto gezielter können Sie die Tools für Ihren individuellen Bedarf einsetzen. Nutzen Sie die Stärken der verschiedenen Paradigmen, damit die Übersetzungseffizienz steigt, mehr Content generiert wird und Kosten gespart werden.
Angesichts der Verbreitung und des Potenzials von generativer KI (GenKI) und großen Sprachmodellen (Large Language Models, LLMs) haben wir den Lionbridge Machine Translation Quality Tracker verbessert. Künftig wird der Bericht neben den Ergebnissen von GPT-3.5 und Davinci auch GPT-4-Übersetzungsergebnisse und natürlich die Leistung der NMT-Engine (neuronale MT) enthalten.
Wir mussten mit einigen Problemen zurechtkommen, darunter schlechte Performance, die aus verschiedenen Gründen auftretende Unfähigkeit, Übersetzungen bereitzustellen, und inkonsistentes Verhalten wie das Fehlen von Übersetzungen in manchen Situationen, während die Übersetzungen bei anderer Gelegenheit erstellt wurden.
GPT-4 hat einen bestimmten Satz in unserem MT-Testtext nicht übersetzt.
Nach einigen Recherchen konnten wir feststellen, dass dieses Problem auftrat, wenn ein Begriff mit sexueller Konnotation in bestimmten Kontexten verwendet wurde. Der fragliche Satz war dabei völlig normal und in keiner Weise anstößig. Trotzdem löste er den GPT-4-Filter für sexuelle Inhalte aus. In der Folge zensierte die KI die Übersetzung des Satzes, sodass er nicht ausgegeben wurde. Dies hat uns aus zwei Gründen überrascht:
Die typische Verwendung dieses Begriffs an sich war einwandfrei.
Es gab keine problematische Interpretation im Kontext dieses Satzes.
Wir schlossen daraus, dass der GPT-4-Filtermechanismus zumindest in Teilen auf einer einfachen Liste verbotener Wörter basiert und dass diese Liste auch mehrdeutige Begriffe enthält. Dieser Ansatz ist problematisch, weil er Überreaktionen und Fehlalarme sehr wahrscheinlich macht. Bei professionellen Übersetzungen kann dies ernsthafte Komplikationen verursachen.
Da frühere Technologien für maschinelle Übersetzung wie Engines auf Basis neuronaler MT dieses Problem beim Filtern der Inhalte nicht aufweisen, sind wir zu der Überzeugung gelangt, dass es sich um eine der LLM-Technologie innewohnende Restriktion handelt.
Diese Restriktion ist aber für reale Szenarien relevant. Stellen Sie sich zum Beispiel vor, Sie müssten medizinischen Content übersetzen, der im Bereich der Gynäkologie oder Sexualaufklärung angesiedelt ist. Sie müssen dann überracht feststellen, dass ein Teil des Textes vom Sprachmodell nicht übersetzt wird.
Interessanterweise trat dieses Problem nur bei der Übersetzung des betreffenden Satzes ins Chinesische auf, nicht bei Übersetzungen in andere Sprachen. Das wiederum deutet darauf hin, dass die Ausgabe von GPT-4 gefiltert wird. Die Lösung besteht hier einfach darin, den Inhaltsfilter für Übersetzungen zu deaktivieren.
Wir haben festgestellt, dass die Qualität der maschinellen Übersetzung mit LLMs nach fünfwöchiger Beobachtung sehr unterschiedlich war. Das galt insbesondere für GPT-4.
Obwohl wir dieses Ergebnis für generative KI erwartet hatten, war die Inkonsistenz bedeutend signifikanter als erwartet. Sie trat auch auf, nachdem die Kreativität mit den Paramatern „Temperature” und „Top Probability” (Top_p) reduziert und die Ausgabe restriktiver konfiguriert wurde. Jeder einzelne GPT-Durchlauf lieferte unterschiedliche Ergebnisse, auch wenn die Durchläufe unmittelbar nacheinander ausgeführt wurden.
Beide Übersetzungen können trotz der Unterschiede von akzeptabler Qualität sein. Nichtsdestotrotz ist dies ein weiterer Aspekt, bei dem es an Kontrolle und Feinschliff mangelt, und eine weitere Differenz zum bisherigen Paradigma neuronaler MT.
Es zeichnet sich langsam ab, dass dieser potenzielle Paradigmenwechsel – von NMT zu LLM-MT – nicht nur einen technologischer Wandel darstellt, sondern auch eine Änderung unserer Denkweise erforderlich macht: Wahrscheinlich müssen wir uns an weniger deterministische Ergebnisse gewöhnen, auch bei Verwendung identischer Eingabedaten und Parameter. Und mit mehr Variabilität rechnen, als wir es von den aktuellen Automatisierungsverfahren gewohnt sind.
Aber auch wenn wir bis zu einem gewissen Grad mit mehr Unschärfe leben müssen, werden verschiedene Mechanismen und Best Practices dabei helfen, die Varianzen einigermaßen unter Kontrolle zu halten.
Schließlich können Sie unserem Diagramm entnehmen, dass die verringerte Levenshtein-Distanz für GPT-4 nicht auf eine geringere Qualität hindeutet. Sie ist vielmehr Ausdruck der grundsätzlichen Variabilität von GPT-Ausgaben. Es ist durchaus möglich, dass die Linie im nächsten Monat wieder steigt. Wir informieren Sie hier über alle neuen Entwicklungen und Erkenntnisse.
—Rafa Moral, Lionbridge Vice President, Innovation
Unten können Sie in der Liste der bereits von Experten kommentierten Themen blättern.
März 2023 — Ein großes Sprachmodell (Large Language Model, LLM) übertrifft eine neuronale Engine für maschinelle Übersetzung (NMT-Engine). Und nun?
Februar 2023 — Verbesserung der maschinellen Übersetzung: Anpassung & Training
Januar 2023 — Vergleich der Übersetzungsqualität zwischen ChatGPT und den wichtigsten MT-Engines
November 2022 — Verbesserungen bei der MT-Engine von Microsoft
Oktober 2022 — MT und formelle Sprache
September 2022 — Verwendung von Terminologie zur Verbesserung der MT-Qualität
August 2022 — Bewältigen kritischer Fehler bei maschinellen Übersetzungen
Juli 2022 — Sprachen-Ranking für MT
Juni 2022 — Genaue Analyse der MT-Qualität
Mai 2022 — Leistungswerte von Amazon und Yandex im Mai
April 2022 — So schneidet Yandex im April ab
März 2022 — Individuelle MT-Engines im Bewertungsvergleich
Februar 2022 — Die Zukunft der Neuronalen Maschinellen Übersetzung (NMT)
Januar 2022 — Leistungsdaten der MT-Engines im Januar
Dezember 2021 — Lionbridge nimmt Yandex MT in den MT Quality Tracker Wettbewerbscheck auf
November 2021 — Bing Translator macht Fortschritte
Oktober 2021 — Welche Fortschritte die MT-Engine von Amazon macht
September 2021 — Amazon verbessert die MT-Qualität
August 2021 — Top-Tech-Unternehmen und die Entwicklung ihrer MT-Engines
Lassen Sie sich von unseren Experten für automatische Übersetzungen beraten.
Die generative Künstliche Intelligenz (KI) hat einen wichtigen Meilenstein erreicht: In einer unserer vergleichenden Bewertungen hat sie eine neuronale maschinelle Übersetzungs-Engine (Machine Translation, MT) übertroffen. So hat insbesondere das Large Language Model (LLM) GPT-4 für das Sprachpaar Englisch-Chinesisch eine etwas bessere Übersetzungsqualität als Yandex geliefert, wie in Abbildung 1 zu sehen ist.
Diese Entwicklung ist erwähnenswert, da zum ersten Mal seit Beginn der neuronalen maschinellen Übersetzung (Neural MT, NMT) ein anderer MT-Typ eine NMT-Engine übertroffen hat. Und das, obwohl es sich bei dieser Technologie um eine Mehrzweck-Sprachautomatisierungslösung handelt, die nicht speziell für die maschinelle Übersetzung entwickelt wurde.
Warum sollte Sie das interessieren? Wenn Sie ein Anbieter maschineller Übersetzungen sind, müssen Sie an der Spitze des technologischen Fortschritts stehen und sich gut überlegen, wie sich dieser auf ihr aktuelles MT-Angebot auswirken wird, damit Sie wettbewerbsfähig bleiben. Wenn Sie maschinelle Übersetzungen einkaufen, müssen Sie über diese Entwicklungen auf dem Laufenden bleiben, um vernünftige MT-Investitionen zu tätigen, zu denen mit großer Wahrscheinlichkeit auch einige LLM-basierte Technologien (anstelle reiner NMT-Angebote) gehören.
Dabei muss hervorgehoben werden, dass die generative KI noch in den Kinderschuhen steckt und ihre Leistung in einigen Schlüsselbereichen nach wie vor unzureichend ist. So gibt sie bei mehrfacher Ausführung beispielsweise unterschiedliche Ergebnisse aus, hat eine instabile Programmierschnittstelle (Application Programming Interface, API) und produziert mehr Fehler als NMT-Engines. Damit die Technologie sich weiter entwickeln kann, müssen diese Fehler behoben werden. Allerdings nehmen wir bereits jetzt wahr, dass Verbesserungen in rasanter Geschwindigkeit voranschreiten.
Dieses unglaubliche Tempo, mit dem sich LLMs verbessern können, ist ein starkes Argument dafür, dass sie das nächste Paradigma in der maschinellen Übersetzung darstellen. Im Rahmen der Weiterentwicklung des Paradigmas wird es wahrscheinlich eine hybride Phase geben, in der NMT-Anbieter einige Aspekte der LLMs in die NMT-Architektur integrieren.
In unserem Blog wird die Übersetzungsqualität von NMT und LLMs für zwei weitere Sprachpaare miteinander verglichen. Darüber hinaus finden Sie dort weitere Überlegungen, ob dies der Anfang vom Ende des Paradigmas der neuronalen maschinellen Übersetzung ist.
—Rafa Moral, Lionbridge Vice President, Innovation
Gewöhnliche Engines für die maschinelle Übersetzung (MT) liefern zwar häufig akzeptable Ergebnisse für Unternehmen, die ihre Übersetzungen automatisieren wollen. Allerdings können sie mitunter auch suboptimale Ergebnisse liefern. Das ist vor allem dann häufig der Fall, wenn es um technologische oder hochspezialisierte Inhalte geht.
Unternehmen, die die Qualität ihrer maschinellen Übersetzungen verbessern möchten, um ganz bestimmte Ziele zu erreichen, sollten zwei Optionen in Betracht ziehen: MT-Anpassung und/oder MT-Training. Beide Methoden – oder eine Kombination aus beiden – können zu verbesserten Ergebnissen im automatisierten Übersetzungsprozess führen.
Die Ansätze unterscheiden sich jedoch voneinander und sind nicht einfach austauschbar. Tabelle 1 gibt Ihnen einen Überblick über die MT-Anpassung und das MT-Training und enthält Überlegungen zur Bewertung der jeweiligen Methode.
MT-Anpassung | |
---|---|
Was es ist und wie es funktioniert | Eine Anpassung einer bereits bestehenden MT-Engine mit Glossar und DNT-Liste, um die Genauigkeit der maschinell erstellten Übersetzungen zu verbessern |
Was es bewirkt | Verbessert die MT-Vorschläge im Sinne genauerer Ergebnisse und verringert den Nachbearbeitungsbedarf |
Besondere Vorteile | Ermöglicht es Unternehmen, am Markennamen festzuhalten, die eigene Terminologie zu wahren und regionale Unterschiede herauszuarbeiten |
Risiken bei der Verwendung | Die MT-Vorschläge können von schlechter Qualität sein und sich negativ auf das Gesamtbild auswirken, wenn der MT-Prozess unangemessen ausgeführt wird |
Einsatz | Ideal für technologische und detailorientierte Inhalte sowie für alle Inhalte, die Folgendes erfordern: * präzise Übersetzung von Fachterminologie * regionale Variante bei Mangel an Daten für MT-Training |
Erfolgsfaktoren | Ein erfahrener MT-Experte, der Input- und Output-Normalisierungsregeln, Glossare und DNT erfolgreich verwalten kann |
Überlegungen zu Kosten | Einmalige Kosten für die Aktualisierung des Profils, mit dem die MT-Engine gespeist wird, sowie laufende Kosten für die langfristige Pflege des Glossars; relativ preisgünstig, wenn man den potenziellen Nutzen berücksichtigt, und in der Regel unter den Kosten für MT-Training |
Tabelle 1 – Vergleich zwischen MT-Anpassung und MT-Training
MT-Training | |
---|---|
Was es ist und wie es funktioniert | Der Aufbau und das Training einer MT-Engine unter Verwendung umfangreicher zweisprachiger Daten aus Textkörper und Translation Memories, um die Genauigkeit der maschinell erstellten Übersetzungen zu verbessern |
Was es bewirkt | Verbessert die MT-Vorschläge im Sinne genauerer Ergebnisse und verringert den Nachbearbeitungsbedarf |
Besondere Vorteile | Ermöglicht es Unternehmen, eine bestimmte Markenstimme, einen bestimmten Ton und Stil durchzusetzen sowie regionale Unterschiede herauszuarbeiten |
Risiken bei der Verwendung | Das Training bringt unter Umständen wenig Nutzen, wenn nicht genügend Qualitätsdaten zum Trainieren der Engine vorhanden sind; die MT-Vorschläge könnten von schlechter Qualität sein und sich negativ auf das Gesamtbild auswirken, wenn unerfahrene Linguisten Terminologie übermäßig nutzen |
Einsatz | Ideal für hochspezialisierte Content, Marketing- und Kreativinhalte sowie für alle Inhalte, die Folgendes erfordern: * eine bestimmte Markenstimme, einen bestimmten Ton oder Stil * regionale Variante bei genügend Daten für MT-Training |
Erfolgsfaktoren | Mindestens 15.000 eindeutige Segmente, um die Engine angemessen zu trainieren |
Überlegungen zu Kosten | Kosten für das erste Training und potenzielle Kosten für weitere Trainingsaktivitäten, die mittelfristig zu erwägen sind, wenn die MT-Ergebnisse Optimierungsbedarf anzeigen; MT-Training lohnt sich in bestimmten Fällen angesichts der potenziellen Vorteile |
Tabelle 1 – Vergleich zwischen MT-Anpassung und MT-Training
MT-Anpassung | MT-Training | |
---|---|---|
Was es ist und wie es funktioniert | Eine Anpassung einer bereits bestehenden MT-Engine mit Glossar und DNT-Liste, um die Genauigkeit der maschinell erstellten Übersetzungen zu verbessern | Der Aufbau und das Training einer MT-Engine unter Verwendung umfangreicher zweisprachiger Daten aus Textkörper und Translation Memories, um die Genauigkeit der maschinell erstellten Übersetzungen zu verbessern |
Was es bewirkt | Verbessert die MT-Vorschläge im Sinne genauerer Ergebnisse und verringert den Nachbearbeitungsbedarf | Verbessert die MT-Vorschläge im Sinne genauerer Ergebnisse und verringert den Nachbearbeitungsbedarf |
Besondere Vorteile | Ermöglicht es Unternehmen, am Markennamen festzuhalten, die eigene Terminologie zu wahren und regionale Unterschiede herauszuarbeiten | Ermöglicht es Unternehmen, eine bestimmte Markenstimme, einen bestimmten Ton und Stil durchzusetzen sowie regionale Unterschiede herauszuarbeiten |
Risiken bei der Verwendung | Die MT-Vorschläge können von schlechter Qualität sein und sich negativ auf das Gesamtbild auswirken, wenn der MT-Prozess unangemessen ausgeführt wird | Das Training bringt unter Umständen wenig Nutzen, wenn nicht genügend Qualitätsdaten zum Trainieren der Engine vorhanden sind; die MT-Vorschläge könnten von schlechter Qualität sein und sich negativ auf das Gesamtbild auswirken, wenn unerfahrene Linguisten Terminologie übermäßig nutzen |
Einsatz | Ideal für technologische und detailorientierte Inhalte sowie für alle Inhalte, die Folgendes erfordern: * präzise Übersetzung von Fachterminologie * regionale Variante bei Mangel an Daten für MT-Training |
Ideal für hochspezialisierte Content, Marketing- und Kreativinhalte sowie für alle Inhalte, die Folgendes erfordern: * eine bestimmte Markenstimme, einen bestimmten Ton oder Stil * regionale Variante bei genügend Daten für MT-Training |
Erfolgsfaktoren | Ein erfahrener MT-Experte, der Input- und Output-Normalisierungsregeln, Glossare und DNT erfolgreich verwalten kann | Mindestens 15.000 eindeutige Segmente, um die Engine angemessen zu trainieren |
Überlegungen zu Kosten | Einmalige Kosten für die Aktualisierung des Profils, mit dem die MT-Engine gespeist wird, sowie laufende Kosten für die langfristige Pflege des Glossars; relativ preisgünstig, wenn man den potenziellen Nutzen berücksichtigt, und in der Regel unter den Kosten für MT-Training | Kosten für das erste Training und potenzielle Kosten für weitere Trainingsaktivitäten, die mittelfristig zu erwägen sind, wenn die MT-Ergebnisse Optimierungsbedarf anzeigen; MT-Training lohnt sich in bestimmten Fällen angesichts der potenziellen Vorteile |
Tabelle 1 – Vergleich zwischen MT-Anpassung und MT-Training
In unserem Blog können Sie mehr über die Anpassung und das Training von MT-Engines erfahren.
—Thomas McCarthy, Lionbridge MT Business Analyst
Wären große Sprachmodelle (Large Language Models, LLMs) eine gute Alternative zum Vorbild der neuronalen maschinellen Übersetzung (NMT) im Bereich der maschinellen Übersetzung (MT)? Um das herauszufinden, haben wir die Übersetzungsleistung von ChatGPT, der neuesten Version der GPT-3-Familie von LLMs von OpenAI, mit den fünf wichtigsten MT-Engines verglichen, die wir in unserem MT-Qualitäts-Tracker beobachten.
Wie erwartet ist die Übersetzungsqualität der spezialisierten NMT-Engines der von ChatGPT überlegen. Allerdings macht der ChatGPT-Bot überraschenderweise einen erstaunlich guten Job. Wie in Abbildung 1 zu sehen ist, schneidet er fast genauso gut ab wie die spezialisierten Engines.
Wir haben die Qualität auf der Grundlage der umgekehrten Bearbeitungsdistanz unter Verwendung mehrerer Referenzen für das Sprachpaar Englisch-Spanisch berechnet. Die Bearbeitungsdistanz misst dabei die Anzahl der Bearbeitungen, die an der MT-Ausgabe durch menschlichen Eingriff vorgenommen werden müssten, damit das Niveau der resultierenden Übersetzung dem einer menschlichen Übersetzung entspricht. Für unsere Berechnung haben wir die unbearbeitete MT-Ausgabe mit 10 verschiedenen menschlichen Übersetzungen – also mehreren Referenzen – verglichen, anstatt nur mit einer einzigen. Eine umgekehrte Bearbeitungsdistanz bedeutet, dass die Qualität umso besser ist, je höher die resultierende Zahl ist.
Abbildung 1 – Vergleich der Qualität der automatischen Übersetzung zwischen ChatGPT und den wichtigsten MT-Engines auf der Grundlage der umgekehrten Bearbeitungsdistanz unter Verwendung mehrerer Referenzen für das Sprachpaar Englisch-Spanisch
Diese Ergebnisse sind bemerkenswert, da das generische Modell von ChatGPT für Aufgaben der natürlichen Sprachverarbeitung (Natural Language Processing, NLP) und nicht speziell für die Ausführung von Übersetzungen trainiert wurde. Die Leistung von ChatGPT ist vergleichbar mit der Qualität von MT-Maschinen von vor zwei oder drei Jahren.
In Anbetracht der Entwicklung von LLMs – basierend auf der öffentlichen Aufmerksamkeit und den beträchtlichen Investitionen von Unternehmen in diese Technologie – werden wir vielleicht bald sehen, ob ChatGPT die MT-Engines überholt oder ob die MT ein neues LLM-Muster annimmt. Maschinelle Übersetzungen könnten in diesem Fall LLMs als Grundlage verwenden, die Technologie aber dann speziell für die maschinelle Übersetzung feinabstimmen. Das wäre vergleichbar mit dem, was OpenAI und andere LLM-Firmen tun, um ihre generischen Modelle für bestimmte Anwendungsfälle zu verbessern, z. B. um es Maschinen zu ermöglichen, mit Menschen in Dialogform zu kommunizieren. Die Spezialisierung erhöht die Genauigkeit der ausgeführten Aufgaben.
Das Spannende an diesen großen „generischen” Sprachmodellen ist, dass sie so viele verschiedene Dinge tun können und bei den meisten Aufgaben hervorragende Qualität bieten. So wurde beispielsweise GATO von DeepMind, ein weiteres allgemeines Intelligenzmodell, in mehr als 600 Aufgaben getestet und erzielte bei 400 davon Ergebnisse, die auf dem aktuellen Stand der Technik sind.
Zwei Entwicklungslinien wird es auch in Zukunft geben: generische Modelle wie GPT, Megatron und GATO – und spezialisierte Modelle für bestimmte Zwecke, die auf diesen generischen Modellen basieren. Die generischen Modelle sind wichtig, um die künstliche generische Intelligenz (Artificial Generic Intelligence, AGI) voranzutreiben und möglicherweise längerfristig noch beeindruckendere Entwicklungen zu ermöglichen. Spezialisierte Modelle werden auf kurze Sicht für bestimmte Bereiche praktische Verwendung finden. Eines der bemerkenswerten Dinge an LLMs ist, dass beide Linien sich parallel zueinander weiterentwickeln und funktionieren können.
Wir sind gespannt, was die Zukunft bringt. Wir werden LLMs weiterhin evaluieren und die Ergebnisse veröffentlichen, damit Sie über diese interessante Entwicklung auf dem Laufenden bleiben. Lesen Sie unsere Blogs, um einen tieferen Einblick in die Übersetzungsleistung von ChatGPT zu erhalten und mehr über ChatGTP und die Übersetzung im Allgemeinen und über die Gründe zu erfahren, warum es sich wohl um einen Gamechanger für die Branche handelt.
—Rafa Moral, Lionbridge Vice President, Innovation
Zwischen dem 11. Oktober und dem 1. November hat sich die Leistung der maschinellen Übersetzung (Machine Translation, MT) von Microsoft insgesamt deutlich verbessert. Mit diesen jüngsten verbesserten Ergebnissen von Bing Translator sind die wichtigsten MT-Engines jetzt allesamt etwa gleichauf. Dementsprechend gibt es auch einen engen Kampf um die Spitzenposition.
In den letzten Monaten gab es bei den anderen relevanten Engines keine interessanten Verbesserungen mehr zu verzeichnen. Wir hoffen also, dass diese Entwicklungen bei Microsoft endlich die Phase der Stagnation beenden und ein Zeichen für künftige Weiterentwicklungen sind.
Über unsere übliche Messung von Einzelreferenzübersetzungen hinaus haben wir die Resultate von Microsoft durch eine zweite Nachverfolgung erhärtet, die mehrere Referenzen umfasste. Dabei verwendeten wir anstelle von nur einer Übersetzung zehn von Menschen angefertigte Referenzübersetzungen – sozusagen der Goldstandard in diesem Kontext. Dadurch ergibt sich eine präzisere Editierabstandsmetrik, die mehrere mögliche korrekte Übersetzungen in den Endergebnissen berücksichtigt.
Jetzt, da wir uns dem Ende des Jahres nähern, lässt sich feststellen, dass es 2022 kaum große Veränderungen gab. Alles ist mehr oder weniger beim Alten geblieben. Eben deshalb auch ist der Sprung vorwärts bei der MT-Engine von Microsoft Bing der wahrscheinlich bemerkenswerteste Fortschritt im ganzen Jahr. Wie wir schon zu Beginn des Jahres angemerkt haben, könnte das aktuelle MT-Paradigma früher oder später stagnieren. Wir hoffen also, dass das Jahr 2023 viele Überraschungen für uns und die maschinelle Übersetzung bereithält.
—Rafa Moral, Lionbridge Vice President, Innovation
In diesem Monat möchten wir Ihr Augenmerk auf formelle Aspekte der Sprache und darauf lenken, wie schwierig, aber keineswegs unmöglich es ist, sie bei der maschinellen Übersetzung (Machine Translation, MT) in der richtigen Weise zu handhaben.
MT-Engines können falsche und inkonsistente formelle Ergebnisse hervorbringen. Warum? Weil MT-Modelle in der Regel eine Übersetzung für jedes einzelne Segment liefern. Wenn der Inhalt des Segments aber mehrere Bedeutungen hat, muss das Modell eine Übersetzung aus mehreren gültigen Optionen auswählen, und zwar ohne Berücksichtigung der Zielgruppe. Lässt man das Modell zwischen verschiedenen gültigen Optionen wählen, kann dies zu inkonsistenten Übersetzungen oder Übersetzungen einer unpassenden Formalitätsebene führen.
Korrekte Resultate zu erhalten wird besonders dann schwierig, wenn die Ausgangssprache weniger Formalitätsebenen als die Zielsprache hat. Sprachen wie Französisch haben zum Beispiel klar definierte formale Modi – tu vs. vous –, das Englische hingegen nicht.
Die meisten MT-Systeme unterstützen zwar keine formalen oder Gender-Parameter für Sprachen, doch auch in diesen Bereichen werden Fortschritte erzielt. Gegenwärtig bieten DeepL (API) und Amazon (Konsole und SDK) Funktionen zur Steuerung formaler Aspekte. Smart MT™ von Lionbridge, eine maschinelle Übersetzungslösung für Unternehmen, ermöglicht die Anwendung linguistischer Regeln auf den Zieltext, um maschinelle Übersetzungen im gewünschten Stil oder der gewünschten formalen Ebene zu erstellen.
Es ist von entscheidender Bedeutung, den Ausgangstext so zu übersetzen, dass er den Anforderungen des Zielpublikums entspricht, was auch die Berücksichtigung formeller und informeller Sprache in der maschinellen Übersetzung einschließt. Übersetzungen, die unangemessen oder – schlimmer noch – unhöflich wirken, können Ihr Image bei Ihren Zielgruppen nachhaltig beschädigen.
Lesen Sie unseren Blog, um mehr über MT und formelle bzw. informelle Sprache zu erfahren.
—Yolanda Martin, Lionbridge MT Specialist
Der Einsatz maschineller Übersetzungen (Machine Translation, MT) kann von enormen Vorteil sein, ist aber stets mit Vorsicht zu genießen. Herkömmliche MT-Engines können fehlerhafte Übersetzungen und vor allem in bestimmten Fachbereichen aus terminologischer Sicht unerwünschte Ergebnisse liefern. Dies kann sich insbesondere in den Bereichen Medizin und Recht negativ auswirken. Man kann jedoch gewisse Maßnahmen treffen, um solche Fehler bei der MT-Ausgabe zu minimieren.
Durch den Einsatz von Terminologie etwa kann man die Qualität maschineller Übersetzungen verbessern und genaue, konsistente Resultate erzielen.
Entscheidend ist dabei, kundenspezifische MT-Systeme mit domänenspezifischen zweisprachigen Texten zu trainieren, die über die richtige Fachterminologie verfügen. Dennoch können genaue Übersetzungen nicht garantiert werden, wenn die Maschinen mit spezialisierten Texten trainiert werden und die Terminologie nicht einheitlich verwendet wird. Die aktuelle Forschung in diesem Bereich empfiehlt, sprachliche Informationen durch Annotationsmethoden in Systeme für neuronale maschinelle Übersetzungen (Neural Machine Translation, NMT) einzubringen. Die Umsetzung der manuellen oder halbautomatischen Annotation hängt von den verfügbaren Ressourcen (z. B. Glossare) und den Einschränkungen (z. B. Zeit, Kosten und Verfügbarkeit von fachlichen Prüfern) ab.
Smart MT™ von Lionbridge ermöglicht die Anwendung von linguistischen Regeln auf den Ausgangs- und Zieltext sowie die Durchsetzung von Terminologie auf der Grundlage von Do Not Translate- (DNT) und Glossarlisten, die einem bestimmten Profil hinzugefügt wurden. Wir unterstützen unsere Kunden bei der Erstellung und Pflege von Glossaren, die regelmäßig überarbeitet werden, um neue, relevante Begriffe aufzunehmen und veraltete Terminologie auszumustern. Einmal in Smart MT erstellte Glossare können dann für alle MT-Engines verwendet werden, wodurch Sie Zeit und Geld sparen.
Die Verwendung von Glossaren für MT-Projekte ist nicht so einfach, wie es aussieht. Sie können bei unsachgemäßer Verwendung sogar die Gesamtqualität der maschinellen Übersetzung negativ beeinflussen. Der beste Weg, die Terminologie in der maschinellen Übersetzung zu verfolgen, ist das maschinelle Training. Die Kombination aus geschulten MT-Engines, der Anpassung von Glossaren und der Festlegung von Regeln für die Vor- und Nachbearbeitung stellt sicher, dass die Ausgabe die richtige Terminologie enthält und im Stil der Dokumentation des Kunden entspricht.
Lesen Sie unseren Blog, um mehr über die Verwendung von Terminologie zur Verbesserung der MT-Ausgabe zu erfahren.
—Yolanda Martin, Lionbridge MT Specialist
Da sich Unternehmen zunehmend auf die maschinelle Übersetzung (Machine Translation, MT) als Standardverfahren verlassen, müssen Mitarbeiter proaktiv dabei helfen, die Ausbreitung kritischer Fehler zu verhindern.
Diese sind bedeutend problematischer als gewöhnliche MT-Fehler. Bei letzteren geht es um Fehlerarten, die linguistische Merkmale wie Rechtschreibung, Grammatik oder Zeichensetzung betreffen. Kritische Fehler hingegen reichen über die sprachliche Ebene hinaus und liegen vor, wenn das MT-Ergebnis gefährlich von der beabsichtigten Botschaft abweicht. Daraus resultierende Fehlinformationen oder Missverständnisse können den Ruf eines Unternehmens schädigen, zu finanziellen oder rechtlichen Problemen führen und nachteilige Folgen für die öffentliche Sicherheit oder Gesundheit haben. Es ist wichtig, Wege zu finden, um diese Fehler rechtzeitig zu erkennen und so zu verhindern, dass Ihre Markenbotschaft verfälscht wird.
Lionbridge führt spezifische automatisierte Qualitätsprüfungen in übersetzten Texten durch, um kritische Fehler zu erkennen, wahrt aber gleichzeitig den Geschwindigkeitsvorteil von MT und reduziert die Notwendigkeit menschlicher Eingriffe.
Diese automatischen Prüfungen erkennen:
Unternehmen werden besser vor katastrophalen Fehlern geschützt sein, wenn Informatiker die bestehende MT-Technologie so verbessern, dass diese Übersetzungsfehler vermieden werden. Bis es soweit ist, können wir automatisierte Technologien einsetzen, um potenzielle Probleme zu erkennen, problematische Sätze zu überarbeiten und die präzise Inhaltswiedergabe während des Übersetzungsprozesses zu fördern.
In unserem Blog setzen wir uns ausführlich mit der Frage auseinander, wie man mit kritischen Fehlern bei der maschinellen Übersetzung umgeht und sie am besten vermeidet.
—Luis Javier Santiago, MT Group Leader,
und Rafa Moral, Lionbridge Vice President, Innovation
Google NMT, Bing NMT, Amazon, DeepL, Yandex – welche MT-Engine ist die beste? Die Daten des letzten Monats – und der aktuelle allgemeine Trend – zeigen, dass die wichtigsten Engines mit recht ähnlichen Ergebnissen abschneiden. Gerade deshalb lohnt es sich, bei der Entwicklung Ihrer MT-Strategie zusätzliche Faktoren zu berücksichtigen und auf die Details zu achten. Ein gutes Beispiel dafür sind die Ergebnisse der MT-Engines bei spezifischen Sprachpaaren.
Wenn Sie herausfinden, wie schwierig es für Engines ist, bestimmte Sprachpaare zu bearbeiten, können Sie Ihr Budget besser einteilen, wenn Sie die Übersetzungskosten für mehrere Sprachen planen. So erfordern beispielsweise komplexe Sprachpaare mehr Aufwand, um qualitativ hochwertige Übersetzungen zu bekommen. Ein umfassendes Verständnis der Komplexität einer Sprache kann Ihnen also bei Ihren Geschäftsentscheidungen helfen.
Die Einstufung von Sprachen nach ihrer Übersetzbarkeit ist kein einfaches Unterfangen; wir können jedoch verschiedene Metriken für die Bewertung heranziehen. Die Bearbeitungsdistanz, d. h. die Anzahl der Änderungen, die erforderlich sind, damit der endgültige Text eine professionelle Qualität aufweist, kann einen Eindruck von der Komplexität der MT und der Übersetzbarkeit (M-Übersetzbarkeit, m-translatability) eines Sprachpaares vermitteln.
Die meisten romanischen Sprachen, wie z. B. Portugiesisch, Spanisch, Französisch und Italienisch, erfordern weniger Änderungen, um bei der Übersetzung aus dem Englischen ein hohes Qualitätsniveau zu erreichen. Nach unseren Erkenntnissen sind diese Zielsprachen für die Engines am einfachsten zu handhaben. Daher belegen sie auch die ersten vier Plätze in unserer Rangliste der M-Übersetzbarkeit. Im Vergleich dazu sind Ungarisch und Finnisch - zwei uralische Sprachen - ziemlich komplex und sind daher in der Rangliste auf den letzten beiden Plätzen 27 und 28 gelistet. Dasselbe gilt für Estnisch, das auch zur Familie der uralischen Sprachen gehört. Diese Ergebnisse basieren auf Millionen von Sätzen, die von Lionbridge verarbeitet wurden, und unterstreichen die Bedeutung von Sprachfamilien für die MT-Leistung.
Auch wenn der Vergleich innerhalb einer Sprache nur begrenzt möglich ist, können die Ranglisten doch interessante Erkenntnisse für ein besseres Management mehrsprachiger Projekte liefern. In unserem Blog finden Sie unsere vollständige Rangliste der Sprachen.
—Rafa Moral, Lionbridge Vice President, Innovation
Im Juni haben wir minimale Verbesserungen der russischen Übersetzungen durch die Yandex-Engine sowie einen geringen Rückgang der Übersetzungsleistung durch die MT-Engine von Microsoft Bing beobachtet. Handelt es sich dabei um relevante Veränderungen oder um unbedeutende und unberechtigte Schwankungen? Um das herauszufinden, haben wir die Ergebnisse einmal anders analysiert.
Anstatt einen einzigen „Goldstandard” zu verwenden, der den Unterschied zwischen der MT-Übersetzung und einer „perfekten” menschlichen Übersetzung ermittelt, haben wir mehrere Referenzübersetzungen verwendet. So haben wir jede maschinell erstellte Übersetzung mit zehn Übersetzungen von professionellen Experten verglichen. Bei diesem Ansatz waren die Schwankungen in der Übersetzungsqualität von Yandex und Microsoft Bing im Juni nicht mehr festzustellen. Insofern lautet das Fazit, dass sich die Qualität der maschinellen Übersetzungen nicht wirklich verändert hat; also nichts Neues im Juni.
Manchmal können Daten und ihre grafischen Darstellungen irreführend sein. Dies gilt besonders dann, wenn die Abweichungen zwischen den verschiedenen Messungen gering sind. Es ist eine gute Idee, generell mehr als einen Ansatz zur Auswertung der Daten zu verwenden, um die Ergebnisse präziser zu interpretieren.
Wir gehen davon aus, dass sich die Qualität der MT-Engines in den kommenden Monaten kaum verändern wird. Wir werden diesen Abschnitt also nutzen, um Analysen und allgemeine Beobachtungen zu maschinellen Übersetzungen zu präsentieren. In diesem Rahmen werden wir im nächsten Monat Vergleiche zwischen MT-Sprachpaaren anstellen. Wir untersuchen dabei, ob Sprachen und Sprachfamilien anhand von Daten nach MT-Komplexität zu klassifizieren sind und feststellbar ist, ob einige Sprachpaare leichter zu übersetzen sind als andere.
—Rafa Moral, Lionbridge Vice President, Innovation
Auch in diesem Monat hat sich bei den MT-Engines nicht sehr viel getan.
Wir haben festgestellt, dass die Amazon Engine Fortschritte im Hinblick auf das Sprachpaar Englisch-Spanisch erzielt hat. Damit ist sie jetzt die führende Engine für diese Kombination. Auch in den anderen Sprachen hat Amazon gewisse Fortschritte gemacht, die jedoch weniger relevant sind als die gerade erwähnten. Wir vermuten, dass diese Fortschritte auf Änderungen allgemeiner Einstellungen sowie auf einen stärkeren Fokus auf das Sprachpaar Englisch-Spanisch zurückzuführen sind. Dies wirkt sich auch auf die Verarbeitung einiger Sonderzeichen und Zeichenfolgen mit Maßangaben aus.
Yandex hat bereits im zweiten Monat in Folge Fortschritte gemacht, auch wenn diese ebenfalls überschaubar sind. Interessanterweise betreffen diese ebenso das Spanische.
Wie bereits erwähnt, gab es jedoch keine wesentlichen Änderungen. Im Großen und Ganzen schneiden alle Suchmaschinen ähnlich ab. In den kommenden Monaten werden wir einige spezifische MT-Bereiche analysieren und unsere allgemeinen Beobachtungen teilen. Natürlich werden wir aber auch weiterhin die wichtigsten Entwicklungen verfolgen.
—Rafa Moral, Lionbridge Vice President, Innovation
Nachdem die Leistung der MT-Engine mehrere Monate lang stagnierte, hat Yandex einige Fortschritte gemacht, insbesondere für die deutsche Sprache.
In einer detaillierten Analyse sahen wir Fortschritte bei der Behandlung von Sätzen mit Satzzeichen – wie etwa Fragezeichen, Ausrufezeichen, Klammern und Schrägstrichen – sowie Maßeinheiten. Diese Entwicklungen könnten eher auf eine Feinabstimmung der MT-Einstellungen als auf Verbesserungen der Modelle zurückzuführen sein. Allerdings konnten wir auch eine Verbesserung beim Umgang mit seltenen Begriffe feststellen, so dass der Fortschritt von Yandex auch auf eine Verfeinerung der Modelle oder mehr Datentraining zurückzuführen sein könnte.
Letztes Jahr um diese Zeit zeigten mehrere MT-Engines einige Verbesserungen, die uns neugierig gemacht haben. Gibt es etwa ein zeitliches Muster bei diesen Fortschritten? Und werden wir in diesem Jahr etwas Ähnliches wie im Jahr 2021 sehen? Wir verfolgen die Leistung dieser Engines weiter und werden in den nächsten Monaten über unsere Ergebnisse berichten.
Generell besteht ein steigendes Interesse an der Evaluierung von MT-Engines. Man ist sich mittlerweile größtenteils einig, dass die maschinelle Übersetzung eine ausgereifte Technologie ist. Ihr Nutzen ist offensichtlich und eignet sich für nahezu jeden Übersetzungsfall – mit oder ohne menschliches Eingreifen und hybride Ansätze. Aber viele Nutzer kämpfen immer noch damit, den richtigen Weg zur Bewertung, Messung und Verbesserung von MT-Ergebnissen zu finden.
—Rafa Moral, Lionbridge Vice President, Innovation
Wenn Sie diesem Blog schon eine Weile folgen, sind Sie mit unseren generellen MT-Bewertungsvergleichen vertraut. Jeden Monat ermitteln wir, welche MT-Engines für bestimmte Sprachpaare am besten abschneiden, und verfolgen ihre Entwicklung. Im März ist die Leistung der unterschiedlichen Engines weitestgehend gleich geblieben. Diesen Trend beobachten wir schon seit geraumer Zeit. Wie wir letzten Monat angemerkt haben, könnte dies darauf hindeuten, dass ein neues MT-Paradigma erforderlich ist.
Und während wir unsere Ansichten über die allgemeine Entwicklung mitteilen, nehmen Unternehmen auch zunehmend selbst vergleichende Bewertungen der individuellen MT-Engines vor. Im Gegensatz zur allgemeinen Übersicht berücksichtigen diese Auswertungen die spezifischen Bedürfnisse eines Unternehmens, um die am besten geeignete Engine auszuwählen.
Wenn ein Unternehmen mit dem Einsatz von MT beginnen oder die Art der derzeitigen Nutzung von MT optimieren möchte, ist es entscheidend, die am besten arbeitende MT-Engine für den Zweck zu ermitteln. Bei der Durchführung kundenspezifischer Bewertungen gehen wir ähnlich wie auf dieser Seite beschrieben vor. Der Unterschied ist aber: Wir geben unsere Empfehlung basierend auf den spezifischen Inhalten eines Unternehmens und den Anforderungen der betreffenden Sprachpaare.
Auch wenn es individuelle MT-Bewertungsvergleiche schon seit Jahren gibt, wächst die Nachfrage nach ihnen immer weiter. Wir führen diesen Trend auf die wichtige Rolle zurück, die MT für den Erfolg von Unternehmen in einem digitalen Markt spielt.
—Rafa Moral, Lionbridge Vice President, Innovation
Die MT-Engine von Google verzeichnete im Januar und Februar 2022 minimale Verbesserungen, während die anderen von uns beobachteten Engines stagnierten. Diese Beobachtungen werfen einige wichtige Fragen auf. Hat das System der Neuronalen Maschinellen Übersetzung (NMT, Neural Machine Translation) sich eingependelt? Ist ein generelles Umdenken angesichts der Tatsache erforderlich, dass die Engines keine wesentlichen Fortschritte mehr erzielen? Wir haben ähnliche Entwicklungen beobachtet, als NMT die Statistische MT ersetzt hat.
Zum Ende der SMT-Ära hat sich die Qualität der Ergebnisse quasi kaum noch verändert. Darüber hinaus hat sich die Qualität der verschiedenen MT-Engines einander angenähert. Wir sehen dort ähnliche Tendenzen. Auch wenn die NMT nicht in Kürze ersetzt werden wird: Wenn wir an die Theorie des exponentiellen Wachstums und immer höherer Renditen glauben, und wenn wir die 30-jährige Erfolgsgeschichte der regelbasierten MT und die jahrzehntelange Bedeutung der SMT in Betracht ziehen und dabei bedenken, dass sich die NMT jetzt im sechsten Jahr befindet, ist ein neuer Paradigmenwechsel vielleicht gar nicht so weit entfernt.
—Rafa Moral, Lionbridge Vice President, Innovation
Im Januar zeigten die wichtigsten MT-Engines keine signifikanten Veränderungen ihrer Leistungsdaten.
Google verzeichnete in einigen Sprachen und Domänen kleine, schrittweise Verbesserungen. Die Leistung der meisten anderen Engines ist dagegen gleich geblieben. Bei Microsoft gab es in den letzten Monaten Verbesserungen, doch die Entwicklung stagnierte im Januar. Insgesamt ist die Qualität von Google Translate im Bereich der allgemeinen MT-Technologie weiterhin führend.
Im Dezember haben wir eine fünfte MT-Engine in unseren Tracker aufgenommen. Durch das Monitoring von Yandex können wir die MT-Qualität der russischen Sprache besser analysieren.
—Rafa Moral, Lionbridge Vice President, Innovation
Im Dezember haben wir unsere Vergleichsprüfung der Qualität von MT-Trackern auf Yandex MT ausgeweitet.
Unsere bisherigen Tests haben gezeigt, dass Yandex:
Andere Beobachtungen zeigen, dass sich der Output von MS Bing in den letzten Monaten des Jahres 2021 angenehm verbessert hat. Vor allem Übersetzungen ins Chinesische sind besser geworden. Auch Amazon hat einige Fortschritte erzielt. Zum Beginn des neuen Jahres übernimmt Google nun den Stab und bringt bessere Ergebnisse. Vor allem Übersetzungen ins Spanische, Russische und Deutsche haben sich verbessert. In den fünf Wochen, in denen wir Yandex untersucht haben, war keine Entwicklung festzustellen.
—Rafa Moral, Lionbridge Vice President, Innovation
Nach diversen Tests und Schwankungen der Gesamtleistung über mehrere Wochen zeigt sich nun, dass die NLP-Ingenieure von Microsoft wohl einen Treffer gelandet haben. Innerhalb der letzten Wochen waren erhebliche Verbesserungen des Bing Translator zu verzeichnen – insgesamt und ganz besonders für Chinesisch. Damit erweist sich diese MT-Engine als der große Gewinner des letzten Monats. Bing Translator konnte in vielen Bereichen Lücken schließen und übertrifft inzwischen sogar die Leistung einiger Konkurrenzprogramme. Bing Translator bleibt eine der MT-Engines, die am besten anzulernen sind. Dank der vorgenommenen Optimierungen bildet das Programm nun einen guten Startpunkt für die Entwicklung individueller, präzise auf Ihre Inhalte angepasster Modelle.
—Jordi Macias, Lionbridge Vice President, Language Excellence
Die MT-Engines von Amazon entwickelten sich entsprechend dem seit etwa einem Monat bestehenden Trend auch im Oktober weiter positiv. Diese kontinuierlichen Fortschritte sind nicht die ersten schrittweisen Verbesserungen innerhalb der letzten Monate.
Zur Erinnerung hier einige der Bereiche, in denen sich die MT-Engines von Amazon in den letzten Monaten weiterentwickelt haben:
—Jordi Macias, Lionbridge Vice President, Language Excellence
Der September erweist sich als ein guter Monat für die MT-Engines von Amazon. Erst konnte das Unternehmen die Qualität der MT-Ergebnisse für Deutsch und Russisch verbessern. Dann war ein sprunghafter Qualitätsanstieg für Sprachpaare mit Spanisch und Chinesisch zu verzeichnen. Diese Fortschritte sind nicht die ersten schrittweisen Verbesserungen innerhalb der letzten Monate.
Hier sind einige weitere Änderungen in Bezug auf die MT-Engines von Amazon:
—Yolanda Martin, Lionbridge MT Specialist
Alle großen Technologieunternehmen – z. B. Microsoft, Google, Amazon, Facebook und jetzt auch Apple – haben ihre eigenen MT-Engines entwickelt. In Märkten außerhalb der USA konkurrieren viele weitere Branchengrößen in diesem Bereich. Diese Firmen sehen MT und Natural Language Processing (NLP) offensichtlich als unverzichtbare Tools in der heutigen globalen, stark vernetzten Welt.
Besuchen Sie diese Rubrik regelmäßig, in der Lionbridge den Wettbewerb in der Branche im Auge behält. Unter Berücksichtigung der spezifischen Anforderungen eines Unternehmen sowie der gewünschten Sprachpaare und Inhaltstypen werden wir an dieser Stelle die jeweils besten MT-Engine-Optionen vorstellen.
Wir gehen davon aus, dass sich das Rennen um die beste MT-/NLP-Lösung beschleunigen wird, da derzeit so viele technologische Spitzenunternehmen in diesen Bereich investieren. Es besteht kein Zweifel daran, dass Apple – bekannt für Detailtreue und Spitzenqualität – den Einsatz anderer Unternehmen hier deutlich vorantreiben wird.
—Rafa Moral, Lionbridge Vice President, Innovation