Maschinelle Übersetzung: Wichtige Begriffe kurz erklärt

Nach einer fast 90-jährigen Entwicklungsgeschichte, an deren Anfang eine holprige Wort-für-Wort-Übersetzung stand, ist die maschinelle Übersetzung im Jahr 2022 aus unserem Online-Alltag nicht mehr wegzudenken.

Künstliche Intelligenz (Artificial Intelligence, AI) ist für uns inzwischen untrennbar mit technischem Fortschritt verbunden. Tatsächlich wird sie in immer mehr Bereichen der Industrie erfolgreich eingesetzt. Immer wieder begegnen wir Schlagwörtern, die mit künstlicher Intelligenz zu tun haben und Weiterentwicklungen in diesem Bereich beschreiben. Dazu gehören Begriffe wie neuronale maschinelle Übersetzung, eine Technik, die die Lokalisierungsbranche in den letzten Jahren grundlegend verändert hat. Daneben hat die maschinelle Übersetzung, Begriffe wie Post-Editing und Machine-Translation-Engine hervorgebracht hat, die ebenfalls einer Erklärung bedürfen.

Verbrauchern und Unternehmen stehen immer mehr solcher Anwendungen mit künstlicher Intelligenz zur Verfügung. Gar nicht so einfach, da den Überblick zu behalten. Was steckt hinter all den Begriffen zum Thema maschinelle Übersetzung?

Bei Lionbridge arbeiten einige der weltweit erfahrensten Experten für maschinelle Übersetzung. Mit ihrer Unterstützung haben wir diesen Beitrag verfasst. Er hilft Ihnen, die kleinen und großen Unterschiede zwischen den Begriffen aus der Welt der maschinellen Übersetzung zu verstehen.

Künstliche Intelligenz (Artificial Intelligence, AI)

Maschinelle Übersetzungen basieren heutzutage auf künstlicher Intelligenz. AI ist die Art von „Intelligenz“, die Maschinen nutzen, wenn sie Tasks (also Datenverarbeitungsaufgaben) ausführen, die eigentlich typisch menschliche Denkprozesse voraussetzen, wie Lernen und Problemlösung.

Dabei werden die Prozesse nachgeahmt, die im menschlichen Gehirn zwischen den einzelnen Nervenzellen ablaufen. Statt Computern eine große Zahl an Regeln vorzugeben, die sie zwingen Aufgaben auf eine ganze bestimmte Art und Weise auszuführen, setzt man bei der AI auf selbstlernende Systeme, die nicht Regeln stur befolgen, sondern diese selbst anhand von Datenmaterial entwickeln.

Durch die zunehmende Performance von Computersystemen wird auch die Leistung von AI stetig verbessert. Leistungsstärkere Computer bedeuten nicht nur eine höhere Verarbeitungskapazität, sondern auch qualitative Fortschritte im maschinellen Lernen (Machine Learning). Durch Machine Learning schaffen Computer die „Wissensgrundlage“, die für AI-basierte Anwendungen nötig ist.

Maschinelles Lernen (Machine Learning, ML)

Maschinelles Lernen ist eine Disziplin der Computerwissenschaften. Man nutzt dafür riesige Datenmengen, um Computern beizubringen, wie sie einen Task ausführen müssen. Maschinelles Lernen besteht darin, die Daten für einen bestimmten Task zu prüfen, Muster in diesen Daten zu erkennen und die Muster zu verknüpfen. Die so gewonnenen Erkenntnisse werden genutzt, um festzulegen, wie der Computer den Task ausführt. Wenn der Computer den Task anschließend besser ausführen kann, war das Machine Learning erfolgreich.

Wir verfügen heutzutage über Daten zu jedem erdenklichen Thema. Maschinelles Lernen erweitert, was Computer in unzähligen Bereichen leisten können, von der Wetterprognose über den automatisierten Aktienkauf bis zur maschinellen Übersetzung.

Als Experte für maschinelle Übersetzung hilft Ihnen Lionbridge dabei, sich für die richtige Engine für Ihr Unternehmen zu entscheiden.

Maschinelle Übersetzung (Machine Translation, MT)

Einfach gesagt, ist maschinelle Übersetzung die automatisierte Übersetzung eines Textes: Man füttert Computer, also maschinelle Übersetzungssysteme, mit einem Ausgangstext in einer Sprache, und bekommt als Ergebnis den Text in einer anderen Sprache. Die maschinelle Übersetzung ist nicht perfekt, das gilt auch für Anbieter wie Google Translate oder DeepL. Trotzdem ist eine Machine-Translation-Engine eines der wichtigsten Hilfsmittel, um effizienter gute Übersetzungen anzufertigen.

Die maschinelle Übersetzung hat in den letzten Jahrzehnten große Fortschritte erzielt. Insbesondere durch die Entwicklung der neuronalen maschinellen Übersetzung bietet sie eine bessere Übersetzungsqualität und steht für mehr Sprachkombinationen zur Verfügung als noch vor wenigen Jahren. Ihre Entwicklung ist eng mit der immer ausgereifteren Nutzung von Computersystemen verknüpft: Bei den ersten MT-Systemen ging es um das simple Ersetzen von Wörtern. Es folgte die regelbasierte maschinelle Übersetzung – mit expliziter Codierung von Grammatik und Vokabular. Maschinelle Übersetzungssysteme dieser Art lieferten nachvollziehbare Übersetzungen mit konsistenter Terminologie, allerdings gab es viele Defizite bei der Qualität, zum Beispiel bei der Lesbarkeit. Der nächste Schritt war die statistische maschinelle Übersetzung, die sich auf große Datenmengen stützt, gefolgt von der neuronalen maschinellen Übersetzung, die Deep Learning, also leistungsstarke künstliche neuronale Netzwerke, einsetzt.

Statistische maschinelle Übersetzung (Statistical Machine Translation, SMT)

Die statistische maschinelle Übersetzung nutzt maschinelles Lernen, um eine Vielzahl von möglichen Übersetzungen für einen Satz zu generieren. Danach wird die beste Übersetzung ausgewählt – gestützt auf die Wahrscheinlichkeit, mit der Wörter und Sätze in der Ausgangs- und der Zielsprache auftreten.

Im Gegensatz zur regelbasierten maschinellen Übersetzung folgt die SMT also nicht starren Regeln, die bei einer falschen Übersetzung einzeln angepasst werden müssten. Vielmehr ergeben sich die Übersetzungen aus den empirischen Gegebenheiten der jeweiligen Sprachen. Durch die SMT änderte sich grundlegend die Art, wie maschinelle Übersetzung Begriffe übersetzt.

SMT „lernt“ mithilfe sogenannter N-Gramme (Englisch „n-grams“). Das sind kleine Gruppen von Wörtern, die in der Ausgangssprache und in der Zielsprache zusammen auftreten.

Während des maschinellen Lernens wird das SMT-System mit Trainingsmaterial gefüttert, also mit einer Vielzahl von Beispielsätzen in der Ausgangssprache und ihren Übersetzungen in der Zielsprache. Der Lernalgorithmus unterteilt die Sätze in der Ausgangssprache und die Sätze in der Zielsprache in N-Gramme. Er bestimmt, welche zielsprachlichen N-Gramme wahrscheinlich in einer Übersetzung erscheinen, wenn ein bestimmtes N-Gramm in einem Satz der Ausgangssprache auftritt.

Danach bildet der Lernalgorithmus ein Sprachmodell. Dieses berechnet, wie hoch die Wahrscheinlichkeit ist, dass bestimmte Wörter und Sätze in der Zielsprache nebeneinander auftreten. Wenn das SMT-System nun einen Text übersetzt, gliedert es die Sätze des Ausgangstexts in N-Gramme, findet die passenden N-Gramme in der Zielsprache und generiert mögliche Übersetzungen. Die Wahl fällt auf die Übersetzung, deren N-Gramme am stärksten mit den N-Grammen in der Ausgangssprache korrelieren und deren Wörter in der Zielsprache am ehesten zusammen auftreten.

Die statistische maschinelle Übersetzung funktioniert überraschend gut – gerade wenn man bedenkt, dass das SMT-System keine linguistische Grundlage hat. Das System basiert nicht auf vollständigen Sätzen, sondern auf N-Grammen. Eine SMT-Übersetzung liest sich flüssiger als eine regelbasierte maschinelle Übersetzung, allerdings fehlt es ihr oft an innerer Logik und Konsistenz. Die neueste Weiterentwicklung der SMT, die neuronale maschinelle Übersetzung, ist ein gewaltiger Sprung nach vorne, weil sie sich die neuesten Fortschritte auf dem Gebiet der AI zunutze macht.

Neuronale maschinelle Übersetzung (Neural Machine Translation, NMT)

Die neuronale maschinelle Übersetzung beseitigt den größten Schwachpunkt der statistischen maschinellen Übersetzung: die Abhängigkeit von der Analyse der N-Gramme. . Wie der statistische Ansatz nutzt die neuronale maschinelle Übersetzung die Rechnerleistung und stützt sich auf Trainingsmaterial. Es gibt aber einen wichtigen Unterschied: Wenn das System das Material durcharbeitet, bestimmt es selbst, wie es alles über dieses Material – also diese Daten – lernt.

NMT-Systeme erstellen für jeden Satz in der Ausgangssprache sogenannte Informationsvektoren: Sie verknüpfen die Informationen zu jedem Wort mithilfe der benachbarten Wörter. Einige Systeme finden Hunderte von Informationen pro Wort und erreichen so eine hohe Genauigkeit. Dank Deep Learning sammeln NMT-Systeme riesige Mengen von Informationen zu jedem Wort und Satz im Ausgangstext. Mittels eines sogenannten Attention-Modells erkennen sie die für den Übersetzungsprozess wichtigen Informationen. Das Ergebnis sind deutlich flüssigere Übersetzungen. Das heißt, computergenerierte Übersetzungen klingen zusehends natürlicher.

Bei der NMT kommen selbstlernende Systeme zum Einsatz. Die Ergebnisse können durch die Auswahl des Trainingsmaterials einfach beeinflusst werden. Auch eine Spezialisierung auf bestimmte Fachgebiete ist bei der NMT besser möglich als bei vorangegangenen Technologien. Daher setzen Übersetzungsmaschinen wie Google Translate, Bing, DeepL und Amazon Translate auf NMT-Systeme.

Die neuronale maschinelle Übersetzung setzt sich immer mehr durch und bedeutet einen Paradigmenwechsel für die Übersetzungsbranche.

Leistungsstärkere Computer bedeuten nicht nur eine höhere Verarbeitungskapazität, sondern auch qualitative Fortschritte im maschinellen Lernen.

Wie funktioniert eine Machine-Translation-Engine (MT-Engine)?

Laut einer Studie würden 40 Prozent der Verbraucher niemals ein Produkt kaufen, wenn die wichtigsten Daten zu diesem Produkt nicht in ihrer Muttersprache verfügbar wären. Diese Zahl zeigt eindrücklich, wie wichtig es für Unternehmen ist, ihre Inhalte möglichst vollständig zu lokalisieren. Natürlich stellt sich hier zuerst immer auch die Frage der Wirtschaftlichkeit und der Machbarkeit.

Selbst erfahrene Übersetzer können pro Tag nur etwa 2000 Wörter übersetzen. Sollen große Mengen an Inhalten schnell in viele andere Sprachen übertragen werden, führt das unweigerlich zu Engpässen und budgetabhängigen Kompromissen bei der Entscheidung, was lokalisiert werden soll.

Maschinelle Übersetzungssysteme können hier Abhilfe schaffen. Sie bieten die Möglichkeit, große Mengen an Texten kostengünstig und in kurzer Zeit zu lokalisieren. Für den Einsatz solcher Systeme sollte allerdings ein Experte für maschinelle Übersetzung wie Lionbridge hinzugezogen werden. Lionbridge kann Ihrem Unternehmen dabei helfen, die richtige Machine-Translation-Engine auszuwählen und an ihre Anwendungsfälle anzupassen.

In jedem Fall sollten Sie sich fragen, ob für die maschinelle Übersetzung Anbieter zur Verfügung stehen, die Ihnen effizient bei der Lokalisierung helfen können. Die Ergebnisse schlecht trainierter Übersetzungssysteme können bei potenziellen Kunden einen verheerenden Eindruck hinterlassen. Eine Machine-Translation-Engine kann für ein Sprachpaar gute Ergebnisse liefern, für ein anderes aber nicht, ebenso sind bestimmte maschinelle Übersetzungssysteme nur für bestimmte Bereiche geeignet. Darüber hinaus gibt es viele Herausforderungen, die bei automatischen Übersetzungen bewältigt werden müssen, damit deren Einsatz tatsächlich einen Mehrwert für die Kunden bietet. Für bestimmte Anwendungsfälle empfiehlt sich außerdem eine Nachbearbeitung der maschinell übersetzten Inhalte. Lionbridge kann Ihnen Spezialisten im Bereich Post-Editing zur Verfügung stellen, die maschinell übersetzte Texte so anpassen, dass sie Humanübersetzungen sehr nahekommen.

Als Experte für maschinelle Übersetzung hilft Ihnen Lionbridge dabei, sich für die richtige Engine für Ihr Unternehmen zu entscheiden.

Lionbridge bietet seinen Kunden seit 2002 maschinelle Übersetzung und Postediting an. Jahr für Jahr optimieren wir unsere Systeme. Wir werden den Einsatz von MT weiter steigern, um unsere Produktionsprozesse zu beschleunigen. Auf unserer Website erfahren Sie mehr rund ums Thema Maschinelle Übersetzung.

Bitte geben Sie eine geschäftliche E-Mail-Adresse an.
Indem Sie das Kästchen unten markieren, stimmen Sie zu, Marketing-E-Mails von uns zu erhalten. Sie werden Informationen über Thought Leadership, Best Practices und Markttrends der Sprachservices von Lionbridge erhalten.

Der Abmeldevorgang und unsere Verarbeitung personenbezogener Daten werden in unserer Datenschutzrichtlinie beschrieben.

linkedin sharing button
  • #blog_posts
  • #translation_localization

Lionbridge
VERFASSER
Lionbridge