Besuchen Sie Lionbridge Games

SPRACHE AUSWÄHLEN:

Neuronale maschinelle Übersetzung: Künstliche Intelligenz erleichtert die mehrsprachige Kommunikation

Die weltweite Datenmenge nimmt seit Jahren exponentiell zu. Von dieser Datenmenge – Big Data genannt – profitieren Unternehmen: Ihre Effizienz und Innovation schnellt in die Höhe. Eine Entwicklung, die sich in absehbarer Zeit noch weiter verstärken wird.

Unternehmen können Daten heute immer effektiver nutzen. Dazu müssen sie allerdings Unmengen an Daten verarbeiten, was eine echte Herausforderung ist. Doch Big Data birgt enorme Chancen: Fortschrittliche Übersetzungs- und Lokalisierungstechnologie ermöglicht es Unternehmen, sich die riesige Datenmenge für die mehrsprachige Kommunikation zunutze zu machen und sich schnell global aufzustellen. Dafür gibt es insbesondere zwei Beispiele, neuronale maschinelle Übersetzungsmaschinen und die in ihrer Leistung schwächere statistische maschinelle Übersetzung.

Paradigmenwechsel in der Übersetzungsbranche

Die zunehmende Datenmenge ist das eine. Das andere sind zwei Entwicklungen, die zu einem Paradigmenwechsel in der Lokalisierungsbranche geführt haben: das exponentielle Wachstum der Rechnerleistung und Deep Learning.

Deep Learning ist eine Art maschinelles Lernen, das auf künstlicher Intelligenz beruht. Google setzt es in seinen Bild- und Spracherkennungsalgorithmen ein.

Auch die Übersetzungs- und Lokalisierungsbranche nutzt Deep Learning. Aus Deep Learning ist nämlich die neuronale maschinelle Übersetzung (Neural Machine Translation, Neural MT oder NMT) entstanden. Die Komplexität der verschiedenen KI-Systeme macht es schwierig zu entscheiden, welche, insbesondere für neuronale maschinelle Übersetzung, Definition die Funktionsweise am besten auf den Punkt bringt.

Was ist NMT?

Und wie macht diese Art der maschinellen Übersetzung die Lokalisierung effizienter?

Die Grundlage der NMT bilden künstliche neuronale Netze, die imitieren, wie ein menschliches Gehirn funktioniert. Sie bestehen aus mehreren Schichten von künstlichen Neuronen, die über Feedback-Loops miteinander interagieren. Die Eingabedaten werden über Attention-Prozesse gewichtet. Dieses Zusammenspiel sorgt für viel präzisere Resultate als bei bisherigen Methoden. Das erklärt, warum, z. B. für neuronale maschinelle Übersetzung, Aufbau und Funktionsweise dieser Programme die Übersetzungseffizienz so enorm steigern.

Wie funktioniert neuronale maschinelle Übersetzung?

Neuronale maschinelle Übersetzung wurde erstmals Ende 2014 erprobt. Zuvor basierte maschinelle Übersetzung auf einem statistischen Modell (Statistical Machine Translation, SMT).

Bei der SMT werden die Übersetzungen auf der Grundlage von Wahrscheinlichkeiten erstellt. Die Begriffe werden so übersetzt, wie sie in den Datenbanken vorheriger Übersetzungen, den sogenannten Translation Memories, am häufigsten vorkommen. Seltene Bedeutungen eines Wortes werden daher bei der SMT oft nicht richtig erkannt. Die NMT kann dieses Problem viel besser bewältigen.

Translation Memories werden sowohl bei SMT- wie auch NMT-Systemen eingesetzt. Bei NMT-Systemen kommen allerdings zwei weitere Dinge hinzu: Deep Learning und wesentlich größere Datenmengen. Auf ihrer Grundlage entsteht ein künstliches neuronales Netzwerk.

Die statistische maschinelle Übersetzung läuft ab wie ein Schachspiel: Das „Universum“ eines Schachprogramms ist begrenzt; das Programm lässt nur eine eingeschränkte Anzahl Züge zu. Aus den möglichen Zügen ermittelt das Programm den jeweils besten.

Das maschinelle Lernen in einem SMT-System funktioniert ähnlich: Zur Erkennung von Korrelationen werden Wortgruppen – sogenannte N-Gramme – in der Ausgangssprache mit den in der Zielsprache auftretenden N-Grammen verglichen. Einzelheiten zur SMT und zu N-Grammen finden Sie in unserem Blog-Artikel Maschinelle Übersetzung: Wichtige Begriffe kurz erklärt.

Was ist neuronale maschinelle Übersetzung?

Die neuronale maschinelle Übersetzung beinhaltet den Aufbau eines neuronalen Systems. Es ist wie Klavierspielen: Wenn man einen Fehler macht, geht man einen Schritt zurück, versucht es erneut und wiederholt die Sequenz, bis sie richtig ist. Genauso bahnen sich NMT-Systeme mit Hilfe selbstlernender Algorithmen den richtigen Weg, verknüpfen Daten und bilden neuronale Netzwerke.

Die NMT ist um vieles effektiver als das auf N-Grammen basierende Modell. Letzteres ist häufig ungenau. Bei der statistischen maschinellen Übersetzung werden die Texte in N-Gramme, also in kleinere Bausteine, zerlegt, die dann einzeln übersetzt und zusammengefügt werden. Der inhaltliche und grammatische Zusammenhang kann bei der SMT dabei leicht verlorengehen. Die NMT kann diese Schwächen ausbügeln, weil sie bei der Übersetzung den Kontext eines Begriffs innerhalb eines Satzes berücksichtigt.

So wie zuvor die SMT wesentlich mehr Zeit für die Übersetzung benötigte als die älteren regelbasierten Systeme, dauert die Übersetzung eines Satzes mit der NMT länger als mit der SMT. Der Grund dafür sind die riesigen Datenmengen, die verarbeitet werden müssen. Diese Einschränkung wird allerdings immer mehr durch Fortschritt im Bereich neuronale maschinelle Übersetzung, Entwicklung immer schnellerer Prozessoren und Verbesserung der Trainingsalgorithmen ausgeglichen.

Die Ergebnisse der NMT sind noch nicht perfekt, etwa bei der Übersetzung sehr technischer Inhalte. Allerdings ist die NMT keine Ausnahme: Kein MT-System könnte einen Text mit vielen technischen Begriffen und Abkürzungen perfekt übersetzen. Diese Schwachstelle kann man allerdings durch gezieltes Post-Editing ausgleichen.

Für die NMT gilt: Wenn Sie den Deep-Learning-Algorithmen Trainingsmaterial vorlegen, wissen die Algorithmen noch nicht, wonach sie suchen müssen. Das System muss selbst Muster erkennen, zum Beispiel Kontexthinweise in der Umgebung eines Satzes in der Ausgangssprache. Selbst die Grammatik der Zielsprache wird vom System selbstständig gelernt und muss nicht vorab programmiert werden. Der genaue Prozess bleibt aber in vielerlei Hinsicht undurchsichtig.

Der Markt für Maschinelle Übersetzung soll um 7,1 Prozent wachsen.


Markt für Maschinelle Übersetzung

Neuronale MT und Big Data: Das Ende aller Einschränkungen

Neuronale Netzwerke wurden zuerst in Systemen für die Bild- und Spracherkennung angewendet. Nehmen wir ein Beispiel für die Bilderkennung: das Bild von einem Hund mit den entsprechenden Metadaten. Das System erkennt beim Lesen dieser Metadaten, dass es sich um das Bild eines Hundes handelt.

Bei der Spracherkennung gibt es für den in einer bestimmten Sprache aufgezeichneten Satz in der Regel eine einzige richtige Transkription; diese muss das Deep-Learning-System finden. Das Training von Deep-Learning-Systemen für Transkription ist einfacher als das Training von Deep-Learning-Systemen für Übersetzung. Der Grund: Bei der Übersetzung kann es für einen Satz in der Ausgangssprache mehrere richtige fremdsprachige Entsprechungen geben.

Daher werden Deep-Learning-Systeme mit Millionen von bereits in hoher Qualität übersetzten Satzpaaren trainiert. Durch die Auswahl des Trainingsmaterials kann eine Spezialisierung, z. B. auf medizinische oder juristische Fachtexte, forciert werden.

Deep Learning und Big Data erweitern die begrenzten Wahrnehmungs- und Analysefähigkeiten des Menschen. Big Data führt riesige Mengen an Informationen zusammen. Dank Deep Learning können komplizierte Muster und innerhalb dieser Muster Verbindungen mit Verfahren erkannt werden, die außerhalb der Erkennungsmöglichkeiten des Menschen liegen.

Wie bereits erwähnt, lässt sich der NMT-Prozess nicht vollständig nachvollziehen. Ein Großteil der Verarbeitung findet in „verborgenen Schichten“ komplizierter Daten statt. Es ist schwierig, die zugrunde liegenden Entscheidungsprozesse zu verstehen und Fehler in einem neuronalen Netzwerk zu beseitigen.

Folglich können wir nur für das Trainingsmaterial sorgen, die Algorithmen arbeiten lassen und das Trainingsmaterial optimieren, sollten die Übersetzungen nicht korrekt sein.

Neuronale maschinelle Übersetzung im Jahr 2022

Die Covid-Pandemie hat die Dringlichkeit der digitalen Transformation noch einmal verdeutlicht. Im Jahr 2020 wurden gerade einmal um die 10 Prozent der Online-Inhalte von Firmen lokalisiert. Viele Unternehmen haben aber inzwischen erkannt, dass sie sich global positionieren und ihre Inhalte lokalisieren müssen. Nur so können sie eine möglichst große internationale Zielgruppe ansprechen. Der Markt für Übersetzungsdienstleistungen soll dementsprechend zwischen 2021 und 2026 um 7,1 Prozent wachsen.

Damit einher geht natürlich die Herausforderung, große Mengen an Inhalten, innerhalb kürzester Zeit kostensparend in viele Sprachen zu übertragen. Die neuronale maschinelle Übersetzung bedeutet einen Quantensprung in diesem Bereich, nicht nur in der Bewältigung der Quantität, sondern auch bei der Qualität. Die NMT ermöglicht die maschinelle Übersetzung von Sprachkombinationen, die KI-Systeme vorher vor große Probleme stellte. Ebenso kann sie für Anwendungsfälle eingesetzt werden, bei denen man bis vor Kurzem glaubte, dass sie nur von menschlichen Übersetzern zu bewältigen seien. Die NMT schafft das durch die Verwendung großer Datenmengen in Verbindung mit sich ständig verbessernder künstlicher Intelligenz.

Lionbridge bietet seinen Kunden seit 2002 maschinelle Übersetzung und Post-Editing an. Jahr für Jahr optimieren wir unsere Systeme und durch die Kooperation mit Anbietern wie Amazon Translate, Google Translate, DeepL und Microsoft die auf neuronaler maschineller Übersetzung basieren, konnten wir den Einsatz von MT weiter steigern und so unsere Produktionsprozesse beschleunigen.

Mit neuen Möglichkeiten mehr Texte übersetzen

Die NMT eröffnet völlig neue Perspektiven bei der Lokalisierung von Texten und damit bei der Erschließung neuer Märkte. Mit ihrer Hilfe kann effizient ein Mehrwert für internationale Kunden geschaffen werden, denen man nun relevante, aktuelle Inhalte in ihrer Muttersprache präsentieren kann.

Viele Unternehmen erwarten inzwischen von ihrem Lokalisierungsdienstleister technische Lösungen, die Übersetzungen automatisieren und die sich einfach in den täglichen Workflow integrieren lassen. Gerade für den firmeninternen Gebrauch, aber nicht nur dort, reicht oft eine Übersetzungsqualität, die „gut genug“ ist. Dafür ist die Übersetzung aber sofort und kostengünstig verfügbar.

Aber auch die Lokalisierung von zum Beispiel komplexen Anleitungen für technische Geräte kann durch maschinelle Übersetzung effizienter gestaltet werden, insbesondere, wenn sie mit Post-Editing und einer Vorab-Optimierung der Quelltexte kombiniert wird.

Auf unserer Website erfahren Sie mehr rund ums Thema Übersetzung und Lokalisierung.

In unserem Blog-Artikel Maschinelle Übersetzung: Wichtige Begriffe kurz erklärt finden Sie eine Erklärung aller wichtigen Begriffe zum Thema maschinelle Übersetzung.

Fragen? Nehmen Sie Kontakt mit uns auf!

Bitte geben Sie eine geschäftliche E-Mail-Adresse an.
Indem Sie das Kästchen unten markieren, stimmen Sie zu, Marketing-E-Mails von uns zu erhalten. Sie werden Informationen über Thought Leadership, Best Practices und Markttrends der Sprachservices von Lionbridge erhalten.

Der Abmeldevorgang und unsere Verarbeitung personenbezogener Daten werden in unserer Datenschutzrichtlinie beschrieben.

Weitere Infos finden Sie in diesem Artikel: Die Zukunft der maschinellen Übersetzung

linkedin sharing button
  • #blog_posts
  • #translation_localization

Lionbridge
VERFASSER
Lionbridge