Zum Inhalt springen

Maschinelle Übersetzungen

Maschinelle Übersetzungen (MÜ) wurden lange belächelt. Seit den Erfolgen von Google Translate und DeepL vor wenigen Jahren gelten sie als wichtige Technologie zur Produktion von Übersetzungen. Die Erwartungen sind hoch: Reduzierung der Übersetzungskosten bei gleichwertiger Qualität dank Post-Editing durch ausgebildete Revisoren. Geht das? Ja schon, aber nicht für alle Dokumentationen und nicht für alle Ziele.


Seit dem Jahr 2008 aktiv im Bereich Maschinelle Übersetzung

Bereits im Jahr 2008 fing D.O.G. an, sich mit dem Thema MÜ aktiv auseinanderzusetzen. Damals ging es um ein gemeinsames Forschungsprojekt mit der französischen Hochschule ISIT: „Enhancing Machine Translation Quality with ErrorSpy“. Aus diesem Projekt sind Funktionen in unserer Qualitätssicherungssoftware ErrorSpy entstanden, mit denen MÜ-Fehler besser erkannt und korrigiert werden können.


Welche MÜ-Lösungen bietet Ihnen D.O.G.?

  • Wir setzen uns mit Ihnen zusammen und beraten Sie über die Vor- und Nachteile verschiedener Alternativen.
  • Wir arbeiten mit Ihnen ein Pflichtenheft aus, in dem Systeme, Workflows, Integrationsbedarf, Qualitätsrichtlinien festgelegt sind.
  • Wir setzen das für Sie geeignete MÜ-System ein, z.B. ein Neuronales Maschinenübersetzungssystem (NMT), das wir mit Ihren Daten trainieren.
  • Wir bauen das Qualitätsmanagement auf und setzen ein Team von Post-Editoren ein, das die maschinell erzeugten Texte nach den vereinbarten Kriterien korrigiert. Dabei verwenden wir unsere Qualitätssicherungssoftware und eine mit Ihnen vereinbarten Terminologie, die wir auf Wunsch gemeinsam mit Ihnen in unserem Terminologieverwaltungssystem LookUp pflegen.
  • Wir pflegen fortlaufend die Sprachressourcen wie Translation-Memorys und Terminologie, die für ein optimales Training des Übersetzungsengines wichtig sind.
  • Sie haben einen festen D.O.G. Ansprechpartner, der das Team von Entwicklern, Post-Editoren und Übersetzern für Ihre Projekte koordiniert.

Welches Engine?

Wenn Sie nach Rom reisen möchten, dann können Sie zwischen unterschiedlichen Verkehrsmitteln wählen. Dasselbe gilt für maschinelles Übersetzen. Es gibt nicht ein System und eine Vorgehensweise, sondern mehrere Alternativen, die von Ihrer Zielsetzung, Datenumfang und Budget abhängen. So kann man durchaus zwischen Alternativen wie den folgenden wählen:

  • Vortrainierte neuronale Systeme (NMT), die z.B. mit größeren Datenmengen im Bereich Technik trainiert wurden
  • Neuronale Systeme (NMT), die speziell auf Ihre Daten trainiert werden
  • Statistische maschinelle Übersetzungssyteme (SMT), die sich in bestimmten Situationen aufgrund der besseren Berücksichtigung der Fachterminologie besser eignen.
  • Zu weiteren Optionen beraten wir Sie gerne!

Workflow zu Ihrer MÜ-Lösung

Möchten Sie in Ihrem Intranet ein Übersetzungsportal aufbauen das vollautomatische Übersetzungen liefert? Möchten Sie Übersetzer während der Arbeit mit CAT-Tools (Computer-Aided-Translation Systeme = Translation-Memory-Systeme) unterstützen? Oder brauchen Sie post-editierte Dokumente, die eine ähnliche Qualität wie bei Humanübersetzungen haben?

Je nach Zielsetzung entstehen unterschiedliche Workflows und Implementierungen. Auch hier hilft Ihnen unser Team von Spezialisten und Softwareentwicklern, die passende Lösung umzusetzen.


Maschinelle Übersetzung ja, aber nicht für alle Texte

Unternehmen produzieren und verwenden eine ganze Menge an Informationen. Sie dienen unterschiedlichen Zwecken (reine Information und Kommunikation, Werbung, Bedienung von Maschinen usw.), sind rechtlich bindend oder nicht (wie die Bedienungsanleitungen, die die europäische Maschinenrichtlinie 2006/42/EG vorgibt), sind anspruchsvoll formuliert oder stark standardisiert.

Je nachdem, wie diese Eigenschaften und Kriterien ausfallen, ist maschinelles Übersetzen zu empfehlen oder nicht.

Grundsätzlich muss man wissen, dass maschinelles Übersetzen besser funktioniert, wenn:

  • das Thema und die Sprachkombination vorher vom Translation Engine gelernt wurde. Dies erfolgt in der Phase des maschinellen Lernens, während eine relativ große Menge an zweisprachigen Texten (v.a. Segmente aus Translation-Memorys) vom Deep-Learning-Algorithmus verarbeitet wurde.
  • Qualitätsabstriche gegenüber Humanübersetzungen vertretbar sind: eine korrekte Übersetzung ist nicht zwangsläufig eine gute Übersetzung. Außerdem ist bei MÜ das Restrisiko einer Fehlübersetzung größer als bei Humanübersetzern.
  • die Mengen an Texten ausreichen, um das System wirtschaftlich zu betreiben.
  • der Text einfach geschrieben ist: kurze Sätze, kaum Mehrdeutigkeiten, standardisierte Terminologie und Syntax. Besser noch: Der Autor weiß, wie MÜ funktioniert und schreibt Texte, die für maschinelles Übersetzen optimiert sind.
  • der Text nur Informationszwecken dient. Das ist z.B. der Fall bei der internen Kommunikation, wenn man wissen möchte, „was im Dokument/in einer Mail drin steht“, wenn der technischer Kundendienst verstehen muss, was für ein Problem zu lösen ist.
  • der Zeitfaktor im Vordergrund steht: MÜ ist eindeutig schneller, auch mit Post-Editing.

MÜ ist nicht unbedingt eine Konkurrenz zu Translation-Memory-Systemen. Es ist eher ein weiteres Werkzeug, mit dem Übersetzungen produziert werden können.


Maschinen machen andere Fehler

Menschen machen Fehler, Maschinen auch, aber andere. Sie übersetzen z.B. Eigennamen, verstehen viele Abkürzungen nicht oder fügen Informationen hinzu, die im Ausgangstext gar nicht vorkommen. Sie lassen bei der Übersetzung auch manchmal Wörter aus. Das ist nicht immer einfach zu entdecken, besonders wenn der übersetze Satz ansonsten gut klingt.

Deswegen ist es wichtig, Post-Editoren auszubilden, sie über die Fehlerarten zu informieren, die sie suchen müssen. Und die Typologie dieser Fehler unterscheidet sich je nach Typ von Übersetzungsengine, der eingesetzt wurde: statistische maschinelle Übersetzungssysteme (SMT – Statistical Machine Translation) machen andere Fehler als neuronale maschinelle Übersetzungssysteme (NMT – Neural Machine Translation).

Seit ihrer Gründung vor über 20 Jahren beschäftigt sich D.O.G. sehr intensiv mit dem Thema Übersetzungsqualität und seit dem Jahr 2008 speziell mit der Qualität maschineller Übersetzungssysteme. Wir haben eigene Tools und Metriken entwickelt, um diese Qualität zu überprüfen. Bevor die maschinelle Übersetzung startet, identifizieren wir die Segmente, die für den MÜ-Prozess nicht geeignet sind und sortieren sie aus bzw. kennzeichnen wir sie für weitere Bearbeitungsschritte.

Von unserer Erfahrung können Sie profitieren.


Die Daten und das Training

Gute Daten sind für maschinelles Lernen ausschlaggebend. Nach dem Motto „Garbage in, garbage out“ hängt der Erfolg maschineller Übersetzungen stark davon ab, wie umfangreich und wie sauber die Trainingsdaten sind. In erster Linie kommen für das Training Translation-Memorys (TMs) in Frage. TMs enthalten aufgrund ihrer Entstehungshistorie viele Segmente, die das Training stören: Leere Segmente, falsch zugeordnete Übersetzungen (z.B. bei falsch Segmentierten Sätzen) oder inkonsistente Termini und Formulierungen.

Training ist keine einmalige Angelegenheit. Neue Texte und Themen kommen hinzu. Maschinenfehler können durch Nachtrainieren korrigiert werden. Unsere Post-Editoren geben uns regelmäßig Feedback über typische wiederkehrende Maschinenfehler. Unsere Entwickler nutzen diese Informationen für das regelmäßige Nachtrainieren der Übersetzungsengines. So passt sich das Engine mit der Zeit immer besser an Ihre sprachlichen Wünsche und Besonderheiten an.

Auch hier können Sie von unserer Erfahrung profitieren. Wir helfen Ihnen, die Trainingsdaten zu optimieren, um ein besseres Ergebnis zu erzielen. Dafür haben wir Methoden und Tools entwickelt.

 


Post-Editing

Viele Unternehmen benötigen maschinelle Übersetzungslösungen in Verbindung mit Post-Editing. Zwar definiert die neue Norm über das Posteditieren maschinell erstellter Übersetzungen (ISO 18587:2017) zwei Posteditierstufen Full und Light Post-Editing, aber in der Praxis hängen die Kriterien für eine akzeptable Qualität stark von den verfolgten Zielen und eingesetzten Engines ab.

Wir helfen Ihnen, für die von Ihnen gewählte Lösung die optimalen Qualitätsziele für die Arbeit der Post-Editoren zu definieren. Daraus entstehen Vorgaben für die Arbeit der Post-Editoren.


Maschinelle Übersetzung und Datensicherheit

Ein wichtiger Grund für viele Firmen, sich für maschinelles Übersetzen zu entscheiden, ist die Datensicherheit. Keine Firmenleitung möchte verantworten, dass vertrauliche Informationen unerwünscht abgegriffen werden, weil unvorsichtige Mitarbeiter sie über einen kostenlosen Übersetzungsdienst im Internet übersetzen lassen.

Die Engines, die wir für Sie trainieren, befinden sich entweder auf unserem eigenen Server in Deutschland, der nach EU-Recht (Datenschutz-Grundverordnung - DSGVO) betrieben wird, oder über abgesicherte Cloud-Dienste in Deutschland.

Sie haben auch die Möglichkeit, das trainierte Engine auf Ihrem eigenen Server zu installieren.


Technologien von D.O.G. zu Ihrem Vorteil

Der Erfolg maschineller Übersetzungslösungen steht und fällt mit der Fähigkeit, Übersetzungsfehler zu entdecken und die richtige Fachterminologie einzusetzen. Hier hat D.O.G. ganz besondere technologische Vorteile. Seit der Firmengründung vor über 20 Jahren haben wir Wert darauf gelegt, Softwareprodukte zu entwickeln, die die Qualität unserer Leistung unterstützen. Insbesondere helfen uns dabei ErrorSpy und LookUp.

LookUp ist ein intelligentes Terminologieverwaltungssystem. In LookUp können Relationen zwischen Begriffen erfasst werden, wodurch Kontextinformationen verfügbar sind. Unsere softwaregestützen Prüfungen berücksichtigen diese Relationen und Ihre Terminologie. Somit sind unsere Post-Editoren besser in der Lage, maschinelle Fehler zu erkennen.

ErrorSpy unterstützt den Post-Editoren beim Aufspüren und Korrigieren maschineller Übersetzungsfehler:

  • ErrorSpy kann fehlende Übersetzungen erkennen
  • ErrorSpy meldet Terminologiefehler
  • ErrorSpy prüft die Interpunktion, die Zahlen, die Konsistenz der Übersetzung
  • ErrorSpy arbeitet zusätzlich mit regulären Ausdrücken. Typische Maschinenfehler können als regulärer Ausdruck hinterlegt und automatisch erkannt werden.
  • ErrorSpy erkennt den Kontext und kann falsche Übersetzungen in einem bestimmten Kontext melden (z.B. bei der Übersetzung eines Wortes wie „Leistung“).

Kosten und Nutzen

Die Einführung einer maschinellen Übersetzungslösung für Ihr Unternehmen ist ein Projekt mit zwei Hauptkomponenten: die Einrichtung des Systems und der Nutzen des Systems.

Einrichten eines maschinellen Übersetzungssystems: für jede Sprachkombination muss ein Modell trainiert werden. Dafür benötigt das System relativ große Mengen an hochqualitativen bilingualen Daten. Das Trainieren erfolgt auf Spezialrechnern mit GPU (Graphics Processor Unit), die massives Parallel Processing erlauben. Das Training kann mehrere Maschinentage dauern und die Trainingsparameter müssen in verschiedenen Testläufen optimiert werden. Das ist ein Kostenfaktor.

Betrieb und Nutzung des Systems. Auch in der Einsatzphase muss das System von Fehlern lernen und mit neuen Themen und Daten trainiert werden. Schließlich kommen die Kosten des Post-Editiing, die im Grunde die Zeit widerspiegeln, die Post-Editoren für die Korrektur von Maschinenfehlern investieren.

Wir berechnen die Kosten für die Einrichtung der Lösung (einmalige Kosten) und für die Nutzung des Systems getrennt. Für den laufenden Betrieb zahlen Sie also einen Preis pro Wort, der unter den Kosten einer Humanübersetzung liegt. Nach Abstimmung der Eckdaten für Ihre Lösung können wir Ihnen hierfür ein Angebot unterbreiten.

Die Wirtschaftlichkeit einer MÜ-Lösung hängt schließlich von ihrem Einsatzmodell ab. Wenn Sie bereits durch den Einsatz von Translation-Memory-Systemen große Einsparungen erzielen und zukünftig dieselben Dokumente maschinell übersetzen möchten, dann könnten die Einsparungen eher gering sein. Wenn Sie aber neue Texte und Inhalte übersetzen, die sie vorher nicht oder ohne Übersetzungstechnologien übersetzt haben, dann steigt die Wirtschaftlichkeit einer maschinellen Übersetzungslösung sehr schnell.


Kontakt

Haben Sie Fragen zu unseren Produkten oder Dienstleistungen?

Kontaktieren Sie uns jederzeit gerne:

 

Kostenlos und unverbindlich Ihr Angebot hier anfordern:

Angebot anfordern

Spalte L
Spalte M
Spalte R
Datei auswählen
oder Drag & Dropmaximal 20 MB
Spalte U
* Pflichtfelder sind mit einem Stern gekennzeichnet.
Spalte Submit

Nachricht schreiben

Spalte L
Spalte M
Spalte R
Spalte U
* Pflichtfelder sind mit einem Stern gekennzeichnet.
Spalte Submit

iso-17100-language-industry-certification-system-lics.jpg
dtt-logo.png
tekom-logo.jpg
Zertifizierung_TIM4-0_01_web4.gif
across-logo.gif