Zum Inhalt springen

Künstliche Intelligenz bei Übersetzungen

Künstliche Intelligenz (KI) revolutioniert gerade ganze Industrien, und die aktuelle Corona-Situation beschleunigt diese Entwicklung. Insbesondere bei der Verarbeitung und beim Verstehen natürlicher Sprache hat KI enorme Fortschritte gemacht: Extraktion und Aufbau von Wissen, maschinelles Übersetzen, Sprachassistenten und ChatBots und einige mehr.

Wer sich diese Technologien zunutze macht, hat die Nase vorne. Das hat D.O.G. schon vor mehreren Jahren erkannt und ein Team von Spezialisten zusammengestellt, die Lösungen und Produkte entwickeln, die die Möglichkeiten von KI und Natural Language Understanding nutzen.


Künstliche Intelligenz bei der D.O.G. GmbH

Seit dem Jahr 2018 entwickelt D.O.G. KI-Verfahren und -Algorithmen, um verschiedene Aufgaben im sprachlichen und gelegentlich im nichtsprachlichen Bereich zu lösen. Die Ergebnisse:

  • Das intelligente Terminologieverwaltungssystem LookUp mit Wissenskomponente
  • Die intelligente Kontextprüfung bei ErrorSpy, der Qualitätssicherungssoftware für Übersetzungen
  • Das Training, die Pflege und der Aufbau individueller maschinellen Übersetzungslösungen
  • Die Extraktion von Wissen aus Texten und der Aufbau intelligenter Terminologien, die Wissen mit semantischen Beziehungen zwischen Begriffen modellieren.

Künstliche Intelligenz und maschinelle Übersetzung

Für gelegentliche maschinelle Übersetzungen reichen die Standardmaschinen von DeepL oder Google aus. Ein Revisor korrigiert das Ergebnis. Allerdings kostet die Anpassung der Fachterminologie und der Formulierungen an die gewünschte Unternehmenssprache viel Zeit. Deshalb lohnt sich bei größeren oder regelmäßigen Textmengen das Training einer eigenen Übersetzungs-Engine. Hier kommt das Know-how von D.O.G. in Sache KI und maschinelles Lernen zum Tragen:

  • Wir trainieren MÜ-Systeme selbst und können daher eine ganze Reihe von Parametern (z.B. Batch-Größe, Lernrate, Auswahl des Optimizers usw...) direkt beeinflussen.
  • Wir optimieren das Trainingsmaterial, um bessere Übersetzungsergebnisse zu erzielen.
  • Wir passen die automatischen Evaluierungsverfahren wie BLEU für unsere Trainingszwecke an.
  • Wir entwickeln eigene Verfahren zur besseren Berücksichtigung von Terminologievorgaben.
  • Unsere Algorithmen und Werkzeuge unterstützen den Post-Editing-Prozess, um den Nachbearbeitungsaufwand zu reduzieren. Unsere Algorithmen lernen aus Korrekturen der Post-Editoren, welche typischen Fehler MÜ-Systeme bei welchen Kunden, Sprachen und Themen machen. Mit unserem Qualitätssicherungsprogramm ErrorSpy sind wir beispielsweise in der Lage, Maschinenfehler zu entdecken, die auf eine falsche Kontextinterpretation zurückzuführen sind (z.B. ist „Leitung“ als Rohrleitung, Kabel, Telefonleitung oder Management zu verstehen?).

Abbildung 1: MÜ-Fehlerbewertungsmodell: Lernkurve

 

Wir haben noch lange nicht das perfekte maschinelle Übersetzungssystem entwickelt, aber das KI-Know-how von den D.O.G.-Entwicklern und die Möglichkeit, maschinelle Übersetzungssysteme direkt zu beeinflussen, bringen schon jetzt erhebliche Vorteile. Davon können Sie profitieren.

DeutschHumanDOG-EngineDeepLKommentar
Status Fehlteil setzenSet status reject partSet status reject partSet missing part statusTerminologie wurde gelernt (Kein Sinnfehler)
Das Handling wurde von der Maschine angefordert.Handling was requested by the machine.Handling was requested by the machine.The handling was requested by the machine.Stil wurde gelernt
Ursache:Cause:Cause:cause:Groß-/Kleinschreibung wurde gelernt
Als erstes muß die Datei Einstellungen.cfg vom Hauptverzeichnis kopiert werden.File Einstellungen.cfg•must be copied beforehand from the main directory.First copy the file Einstellungen.cfg from the main directory.First, the Settings.cfg file must be copied from the root directory.Dateinamen (named entities) und Terminologie wurden gelernt

 

Abbildung 2: Beispiele für die Vorteile eines eigenen Engines (Stand November 2020)


Künstliche Intelligenz, Wissen und Terminologie

Wissen und Terminologie stehen im Mittelpunkt der Arbeit eines Übersetzers oder eines technischen Redakteurs. Technische Informationen oder Fachbegriffe können sehr anspruchsvoll sein. Die Suche nach Erklärungen, Zusammenhängen, weiterführenden Informationen ist sehr zeitaufwändig. Es gibt zwar keine verlässlichen Zahlen dazu, aber man kann vernünftig annehmen, dass Übersetzer, Revisoren, Lektoren oder Redakteure etliche Stunden pro Woche mit der Suche nach Informationen verbringen.

Ein Schwerpunkt der KI-Tätigkeit von D.O.G. liegt bei intelligenten Verfahren, mit denen Wissen aus unstrukturierten Texten maschinell extrahiert und mehrsprachig organisiert werden kann. Die D.O.G.-Algorithmen lernen z.B. aus Korpora zu einem bestimmten Thema welche Begriffe semantisch zusammenhängen und welche Bedeutung Begriffe in einem bestimmten Zusammenhang nehmen. Bei mehrsprachigen Korpora können auf diese Weise Bedeutungsunterschiede zwischen der Ausgangs- und der Zielsprache erkannt werden. Das Ergebnis erfassen D.O.G.-Terminologen in LookUp, einem System, mit dem Wissen modelliert werden kann. Dieses Wissen kann u.a. für das Training maschineller Übersetzungssysteme oder für die Qualitätssicherung maschineller Übersetzungen verwendet werden.

Abbildung 3: Ermitteln semantisch verwandter Begriffe mittels KI-Verfahren

 

Dieses Know-how kann u.a. für die SEO-Anpassung an andere Sprachen und Kulturen verwendet werden. Unsere KI-Leistungen für Sie:

  • Trainieren von Übersetzungs-Engines für die maschinelle Übersetzung Ihrer Texte
  • Aufbau mehrsprachiger intelligenter Terminologien, die Wissen mit Hilfe von Relationen darstellen.

Kontakt

Haben Sie Fragen zu unseren Produkten oder Dienstleistungen?

Kontaktieren Sie uns jederzeit gerne:

 

Kostenlos und unverbindlich Ihr Angebot hier anfordern:

Angebot anfordern

Spalte L
Spalte M
Spalte R
Datei auswählen
oder Drag & Dropmaximal 120 MB, für größere Volumina: unser Transferlaufwerk nutzen
Spalte U
* Pflichtfelder sind mit einem Stern gekennzeichnet.
Spalte Submit

Nachricht schreiben

Spalte L
Spalte M
Spalte R
Spalte U
* Pflichtfelder sind mit einem Stern gekennzeichnet.
Spalte Submit
Siegel Siegel
scatxxxporn.netscatfap.netjavpornscat.compooping-jav.com