Translation Memory Bereinigung

Translation-Memory-Bereinigung

Bereinigung von Translation-Memorys in mehreren Sprachen

Wartung Ihrer Übersetzungsdatenbanken

Die Pflege von Translation-Memorys senkt Übersetzungskosten

In vielen Unternehmen sind Translation-Memorys das Herzstück der Produktion von Übersetzungen. Sie gehören zu dem, was man im Englischen als linguistic assets (sprachliche Vermögenswerte) bezeichnet. Translation-Memorys enthalten bereits übersetzte Sätze (sogenannte Segmente), die von menschlichen Übersetzern oder maschinellen Übersetzungssystemen erstellt wurden. Einmal übersetzte Inhalte können wiederverwendet werden. Das spart Arbeit und Kosten. Gleichzeitig sorgt diese Wiederverwendung für eine einheitliche Übersetzung der Texte und damit für eine höhere Qualität.

Wenn ein Translation-Memory jedoch Fehler enthält oder veraltet ist, kann dies zu großen Problemen bei Ihren Übersetzungen führen. Fehlerhafte Translation-Memorys entstehen z. B., wenn sich die Fachterminologie geändert hat oder wenn im Laufe der Zeit mehrere Übersetzer unterschiedliche Übersetzungen geliefert haben, ohne dass ihr Stil oder ihre Terminologie standardisiert wurden. Übersetzungsfehler, die auf mangelndes Wissen über die Produkte eines Unternehmens oder auf kontextabhängige Bedeutungen zurückzuführen sind, verbreiten sich wie ein Virus, sobald sie unbemerkt in ein Translation-Memory gelangen.

Um fehlerhafte Translation-Memorys zu vermeiden, ist es wichtig, dass Sie Ihre Translation-Memorys regelmäßig aktualisieren und pflegen. Diese Aufgabe ist sicherlich mit Kosten verbunden. Außerdem erfordert diese Arbeit sprachliche und technische Kenntnisse in mehreren Sprachen. Genau dafür sind wir da und wir wissen, wie man die Kosten für diese Art von Aufgabe niedrig hält. Wir können Sie mit Werkzeugen und Methoden unterstützen, mit denen Sie Ihre Translation-Memorys auf einem hohen Qualitätsniveau halten können.

Wenn Sie Ihre Translation-Memorys regelmäßig pflegen, können Sie sicher sein, dass Sie Zeit und Geld sparen und korrekte Übersetzungen in der bestmöglichen Qualität wiederverwenden.

certified
Übersetzung in alle Sprachen
Wir übersetzen in alle Sprachen

Benötigen Sie eine Übersetzung? Wir schicken Ihnen innerhalb kürzester Zeit ein Angebot. Senden Sie uns Ihre Anfrage mit diesem Angebotsformular.

Klicken oder ziehen Sie Dateien in diesen Bereich zum Hochladen. Sie können bis zu 10 Dateien hochladen.
Für größere Volumina: unser Transferlaufwerk nutzen

Dateiformate

Welche Translation-Memory-Formate bearbeiten wir?

Insgesamt gibt es viele verschiedene Dateiformate für Translation-Memorys oder übersetzte Segmente. Wir können die meisten von ihnen verarbeiten.

Translation-Memory-System
Translation-Memorys (TMs)

werden in der Regel in einer Datenbank gespeichert, wie es bei einem der gängigen Translation-Memory-Systeme wie Across, Trados, memoQ und einigen anderen der Fall ist. Diese TMs können in verschiedenen Formaten ausgetauscht werden, in erster Linie in TMX oder einer seiner tool-spezifischen Ausprägungen. 

TMX Datei Format
TMX (Translation-Memorys eXchange)

Dies ist ein weit verbreitetes Dateiformat für Translation-Memorys, das auf XML (eXtensible Markup Language) basiert. TMX-Dateien lassen sich leicht austauschen und können mit einer Vielzahl von Übersetzungstools und Softwareprogrammen verwendet werden.

XLIFF Datei Format
XLIFF (XML Localization Interchange File Format)

Dies ist ein weiteres XML-basiertes Dateiformat für übersetzte Segmente, das in der Lokalisierungsbranche weit verbreitet ist. Es gibt einige Varianten von XLIFF wie SDLXLIFF, das von Trados generiert wird.

Trados Translation Memory
SDLTM (proprietäres Forma für Trados-Datenbanken)

SDLTM ist das interne Format von Trados Studio für Translation-Memories. SDLTM basiert auf XML und kann nach TMX exportiert werden.

CSV Datei Format
CSV (Comma-Separated Values)

Dies ist ein einfaches Dateiformat, das üblicherweise für die Speicherung von Daten in tabellarischer Form verwendet wird, wobei die Datenspalten und -zeilen durch Kommas getrennt sind. CSV-Dateien sind relativ einfach zu handhaben und können mit einer Vielzahl von Softwareprogrammen und Tools verwendet werden.

PHP Datei Format
PHP

ist eine weit verbreitete Open Source Allzweck-Skriptsprache, die sich besonders für die Webentwicklung eignet und in HTML eingebettet werden kann.

JSON Datei Format
JSON

JSON ist ein Datenformat, das zum strukturierten Speichern von Daten verwendet wird. Es wird häufig verwendet, um Daten in einer Datenbank zu speichern oder um Daten zwischen verschiedenen Teilen einer Webanwendung zu übertragen.

Herausforderungen der Translation-Memory-Bereinigung

Wir verfügen über notwendige Kenntnisse

Schwerpunkte der Bereinigung von Übersetzungsdatenbanken

Die sechs wichtigsten Herausforderungen bei der Bereinigung von Translation-Memorys sind:

  1. Identifizierung falscher Daten: Die Bereinigung eines TMs erfordert das Erkennen, Auffinden und Korrigieren ungenauer oder unvollständiger Daten. Dies kann ein zeitaufwändiger Prozess sein und erfordert Kenntnisse über verschiedene Fehlermuster in TMs.

  2. Duplikate oder Dubletten: Bei doppelten Einträgen handelt es sich nicht nur um 100 % identische Zeichenfolgen. Unterschiedliche Formulierungen für denselben Inhalt müssen identifiziert und entweder eliminiert oder zusammengeführt werden.

  3. Unvollständige Segmente: Abgeschnittene Segmente entstehen, wenn ein Text vor Beginn der Übersetzung nicht richtig segmentiert wurde. Dies kann zu fehlerhaften Übersetzungen führen und erfordert eine manuelle Korrektur.

  4. Kontextbedingte Fehler: Kontextbedingte Fehler treten auf, wenn das Ausgangssegment zwar korrekt übersetzt wurde, aber nicht in den Kontext der Zielsprache passt. In diesem Fall muss ein fachkundiger Übersetzer die Übersetzung überprüfen und auf ihre Richtigkeit hin kontrollieren.

  5. Falsche Terminologie: Falsche Terminologie kann zu Fehlern in Translation-Memorys führen. In diesem Fall ist eine manuelle Korrektur der im TM verwendeten Termini erforderlich.

  6. Übersetzungsfehler: Fehlerhafte Übersetzungen können aus verschiedenen Gründen entstehen. Man braucht Übersetzungskompetenz, um Sinnfehler zu erkennen.

Translation-Memory-Bereinigung in 6 Schritten
Ablauf einer Datenbereinigung

So läuft die Bereinigung Ihrer Translation-Memorys ab:

Anfrage

Sie geben uns Ihre Translation-Memorys
Wir analysieren die Daten, die Fehlertypen und erörtern mit Ihnen Bereinigungsalternativen.

Angebot und Projektstart

Sie prüfen das Angebot und erteilen den Auftrag
Im Angebot wird festgelegt, was bereinigt werden muss und welche Leistungen erforderlich sind (z. B. Terminologieerfassung).

Bereinigung nach Vorgabe

Wir bereinigen Ihre Daten Schritt für Schritt
Wir bereinigen die verschiedenen Fehler im TM und wenden uns ggf. an Sie, wenn es spezielle Fragen gibt.

Qualitätssicherung

Wir prüfen die Qualität des Ergebnisses
Wir überprüfen das bereinigte Translation-Memory auf verbleibende Fehler.

Hinzufügen von Attributen

Die bereinigten Segmente erhalten Attribute
Die bereinigten Segmente werden mit einem Attribut versehen, welches belegt, dass sie überprüft worden sind. Weitere Attribute können hinzugefügt werden. Der Name des Attributs wird im Voraus vereinbart.

Lieferung und Wartung

Wir liefern das bereinigte Memory und die Terminologie
Sie erhalten das bereinigte TM. In der Regel auch die extrahierte Terminologie. Eine regelmäßige Pflege wird empfohlen.

Sprachkombinationen

Übersetzungsdatenbanken in folgenden Sprachen

Wir bereinigen Übersetzungsdatenbanken in einer großen Zahl von Sprachkombinationen. Sehr gefragte Kombinationen für TMs sind:

Qualität und Zeitersparnis durch saubere TMs

Die Bereinigung von Übersetzungsdatenbanken im Detail

Translation-Memory Bereinigung

Die Analyse der Translation-Memorys

Bevor wir mit der Analyse beginnen, besprechen wir mit unseren Kunden das Ziel, das sie erreichen wollen. Einige der Aspekte, die wir bei einem Translation-Memory untersuchen, sind:

Die Analyse zielt darauf ab, die Stärken und Schwächen des Memorys zu verstehen und Bereiche zu identifizieren, in denen es verbessert werden kann.

Datenbereinigung: Die Fehlertypen

Hier sind einige der typischen Fehler, die in einem TM gefunden werden können:

  1. Dubletten: Ein Satz mit mehreren Übersetzungen. Wir suchen auch nach Sätzen in der Ausgangssprache, die im Grunde die gleiche Bedeutung haben und zu unnötigen Übersetzungsvarianten führen.

  2. Falsche Übersetzungen: Diese treten auf, wenn die Übersetzung die Bedeutung der Ausgangssprache nicht genau wiedergibt. Manchmal stammen die Übersetzungen von neuronalen maschinellen Übersetzungsmaschinen und enthalten sogenannte “Halluzinationen”, d. h. Wörter, die im Ausgangstext nicht existieren.

  3. Terminologiefehler: Diese treten auf, wenn die im Translation-Memory verwendete Terminologie nicht konsistent oder sogar fehlerhaft ist.

  4. Rechtschreibfehler: Diese treten auf, wenn die Übersetzung (oder der Ausgangstext) nicht auf Rechtschreibung geprüft wurde.

  5. Formale Fehler: Diese treten auf, wenn formale Aspekte falsch sind, wie das Schließen von Klammern, das Einfügen falscher Zahlen, die Verwendung einer falschen Kodierung für Sonderzeichen usw..

  6. Unvollständige Sätze: Diese treten auf, wenn der zu übersetzende Text nicht richtig segmentiert wurde. Dies führt zu unvollständigen Segmenten, die aufgrund der unterschiedlichen syntaktischen und morphologischen Struktur der Sprachen sogar zu größeren Fehlern führen können.

  7. Zeichensetzungsfehler: Diese treten auf, wenn die Übersetzung eine falsche Zeichensetzung enthält bzw. wenn Satzzeichen fehlen.

  8. Veraltete Übersetzungen. Sie können z. B. falsche Verweise, Links, Benennungen oder Produktnamen enthalten.

Datenbereinigung Translation Memory
Bedeutung von Metadaten

Von der Bedeutung von Metadaten

Metadaten und Attribute sind in Translation-Memorys wichtig, weil sie Informationen über jedes übersetzte Segment liefern, dem sie zugeordnet sind. TM-Attribute können eine Vielzahl von Informationen enthalten, wie z. B. den Namen des übersetzten Dokuments, die Projektnummer, das Erfassungs- oder Änderungsdatum, die Häufigkeit der Wiederverwendung der Übersetzung, die Segmentherkunft (z.B. Alignment oder MÜ) oder den Bearbeitungsstatus des Segments. Diese Informationen können in verschiedenen Kontexten sehr nützlich sein, z. B.  bei der Verwendung von TMs für das Training einer MÜ-Engine.

Zu den spezifischen Vorteilen von Metadaten gehören:

Eingesetzten Technologien bei der Datenbereinigung

Es gibt verschiedene Tools und Methoden zur Reinigung von Translation-Memorys, die je nach Aufgabe eingesetzt werden können.

Das wichtigste Tool, das wir verwenden, ist ErrorSpy, unsere Software zur Qualitätssicherung von Übersetzungen. Wir haben vor etwa 20 Jahren mit der Entwicklung von ErrorSpy begonnen, und es hat sich zu einem Schweizer Taschenmesser der Qualitätskontrolle entwickelt. Innerhalb von Sekunden liefert ErrorSpy eine Liste möglicher Fehler, z. B. Terminologie-, Zahlen- oder Konsistenzfehler, die unsere Revisoren durchgehen.

Wir arbeiten auch mit regulären Ausdrücken, die es uns ermöglichen, bestimmte Muster in Translation-Memorys zu erkennen und einige von ihnen automatisch zu korrigieren. So können wir beispielsweise die Schreibweise von Produktnamen, Datumsformaten, überflüssige Leerzeichen, Überbleibsel alter Rechtschreibung oder bestimmten Wortfolgen erkennen und ändern.

Für bestimmte Aufgaben werden Methoden der künstlichen Intelligenz eingesetzt. Sie sind unter anderem sehr nützlich, um semantische Ähnlichkeiten zu erkennen. So können wir herausfinden, dass die Aussagen “Kein Aufenthalt unter schwebenden Lasten.” und “Nicht unter schwebenden Lasten aufhalten.” eigentlich die gleiche Bedeutung haben und nur eine einzige Übersetzung benötigen.

Schließlich helfen uns eine Reihe anderer linguistischen Tools oder selbst geschriebene Programme dabei, andere typische Probleme wie unvollständige Sätze, Mehrdeutigkeiten oder Rechtschreibfehler zu erkennen und zu lösen.

Technologien bei der Datenbereinigung einsetzen
Zusammenarbeit mit der D.O.G. GmbH
Bereinigungsservice für Ihre Sprachdaten
Sieben Gründe für eine Zusammenarbeit mit uns

Warum sollten Sie unsere Dienste zur Bereinigung von Translation-Memorys nutzen?

  1. Wir garantieren Ihnen Zeit- und Kosteneinsparungen durch bereinigte TMs.
  2. Wir haben die richtigen Werkzeuge und Technologien für diese Aufgabe.
  3. Wir haben mehr als 20 Jahre Erfahrung mit der Bereinigung von Translation-Memorys
  4. Unsere Qualitätssicherung erfüllt und übertrifft die DIN EN ISO 17100.
  5. Wir kennen uns mit KI-gestützten Qualitätssicherungsmethoden aus.
  6. Wir garantieren verlässliche Dienstleistungen und Qualität.
  7. Sie haben keine Fixkosten und Kosten entstehen bei Ihnen nur, für das, was Sie benötigen.

Kuratierung von Translation-Memorys

Unsere Dienstleistungen im Überblick

Wir bieten umfangreiche Leistungen zur Bereinigung und Kuratierung (engl. curation) von Translation-Memorys an, z. B:

Kundenstimmen
Das sagen unsere Kunden
FAQ
Häufig gestellte Fragen zur Bereinigung von Translation-Memorys

Zunächst einmal ist es wichtig, dass es einen Prozess gibt, um Translation-Memorys “sauber” zu halten. Dazu gehören die Auswahl des richtigen Übersetzungspartners, die Pflege und Verwendung einer Firmenterminologie und die Verwendung von Attributen zur optimalen Nutzung der übersetzten Segmente. Es wird empfohlen, Translation-Memorys regelmäßig alle 3 bis 6 Monate zu bereinigen und dazwischen gelegentlich weitere Überprüfungen vorzunehmen.

  1. Qualitätsmängel: Wenn ein Translation-Memory nicht bereinigt wird, sinkt die Qualität der Übersetzungen. Im Laufe der Zeit können Translation-Memorys mit falschen, inkonsistenten, schlecht übersetzten oder ungenauen Übersetzungen gefüllt werden, was zu einem qualitativ minderwertigen Ergebnis führt.
  2. Unnötige Kosten: Wenn ein Translation-Memory nicht bereinigt wird, können die Übersetzungskosten steigen. Es können weniger Segmente wiederverwendet werden, und die Kosten für die Qualitätssicherung sind aufgrund von Fehlern oder Unstimmigkeiten in übersetzten Segmenten höher.
  3. Sicherheitsrisiko: Mit der Zeit können Translation-Memorys mit schwerwiegenden Fehlern gefüllt werden, die zu falschen Handlungen des Benutzers eines Geräts oder einer Software führen und Sach- oder Personenschäden verursachen können.
  4. Kompatibilitätsprobleme: Wird ein Translation-Memorys nicht bereinigt, kann es bei der Verwendung mit anderen Systemen zu Kompatibilitätsproblemen kommen.

Translation-Memorys können sowohl manuell als auch automatisch bereinigt werden. Eine automatische Bereinigung kann doppelte Segmente erkennen und entfernen oder Segmente löschen, die zu kurz sind, um sinnvoll zu sein. Sie können auch formale Änderungen am Inhalt von TMs vornehmen, z. B. mit regulären Ausdrücken. Sie können auch Metadaten zu den Segmenten hinzufügen.

Manuelle Verfahren sind immer dann erforderlich, wenn menschliches Urteilsvermögen gefragt ist. Dies ist z. B. der Fall, wenn es darum geht, zu entscheiden, ob eine Übersetzung falsch ist oder ob ein Fachbegriff geändert werden muss.

Verschiedene Optionen für unterschiedliche Budgets

Strategien zur Bereinigung und Kuratierung von Translation-Memorys

Die Bereinigung von Translation-Memorys ist ein komplexer und manchmal kostspieliger und langwieriger Prozess. Je nach dem Schweregrad der Fehler in den Translation-Memorys, dem Zeit- und dem Kostenbudget können verschiedene Strategien entwickelt werden.

Option Nr. 1:

Vollständige Bereinigung aller Fehler: Dies bietet die größte Sicherheit in Bezug auf die Qualität der abschließend geprüften TMs, aber nicht immer das beste Kosten-Nutzen-Verhältnis. So gibt es beispielsweise Segmente, die nie wieder verwendet werden, oder solche, die sehr alt sind und Produkte betreffen, die nicht mehr entwickelt werden.

Option Nr. 2:

Bereinigung nur eines Teils der Translation-Memorys. Einige TMs wurden vor 10 oder mehr Jahren erstellt und enthalten viele Segmente, die nicht mehr aktuell sind. Die Bereinigungsaktion kann z. B. auf die letzten drei oder fünf Jahre beschränkt werden. Dadurch wird der Aufwand reduziert.

Option Nr. 3:

Einschränkung der Qualitätskriterien und Überprüfung nur auf bestimmte Aspekte. So könnten Sie z. B. festlegen, dass die Vereinheitlichung der Terminologie auf 50 oder 100 Schlüsselbenennungen beschränkt ist.

Option Nr. 4:

Mit Attributen und Abzügen bei der Verwendung von Segmenten aus einem Translation-Memory arbeiten. So können ungeprüfte Segmente ein Attribut und einen Abzug von 2-3 % für Matches (Treffer aus dem Translation-Memory, wenn derselbe Satz im Text vorkommt) erhalten. Ungeprüfte Übersetzungen sind also Fuzzy-Matches, die der Übersetzer vor der Aufnahme in seine Übersetzung prüfen sollte. Nachdem die Übersetzung fertiggestellt und geprüft wurde, erhalten alle verwendeten Segmente das Attribut “checked” (oder ähnlich).

Diese Optionen können miteinander kombiniert werden.

Service - Überblick

Diese Aspekte prüfen wir bei Translation-Memorys

Sprachliche Aspekte:

Fachliche und inhaltliche Aspekte:

Technische Aspekte:

Möchten Sie Ihre Translation-Memorys bereinigen lassen?

Dann sollten Sie mit uns sprechen, denn es gibt viele Möglichkeiten und Wege, Kosten zu sparen. Sie können von unserer Erfahrung mit zahlreichen Bereinigungsprojekten profitieren. Kontaktieren Sie uns unverbindlich.

Ähnliche Themen
Das könnte Sie auch interessieren
Scroll to Top
Scroll to Top