Terminologie für Redakteure und Übersetzer mit Definitionen
Glossar der technischen Kommunikation
Hier werden die wichtigsten Begriffe aus dem Bereich der technischen Kommunikation, Übersetzungen und Terminologie erklärt.
A
Kurzform für eine Wortgruppe, die aus den Anfangsbuchstaben der einzelnen Wörter gebildet wird.
Beispiel:
FAQ = Frequently asked questions (Häufig gestellte Fragen).
Ein Alignment dient dazu, Translation-Memorys mit früheren Übersetzungen zu befüllen, die nicht mit einem Translation-Memory-System erstellt wurden.
Die jeweiligen Ausgangs- und Zieltexte werden getrennt segmentiert und automatisch segmentweise einander zugewiesen. Ein Linguist muss die Richtigkeit der vorgeschlagenen Zuordnungen überprüfen.
In analytischen Sprachen werden Informationen über die grammatischen Beziehungen im Satz nicht durch Flexionen, sondern durch Partikeln und Einzelwörter geliefert. Chinesisch ist eine analytische Sprache.
Sprache aus der übersetzt wird.
Synonym:
Quellsprache
B
In der Terminologielehre ist der Begriff eine abstrakte Denkeinheit, für die je Sprache eine oder mehrere Benennungen stehen.
In der Norm DIN 2330 „Begriffe und Benennungen – Allgemeine Grundsätze“ werden Begriffe eingehend definiert.
Begriffsorientierte Terminologien verwalten Begriffe. Begriffe sind abstrakte Denkeinheiten, die Menschen mit Wörtern oder Wortgruppen benennen.
Im Gegensatz zu benennungsorientierten Terminologien (nach Benennungen organisiert) sammeln begriffsorientierte Terminologien alle Benennungen, die für einen bestimmten Begriff stehen.
Beispiel:
Programm, Anwendung, Applikation …
In der Terminologielehre ist die Benennung ein Wort oder eine Wortgruppe, die für einen Begriff steht. In der Norm DIN 2330 „Begriffe und Benennungen – Allgemeine Grundsätze“ werden Benennungen eingehend definiert.
Viele Sprachen wie Deutsch, Englisch laufen von links nach rechts. Einige Sprachen haben eine andere Richtung: von rechts nach links, wobei die Zahlen von links nach rechts gelesen werden. Deshalb heißen solche Sprachen bidirektionale Sprachen.
Synonym:
BiDi-Sprache
C
ChatGPT ist ein Large Language Model (LLM) basierend auf GPT (Generative Pre-trained Transformer), das mithilfe von Künstlicher Intelligenz entwickelt wurde, um Texte zu generieren, zu verstehen und Fragen in natürlicher Sprache zu beantworten. Es ist ein nützliches Werkzeug für Übersetzer und technische Redakteure, um Inhalte zu erstellen, zu überprüfen und zu optimieren.
Wird meistens für eine Übersetzung verwendet, die ein Übersetzer mit Hilfe eines Translation-Memory-Systems erstellt.
Synonym:
CAT
CAT-Tool
Computergestützte Übersetzung
Computerunterstützte Übersetzung
Computer-Assisted-Translation
Wird meistens für eine Übersetzung verwendet, die ein Übersetzer mit Hilfe eines Translation-Memory-Systems erstellt.
Synonyme:
Computer-Aided-Translation
CAT
Concept Maps dienen der Visualisierung von Wissen. Sie verbinden Begriffe (Knoten) grafisch mit Relationen (Kanten), um eine Wissenseinheit darzustellen. Die Relationen können hierarchisch aber auch assoziativ sein.
Redaktionssysteme oder Content-Management-Systeme (CMS) sind Softwaresysteme zur Verwaltung von Inhalten wie Benutzerhandbücher, Reparaturanleitungen oder Webinhalten. CMS verwalten Informationseinheiten und können diese in mehreren Sprachen mit zusätzlichen Metainformationen speichern. Wenn neue Inhalte erstellt oder ein bestehendes Handbuch aktualisiert werden muss, können die bestehenden Inhalte wiederverwendet werden. Die meisten CMS trennen Inhalt und Layout-Informationen. So kann derselbe Inhalt für verschiedene Medien wie Webseiten, gedruckte Handbücher oder mobile Geräte veröffentlicht werden.
Synonyme:
Redaktionssystem
CMS
Beschreibt die Terminologie, den Stil und den Sprachgebrauch, die ein Unternehmen i.d.R. in einem Style Guide und in ihrer Firmenterminologie festgelegt hat.
Synonym:
Firmensprache
D
Im Gegensatz zum Übersetzer überträgt der Dolmetscher eine Aussage von einer Sprache in die andere mündlich. Dolmetscher werden bei Konferenzen aber auch bei Verhandlungen, Arbeitsgesprächen eingesetzt.
Es gibt unterschiedliche Formen des Dolmetschens: Simultandolmetschen, Konsekutivdolmetschen, Flüsterdolmetschen… „Der professionelle Berufsverband der Dolmetscher ist der AIIC.“
Datensatz in einer Datenbank, der doppelt erfasst wurde. In Terminologiedatenbanken können Doubletten vorkommen, wenn zwei getrennt erfasste Terminologieeinträge dieselbe Bedeutung haben. Doubletten sollen nicht mit Homonymen verwechselt werden (gleiche Benennung aber unterschiedliche Bedeutung).
Synonyme:
Doublette
E
auch Übersetzungsengine genannt. Bezieht sich auf ein trainiertes maschinelles Übersetzungsmodell, das für die automatische Übersetzung von Texten verwendet werden kann.
F
Die Qualitätssicherungsnorm ISO 17100 stellt verschiedene Anforderungen an den Übersetzungsprozess. Dazu gehört neben der sprachlichen Prüfung auch die technische Prüfung.
Die Norm definiert die fachliche Prüfung als eine „einsprachige Überprüfung eines zielsprachlichen Inhalts auf Eignung für den vereinbarten Zweck“. Sie verlangt, dass die Prüfer, Sachgebietsspezialisten sind und über eine an einer Hochschule erworbene einschlägige Qualifikation auf dem jeweiligen Sachgebiet und/oder Erfahrung auf diesem Sachgebiet verfügen.
Die Qualitätsprüfung durch D.O.G. entspricht dieser Norm und wurde mehrmals erfolgreich auditiert.
Beschreibt die Terminologie, den Stil und den Sprachgebrauch, die ein Unternehmen i.d.R. in einem Style Guide und in ihrer Firmenterminologie festgelegt hat.
Synonyme:
Corporate Wording
Änderung der grammatischen Form eines Wortes, z.B. eines Verbes oder eines Nomen. Das ist z.B. für die Worterkennung durch Übersetzungssysteme oder Terminologiesysteme wichtig.
Synonyme:
Beugung
Ableitung
Beim Full-Post-Editing ist das Ziel, eine Übersetzung von ähnlicher Qualität wie die eines menschlichen Übersetzers zu erreichen. Die Norm ISO 18587:2018 schreibt vor, dass Post-Editoren die gleiche Qualifikation haben sollen wie Fachübersetzer gemäß der Definition ISO 17100.
Kategorie für die Analyse von Dateien bei Translation-Memory-Systemen. Zu dieser Kategorie gehören Segmente aus dem zu übersetzenden Text, für die ein ähnliches Segment in der Übersetzungsdatenbank (Translation-Memory) vorhanden ist.
Der Grad der Ähnlichkeit wird in Prozent ausgedrückt. Der Übersetzer kann einen Teil der vorhandenen Übersetzung wiederverwenden.
G
Im Rahmen der Softwarelokalisierung bezieht sich dieser Begriff auf Unternehmen, die ihre Aktivitäten weltweit planen. Dies betrifft alle Aspekte der Aktivitäten eines Unternehmens: Produktion, Vertrieb, Marketing usw.. U.a. betrifft es auch die sprachlichen Aspekte.
Synonyme:
Globalization
G11N
Die GUI bezeichnet die Benutzeroberfläche eines Computers. Sie ermöglicht mit Symbolen wie Schaltflächen, mit Eingabefeldern eine Interaktion zwischen Benutzer und Programm.
Der Benutzer kann Elemente der Oberfläche mit einer Maus, mit der Tastatur oder in manchen Fällen mit dem Finger oder mit einem Stift steuern.
Synonyme:
Benutzeroberfläche
Graphical User Interface
GUI
UI
H
Zwei Wörter, die gleich geschrieben werden aber unterschiedliche Bedeutungen haben, heißen Homonyme. Beispiele für Homonyme sind: Bank, Band, Papier oder Kohle. Bei benennungsorientierten Terminologien werden unter einen Homonym alle möglichen Bedeutungen eines Wortes aufgeführt. Begriffsorientierte Terminologie sind dagegen nach der Bedeutung organisiert.
Der Begriff ‚Humanübersetzung‘ (abgekürzt: ‚HÜ‘) wird für Übersetzungen verwendet, die durch einen Menschen angefertigt werden. Dabei kann der Übersetzer durchaus Technologien wie Translation-Memory-Systeme einsetzen. Durch die Verbreitung von maschinellen Übersetzungssystemen (MÜ-Systemen) in Zusammenhang mit Post-Editing (PE) und die Integration von MÜ-Technologien in Translation-Memory-Systeme ist die Abgrenzung zwischen MÜ+PE und HÜ in manchen Situationen unscharf.
Synonyme:
Human Translation
HÜ
I
Bezeichnet Terminologiebestände, die Terminologieeinträge nach Begriffen organisieren und darüber hinaus Begriffe bzw. Benennungen über Relationen miteinander verbinden. Auf diese Weise kann Wissen auf der Grundlage traditioneller begriffsorientierter Terminologie modelliert werden. Beispiel: Die Verbindung der Begriffe Auto – Motor – Lenkrad – Windschutzscheibe – Benzin kann in einer solchen intelligenten Terminologie Definitionen erweitern und zusätzliches Wissen darstellen. Intelligente Terminologien sind in der Regel maschinenlesbar.
Synonyme:
Ontoterminologie
Wissenshaltige Terminologie
Bezieht sich auf die Anpassung eines Produkts (Dienstleistung, Hardware oder Software) an die Gegebenheiten des Zielmarktes. Insbesondere in Bezug auf Software betrifft es sprachlich relevante Aspekte wie die Zeichenkodierung, die Sortierung von Listen, die Arbeit mit Variablen und Platzhaltern oder die Unterstützung von Bidirektionalität und noch einiges mehr. Auch kulturelle Aspekte wie die Verwendung von Symbolen oder Farben sind davon betroffen.
Synonyme:
I18N
Geräte, Endgeräte und virtuelle Gegenstände sind im Internet der Dinge über eine eindeutige ID ansprechbar und können miteinander kommunizieren. Damit sollen über das Internet Prozesse automatisiert werden und weitgehend autonom ablaufen.
J
steht für JavaScript Object Notation. Kompaktes Datenformat in einer einfach lesbaren Textform und dient dem Zweck des Datenaustausches zwischen Anwendungen. JSON ist von der Programmiersprache unabhängig. Parser und Generatoren existieren in allen verbreiteten Sprachen. Ein Filter in Trados-Studio 2019 und 2021 ist vorhanden.
K
Gruppen mehrerer Wörter, die regelmäßig gemeinsam verwendet werden. Beispiele dafür sind „fest überzeugt“, „unter Berücksichtigung von“ oder „scharf kritisiert“. Kollokationen sind keine festen Termini, die aus mehreren Wörtern bestehen („regulärer Ausdruck“).
Im Zusammenhang mit Terminologiearbeit oder Übersetzungen ist es die Liste gefundener Treffer (Sätze bzw. Segmente) für Wörter bzw. Wortgruppen, die in einem Korpus oder in einem Translation-Memory gesucht wurden. Die einzelnen Treffer liefern den Kontext für die Verwendung eines Wortes.
Eine der Kategorien, die Translation-Memory-Systeme für die Analyse von Texten verwenden. Ein Segment bzw. ein Satz des zu übersetzenden Texts ist ein Kontext-Match, wenn die Übersetzung aus dem Translation-Memory in einem gleichen Kontext vorkommt. CAT-Tools definierenden Kontext unterschiedlich. Beispielsweise, wenn das Segment vor und das Segment nach dem Kontext-Match ebenfalls im Translation-Memory gespeichert sind.
Synonym:
CM
Kontrollierte Sprache wird von Firmen oder Organisationen eingesetzt, die Informationen in großem Umfang erstellen. Die Autoren schreiben „kontrolliert“ und verwenden dabei Regeln sowie Terminologievorgaben. Ziel ist es, die Verständlichkeit von Texten zu verbessern und die Wiederverwendung von Inhalten durch Standardisierung zu erhöhen. Die Regeln betreffen die Maximallänge von Sätzen, die Formulierung von Anweisungen (z.B. in der Aktivform) oder die Verwendung bestimmter Wörter.
L
LLMs (große Sprachmodelle) wie GPT-4 haben Wortkorrelationen und andere Sprachmerkmale aus einem umfangreichen Korpus von Millionen von Dokumenten extrahiert. Sie basieren auf neuronalen Netzwerken mit Transformer-Architektur und können natürliche Sprache auf hohem Niveau verstehen, verarbeiten und generieren. Diese Modelle werden mit riesigen Textmengen trainiert.
Seit den frühen 2020er Jahren hat die rasante Entwicklung und Implementierung solcher Modelle stattgefunden. In einem zweistufigen Prozess wird zuerst ein Grundmodell, auch „Foundation Model“ genannt, auf hohe Sprachkompetenz trainiert. Durch das Training mit diversen Texten können LLMs in nahezu jedem Kontext agieren und für spezifische Anwendungen, wie Fachgebiete oder ChatBots, weiter spezialisiert werden.
Bekannte Beispiele für LLMs sind:
– GPT (GPT-3, GPT-4 usw.) von OpenAI
– BERT von Google
– LaMDA von Google
– PaLM von Google
Ein Redakteur liest einen Text und verbessert den Stil und die Formulierung. Ein Editor wird häufig von Verlegern verwendet. Im Gegensatz dazu wird im Übersetzungsbereich ein Revisor eingesetzt, der die Übereinstimmung von Quelltext und Übersetzung überprüft.
In der Sprachwissenschaft ist ein Lemma die Grundform eines Wortes, wie sie üblicherweise in einem Wörterbuch steht. Der Prozess, ein Wort auf seine Grundform zu reduzieren (Bücher –> Buch) heißt Lemmatisierung.
Beim Light-Post-Editing muss der Post-Editor inhaltliche Fehler, wie z.B. Verständnisfehler, Zahlen oder falsche Angaben korrigieren. Er soll aber nicht alle Syntaxfehler beseitigen, solange sie den Sinn des Satzes nicht verfälschen. Das Ziel von Light-Post-Editing ist ein korrekter und verständlicher Text, der nicht unbedingt in jeder Hinsicht die Qualität einer menschlichen Übersetzung erreichen muss.
Wird im Zusammenhang mit Software oder Websites verwendet. Lokalisierung geht weiter als die reine Übersetzung von Oberflächentexte, Meldungen und Online-Inhalten. Bei der Lokalisierung werden lokale Aspekte wie Adressenformate, Telefonnummern, Mehrwertsteuerangaben, Zahlen-, Datums- oder Währungsformate angepasst. Einheiten (Temperatur, Masse) werden u.U. umgerechnet.
Synonym:
L10N
Spezielle Kategorie von Translation-Memory-Systemen, die für die Lokalisierung von Softwaredateien eingesetzt werden. Sie enthalten Filter für die gängigen Typen von Softwaredateien wie *.exe, *.dll, *.po, *.resx, *.json und viele andere. Darüber hinaus verfügen diese Programme über technische Qualitätssicherungsfunktionen, mit denen technische Aspete der lokalisierten Dateien geprüft werden können. Für bestimmte Dateitypen bieten sie eine Visualisierungsfunktion, d.h. der Übersetzer kann während der Übersetzung die Dialoge, Oberflächenelemente usw. sehen und ggfs. seine Übersetzung dem Platzbedarf anpassen.
Synonym:
Lokalisierungswerkzeug
Lokalisierungsprogramm
Lokalisierungstool
M
Unmittelbar nach dem Zweiten Weltkrieg wurde an der Entwicklung von Computerprogrammen gearbeitet, die automatisch übersetzen konnten. Viele Jahre lang waren diese Programme nicht sehr erfolgreich, aber zuerst die statistischen maschinellen Übersetzungssysteme in den 1990er Jahren und zu Beginn des Jahrtausends und seit etwa dem Jahr 2012 brachten die neuronalen maschinellen Übersetzungssysteme (NMT) den Durchbruch. Diese Systeme machen immer noch Fehler, können aber in Verbindung mit Postediting bei manchen Textsorten gute Ergebnisse liefern.
Synonyme:
MÜ Automatische Übersetzung Maschinelles Übersetzen
URL:
Die EU-Maschinenrichtlinie 2006/42/EG schreibt vor, dass eine Betriebsanleitung in mindestens einer EU-Amtssprache verfasst sein muss.
Wenn es keine Betriebsanleitung in einer Landessprache gibt, muss der Hersteller einer Maschine oder seine Vertretung gegebenenfalls eine Übersetzung liefern.
Jede übersetzte Betriebsanleitung muss mit dem Hinweis „Übersetzung der Originalbetriebsanleitung“ versehen sein.
Ab dem 13. Juli 2023 gilt die neue EU-Verordnung, die Verordnung (EU) 2023/1230, die die Verordnung aus dem Jahr 2006 ersetzt.
Wörtlich steht in der Verordnung: „Die EU-Konformitätserklärung muss in ihrem Aufbau dem Muster in Anhang V Teil A entsprechen und die in den einschlägigen Modulen der Anhänge VI, VIII, IX und X aufgeführten Elemente enthalten. Sie ist stets auf dem neuesten Stand zu halten und in die Sprachen zu übersetzen, die von dem Mitgliedstaat vorgeschrieben werden, in dem die Maschine bzw. das dazugehörige Produkt in Verkehr gebracht, auf dem Markt bereitgestellt oder in Betrieb genommen wird.“
Eine wesentliche Funktion, die den Erfolg von künstlicher Intelligenz erklärt. Maschinen sind in der Lage, Lösungen für bestimmte Ausgaben selbst zu lernen. Sie können das nach einem überwachten (supervised) oder unüberwachten Verfahren tun. Beim überwachten Lernen (supervised learning) wie es bei maschinellen Übersetzungen der Fall ist, lernt das System anhand von Übersetzungsbeispielen, wie es eine neue möglichst korrekte Übersetzung produzieren kann. Die komplexen Rechenalgorithmen verarbeiten die Parameter des Modells solange, bis der Unterschied zwischen Vorgabeübersetzung und maschineller Übersetzung minimal ist.
Synonym:
Machine Learning
Ein Oberbegriff, der alle Treffer bezeichnet, die ein Translation-Memory-System findet, wenn es Segmente/Sätze aus dem zu übersetzenden Text mit dem Inhalt einer Übersetzungsdatenbank abgleicht. Es gibt unter anderem Exact Matches und Fuzzy Matches.
In der Sprachwissenschaft bezeichnet ein Morphem die kleinste bedeutungstragende Spracheinheit. Ein Morphem kann für sich allein stehen oder ist Teil eines Wortes wie „un“ in „unschön“. Ein Wort kann mehrere Morpheme enthalten. Morpheme stellen für Übersetzer eine besondere Herausforderung dar („systemseitig = system+seit+ig“)
N
Moderne Form von maschinellen Übersetzungssystemen, die durch neuronale Netze trainiert werden. NMT-Systeme werden seit dem Jahr 2016 eingesetzt und zeichnen sich durch einen besonders flüssigen Stil aus.
Synonyme:
NMT
O
Oberbegriffe kommen in hierarchischen Begriffsklassifikationen vor, etwa bei Taxonomien. Der Oberbegriff „Fahrzeug“ umfasst mehrere Unterbegriffe wie „Auto“, „Eisenbahn“ oder „Fahrrad“, die die wesentlichen Eigenschaften des Oberbegriffs teilen (hier: Fortbewegungsmittel). Bei Ontologien gibt es keine Oberbegriffe, sondern Klassen, die eine ähnliche Funktion haben.
In der IT-Wissenschaft sind Ontologien eine maschinenlesbare Darstellung von Wissen in Form von Klassen und Instanzen von Klassen, die durch Relationen (Eigenschaften/Properties) miteinander verbunden sind. Ontologien sind in einem speziellen XML-basierten Format (in der Regel RDF oder OWL) verfügbar und speichern Fachwissen zu einem breiten Themenspektrum. Intelligente Computersysteme können diese Ontologien abfragen und daraus neue Informationen extrahieren. Eine bekannte Ontologie ist DBPedia, die das Wissen hinter Wikipedia modelliert.
Bezeichnet Terminologiebestände, die Terminologieeinträge nach Begriffen organisieren und darüber hinaus Begriffe bzw. Benennungen über Relationen miteinander verbinden. Auf diese Weise kann Wissen auf der Grundlage traditioneller begriffsorientierter Terminologie modelliert werden. Beispiel: Die Verbindung der Begriffe Auto – Motor – Lenkrad – Windschutzscheibe – Benzin kann in einer solchen intelligenten Terminologie Definitionen erweitern und zusätzliches Wissen darstellen. Intelligente Terminologien sind in der Regel maschinenlesbar.
Synonym:
Intelligente Terminologie
Wissenshaltige Terminologie
P
Kategorie bei der Analyse von Dateien durch Translation-Memory-Systeme. Ein Perfectmatch funktioniert ähnlich wie ein Kontext-Match. Statt die Sätze(Segmente) eines Textes mit dem Inhalt einer Translation-Memory zu vergleichen, werden diese mit früheren Übersetzungen verglichen, die als vorsegmentierte zweisprachige Dokumente vorliegen. Oftmals handelt es sich bei diesen Dokumenten um frühere Versionen eines neu zu übersetzenden Dokuments.
Bezieht sich auf die Korrektur einer maschinellen Übersetzung durch einen ausgebildeten Post-Editor. Post-Editoren lernen, welche Fehler maschinelle Übersetzungssysteme machen und korrigieren sie entsprechend den Vorgaben des Auftraggebers. Eine Norm beschreibt die Anforderung an ihre Arbeit, die Norm ISO 18587:2018. Diese Norm unterscheidet zwischen zwei Stufen von Post-Editing: Light-Post-Editing und Full-Post-Editing.
Synonym:
Post Editieren
Mitarbeiter*in eines Übersetzungsunternehmens, der Übersetzungsprojekte vorbereitet, organisiert und überwacht. Der Umfang der Aufgaben eines Projektmanagers hängt weitgehend von der Organisationsstruktur und der Philosophie des Übersetzungsunternehmens ab. Ein Projektmanager kann auch technische Aufgaben übernehmen, die sprachliche Qualitätskontrolle durchführen, Dienstleistungen kalkulieren, anbieten und in Rechnung stellen und manchmal größere mehrsprachige Teams von Übersetzern, Terminologen und anderen Spezialisten koordinieren.
Q
Die Produktion von Übersetzungen ist zunehmend ein arbeitsteiliger Prozess geworden. Sowohl die zu übersetzenden Inhalte als auch die Übersetzungen stammen teilweise aus Datenbanken (Content-Management-Systeme bzw. Translation-Memorys) und sind über Jahre von unterschiedlichen Autoren/Übersetzern erstellt worden. Die verwendete Terminologie ist manchmal uneinheitlich. Die Datenformate können besondere Herausforderungen bereiten. Viele Faktoren beeinflussen die Qualität einer Übersetzung. Deswegen führen die meisten professionellen Anbieter von Übersetzungen eine Qualitätssicherung ihrer Arbeit durch. Die Norm ISO 17100 regelt den Qualitätssicherungsprozess und stellt Anforderungen an die Qualifikation der beteiligten Mitarbeiter (Übersetzer, Revisoren und Projektmanager).
R
Redaktionssysteme oder Content-Management-Systeme (CMS) sind Softwaresysteme zur Verwaltung von Inhalten wie Benutzerhandbücher, Reparaturanleitungen oder Webinhalten. CMS verwalten Informationseinheiten und können diese in mehreren Sprachen mit zusätzlichen Metainformationen speichern. Wenn neue Inhalte erstellt oder ein bestehendes Handbuch aktualisiert werden muss, können die bestehenden Inhalte wiederverwendet werden. Die meisten CMS trennen Inhalt und Layout-Informationen. So kann derselbe Inhalt für verschiedene Medien wie Webseiten, gedruckte Handbücher oder mobile Geräte veröffentlicht werden.
Synonyme:
Content-Management-System
CMS
Reguläre Ausdrücke werden in vielen Programmier- und Skriptsprachen implementiert und sind in abgeschwächter Form in mehreren Editoren wie MS-Word vorhanden. Mit regulären Ausdrücken kann man in Texten nach typischen Mustern suchen oder Zeichenketten (Strings) manipulieren.
Synonym:
Regulärer Ausdruck
Reguläre Ausdrücke werden in vielen Programmier- und Skriptsprachen implementiert und sind in abgeschwächter Form in mehreren Editoren wie MS-Word vorhanden. Mit regulären Ausdrücken kann man in Texten nach typischen Mustern suchen oder Zeichenketten (Strings) manipulieren.
Synonym:
Regex
Die DIN EN ISO 17100:2016-05 definiert Revision als: zweisprachige Überprüfung eines zielsprachlichen Inhalts im Vergleich mit dem ausgangssprachlichen Inhalt auf Eignung für den vereinbarten Zweck.
S
In der Übersetzungsbranche bezeichnet Segmentierung die Zerlegung von Texten in einzelne Segmente. Segmente sind meistens Sätze, können aber kürzer oder länger sein (z.B. ganze Sätze). Anbieter von Translation-Memory-Systemen tauschen ihre Segmentierungsregeln im SRX-Format aus.
Semantik ist die Lehre von der Bedeutung von Wörtern, Aussagen oder Zeichen. Die Klärung von Bedeutung steht im Mittelpunkt der Arbeit von technischen Redakteuren und Übersetzern. Semantik spielt ebenfalls im wachsenden Bereich von KI und der Verarbeitung natürlicher Sprache eine Rolle. Deswegen sind Bemühungen zum Aufbau von Terminologiedatenbanken oder Wissenssystemen wie Ontologien von großer Bedeutung für den Erfolg von Unternehmen.
Ein Modell, das zu den Grundprinzipien der Terminologielehre gehört und bereits im Jahr 1923 durch Odgen und Richards in ihrem Buch „The meaning of meaning“ eingeführt wurde. Im Grunde stellt das Dreieck die Beziehung zwischen (1) abstraktem Begriff, (2) Benennungen, die ihn bezeichnen und (3) der konkreten Repräsentation des Begriffs.
Suchmaschinenoptimierung wird durchgeführt, um die Chancen zu erhöhen, dass eine Webseite von den gängigen Suchmaschinen wie Google oder Bing gefunden wird. SEO steht für das Englische „Search Engine Optimization“.
Ein besonderer Aspekt von SEO ist die Lokalisierung von Keywords für andere Länder und Sprachen. Es gibt unterschiedliche Suchmaschinen (z.B. Yandex in Russland) und die Keywords können in anderen Ländern und Kulturen sehr unterschiedlich sein.
Synonym:
Suchmaschinenoptimierung
Search Engine Optimization
Bei der Softwareentwicklung bedeutet Lokalisierung die Anpassung von Programminhalten an die Anforderungen des Zielmarktes. Das betrifft sowohl sprachliche als auch inhaltliche (z.B. Adressenformate), technische (z.B. Codierung, Sortierung) oder kulturelle Aspekte (Symbole, Farben).
Manche Übersetzungsdienstleister haben sich auf die Lokalisierung von Software spezialisiert und setzen dafür geeignete Übersetzungsprogramme und Verfahren ein.
Statistische Maschinelle Übersetzungssysteme (SMT) wurden in den 1990er Jahren eingeführt, waren ursprünglich wortbasiert und sind danach auf Wortgruppen (Phrasen) und weitere Merkmale erweitert worden. Sie berechnen die Häufigkeit des gemeinsamen Vorkommens von Wortgruppen in Paralleltexten sowie einige weitere Merkmale und verwenden diese Statistiken, um neue Übersetzungen zu generieren. Viele Jahre lang war SMT die führende maschinelle Übersetzungstechnologie, die nun von neuronalen maschinellen Übersetzungssysteme abgelöst wurde.
Synonym:
SMT
Diese Listen von Stoppwörtern werden für verschiedene linguistische Aufgaben wie die Terminologieextraktion verwendet. Sie enthalten häufige Wörter einer Sprache wie Artikel, Konjunktionen usw., die für bestimmte Anwendungsfälle nicht relevant sind.
Synonym steht für eine Benennung, die die gleiche Bedeutung hat als eine andere Benennung. Beispiel: „Software“ und „Programm“ sind Synonyme. Bei begriffsorientierten Terminologien werden Synonyme unter einem Begriff zusammengefasst. Neben volle Synonymen gibt auch Quasi-Synonyme, d.h. Benennungen, die fast die gleiche Bedeutung haben oder die nicht ohne Weiteres austauschbar sind.
Regeln für die Bildung von Sätzen in einer Sprache. Viele Sprachen wie z.B. Englisch basieren auf dem SVO-Modell (Subjekt – Verb – Objekt). Es gibt aber andere Grundkonstruktionen: SOV (Japanisch, Koreanisch, Türkisch) oder VSO (Arabisch). In früheren Jahren waren maschinelle Übersetzungssysteme regelbasiert. Sie übertrugen unter anderem die syntaktischen Regeln einer Sprache in die andere.
Bei synthetischen Sprachen liefert die Flexion Information über die grammatikalische Funktion eines Wortes. Deutsch ist eine synthetische Sprache.
T
Klassifikationsschema für Begriffe und Benennungen, i.d.R. hierarchisch: Fahrzeug > Auto > Ford Fiesta. Begriffe können mehrere Zuordnungen haben.
TBX ist ein Akronym für TermBase eXchange und ist ein Standard für den Austausch von Terminologiedaten. Obwohl TBX ein Standard ist, wird er von den Anbietern von Terminologiesystemen nicht immer einheitlich implementiert, so dass es einige Dialekte von TBX gibt. Die Version 3 von TBX ist eine internationale Norm: ISO 30042:2019
Eine Fachkraft, die sich auf die Vermittlung komplexer technischer Informationen spezialisiert hat. Technische Redakteure sind in erster Linie für die Erstellung von Dokumentationen wie Betriebsanleitungen, Montageanleitungen, Reparaturanleitungen usw. verantwortlich. Hierfür werden spezielle Programme wie Content-Management-Systeme und Grafikprogramme eingesetzt. Die Gesellschaft für Technische Kommunikation – tekom Deutschland e.V. vertritt die Redakteure und bietet viele Informationen rund um den Beruf.
Schwerpunktmäßig geht es um Fachwörter, die ein Text (ein Korpus) enthält und die man in eine Terminologie aufnehmen möchte. Die gennaue Definition dessen, was ein Terminus ist, ist dehnbar und hängt oft vom Zweck der Terminologiearbeit ab. Terminologieextraktion wird z.B. in der Übersetzungsbranche regelmäßig durchgeführt, um sicherzustellen, dass Übersetzer Begriffe verstehen und konsistent übersetzen.
Synonym:
Terminologieextraktion
Bezeichnet alle Aktivitäten, die zur Erstellung von Fachterminologie beitragen. Dies umfasst in der Regel die Extraktion, Organisation, Pflege, Verteilung und Bereitstellung von Terminologie. Meist wird die Terminologiearbeit in Unternehmen oder Organisationen oder von Fachleuten wie Übersetzern und Redakteuren im Rahmen ihrer beruflichen Tätigkeit durchgeführt.
Beschreibt die Situation, in der es für einen bestimmten Begriff in einer anderen Sprache oder in einem anderen Kulturkreis keine Entsprechung gibt. Dies ist häufig bei alltäglichen Dingen wie Gerichten der Fall, aber auch im technischen Bereich findet man oft eine Terminologielücke, insbesondere wenn es um Innovationen, um neue Produkte oder Begriffe geht. Die hohe Zahl englischer Termini in der deutschen Fachsprache ist ein Beleg für dieses Phänomen.
Ein Thesaurus ist eine organisierte Sammlung von Begriffen, die sich auf ein bestimmtes Thema oder Fachgebiet beziehen. Ein Thesaurus beschreibt die Relationen zwischen den Begriffen und erfasst Synonyme für die Benennungen, die einen Begriff bezeichnen. Die Norm DIN 1463-1 definiert ein Thesaurus als „eine geordnete Zusammenstellung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient.“
TMX steht für Translation Memory eXchange und ist ein Standardformat für den Austausch von Translation-Memorys. Eine TMX-Datei ist XML-basiert und kann mit einem Texteditor geöffnet werden. Aktuell gilt die Version TMX 1.4b vom Jahr 2005.
Ist die grafische Darstellung einer Wissenseinheit.
Begriffe, die gemeinsam ein Wissen darstellen, werden mit hierarchischen und assoziative Relationen verknüpft. Ein Auto ist ein Fahrzeug (hierarchische Beziehung = Oberbegriff) und verbrauch Benzin (assoziative Beziehung).
Wie der Name schon sagt, ist die Transkreation eine Mischung aus Translation und Kreation. Der Übersetzer passt die Übersetzung an die Kultur der Zielgruppe an.
Dies gilt insbesondere für Slogans, für Anspielungen auf Ereignisse, auf öffentlich bekannte Personen, auf Redewendungen und Sprichwörter oder für Beispiele.
Der Slogan der Bundeskanzlerin „Wir schaffen das“ wird in anderen Ländern ohne Kenntnis des damaligen Kontextes schwer zu verstehen sein. Hierfür kann die Kultur des Ziellandes eine vergleichbare Formulierung liefern, die der Transkreator verwenden kann.
Die Buchstaben eines Wortes werden in ein anderes Schriftsystem übertragen. Das kann z.B. vorkommen, wenn in einem Dokument russische Namen in lateinischer Schrift geschrieben werden.
Es ist ein Übersetzungssystem, mit dem Übersetzer Texte übersetzen. Das Übersetzungssystem speichert jeden übersetzen Satz (Segment) zweisprachig in einer Datenbank (Translation-Memory).
Wenn ein Dokument einen Satz enthält, der bereits in einem früheren Projekt übersetzt wurde, schlägt es ihn dem Übersetzer vor. Wenn der im Translation-Memory gefundene Satz nicht ganz mit dem Satz im Text übereinstimmt, spricht man von einem Fuzzy-Match. Der Übersetzer kann die ähnliche Übersetzung aus dem Memory übernehmen und anpassen. Dadurch wird er oder sie produktiver. Inzwischen haben Translation-Memory-Systeme eine ganze Reihe von fortgeschrittenen Produktivitätsfunktionen und integrieren häufig maschinelle Übersetzungssysteme.
Synonyme:
TMS
TM-System
Translation-Memory-Anwendung
Translation-Memory-Programm
Translation-Memory-Software
Translation-Memory-Tool
Translation-Memory-Werkzeug
Unter einer Transkreation versteht man in der Werbung die Übersetzung eines Werbetextes in eine andere Sprache unter Berücksichtigung veränderter kultureller Bedingungen und Zusammenhänge.
U
Unternehmen oder Einzelperson, die Übersetzungen als Dienstleistung anbietet. Man unterscheidet zwischen SLV (Single Language Vendor) und MLV (Multi-Language Vendor).
Synonyme:
LSP
Language Service Provider
Sprachdienstleister
Übersetzungsagentur
Übersetzungsbüro
Übersetzungsunternehmen
Unternehmen, die ihre Texte regelmäßig übersetzen lassen, können ihre Texte für den Übersetzungsvorgang optimieren. Externe Übersetzer fehlen manche Kenntnisse über die Produkte eines Unternehmens.
Manche Ausdrucksweisen können mehrdeutig sein. Fachwörter, die zu allgemein sind (z.B. Behälter) müssen in einigen Sprachen präziser übersetzt werden. Übersetzungsgerechtes Schreiben bedeutet, dass bereits in der Redaktionsphase möglichst viele potentielle Fragen des Übersetzers durch eine andere oder genauere Schreibweise vermieden werden. Viele der Prinzipien, die für kontrollierte Sprache gelten (kurze Sätze, standardisierte Syntax, einheitliche Terminologie) gelten auch für übersetzungsgerechtes Schreiben. Beim übersetzungsgerechten Schreiben liegt der Schwerpunkt jedoch auf der Optimierung der Übersetzung.
Steht für Universal Coded Character Set (UCS) und ist ein Standard (ISO 10646) für die Codierung von Zeichen. In den 80er Jahren hatten die Computer nicht ausreichen Kapazität und Möglichkeiten, um Zeichen aller Sprachen darzustellen. Code-Tabellen waren auf einzelne Sprachgruppen beschränkt, was zu größeren Schwierigkeiten führte, wenn Zeichen oder Buchstaben aus verschiedenen Sprachfamilien auf demselben System angezeigt werden sollten. Erst Anfang der 1990er Jahre kam der Durchbruch mit einem 16-Bit-Zeichensatz und der ersten Version des Unicode-Standards. Inzwischen kann Unicode etwa 100.000 Schriftzeichen (darunter Emoticons) darstellen. Oft ist von UTF (Unicode Transformation Format) in drei Varianten (UTF-8, UTF-16 und UTF-32) die Rede. Am weitesten Verbreitet ist die UTF-8 Variante, die den Speicherplatz für Unicode-Zeichen optimiert.
V
Im Zusammenhang mit der Qualitätssicherung von Übersetzungen bedeutet dieses Prinzip, dass mindestens zwei Personen eine Übersetzung gesehen und überprüft haben. In der Regel ist dies der Übersetzer, der seine eigene Arbeit überprüft, und ein Revisor, der die Übersetzung im Vergleich zum Ausgangstext redigiert.
W
Wenn ein Segment oder ein Satz mehrmals in einem Text vorkommt, nennt man dies Wiederholung.
Der Übersetzer braucht nur das erste Vorkommen des Satzes zu übersetzen, und seine Übersetzung wird für die nachfolgenden Sätze wiederverwendet. Dies wird von Translation-Memory-Systemen automatisch durchgeführt. Dadurch werden Übersetzungen günstiger. Was das konkret bedeutet, erklären wir auf unserer Seite Preise. Daher möchte man bei der Analyse eines Textes wissen, wie viele Wiederholungen vorkommen.
Synonyme:
interne Wiederholung
X
Akronym für XML Localization Interchange File Format. Ist ein offenes Standardformat für die Übertragung von Übersetzungsdaten zwischen verschiedenen Tools und Systemen.
Y
Akronym für Yet Another Markup Language. Dateityp, der zum Speichern und Übertragen von Daten in einer für Menschen lesbaren und leicht zu verarbeitenden Form verwendet wird, z.B. für Konfigurationsdaten. Bei Software-Lokalisierungsprojekten muss darauf geachtet werden, dass die Dateiinhalte korrekt lokalisiert sind.
Z
Abrechnungsmodus für Übersetzungen. In der Regel handelt es sich um die übersetzte Zeile. Die Länge der Zeile ist auf 50 oder 55 Bruttozeichen (einschließlich Leerzeichen) festgelegt. Da vor der Übersetzung nicht bekannt ist, wie lang die Übersetzung sein wird, werden Expansionsfaktoren verwendet, um die Kosten für jede Sprache zu schätzen. Beispiel: Französisch oder Spanisch sind im Durchschnitt 20% länger als Deutsch. War in den 90er Jahren sehr verbreitet. Die Einführung von TMS hat dazu geführt, dass die zeilenbasierte Abrechnung zugunsten einer wortbasierten Abrechnung, die auf den Wörtern der Ausgangssprache basiert, verdrängt wurde.
Benötigen Sie eine Terminologie für Ihr Unternehmen?
Jedes Fachgebiet verwendet eine spezifische Terminologie. Systematische Terminologiearbeit unterstützt die interne und externe Kommunikation. Sprechen Sie uns an. Wir unterstützen Sie gerne.