Zum Inhalt springen

Kategorie: Terminologie



Wissen: Der neue Rohstoff

"Wissen ist Macht". Dieses geflügelte Wort formulierte der englische Philosoph Francis Bacon vor etwas mehr als 400 Jahren. Für Unternehmen sind fachkundige Informationen und Wissen ein entscheidender Wettbewerbsfaktor. Wer Entwicklungen am Markt schneller erkennt oder alle Wissensstrukturen innerhalb seines Unternehmens perfekt vernetzt, hat definitiv die Nase vorn. Das ist der Grund, warum im Zeitalter von künstlicher Intelligenz und vom Internet der Dinge Unternehmen zunehmend den Aufbau und die Verwaltung von Wissen zum Bestandteil ihrer Strategie machen. 

Wissen zu identifizieren und zu organisieren ist eine große Herausforderung und benötigt viele Ressourcen. Das eigene Wissen ist verstreut in Ordnern, Dateien und in den Köpfen zahlreicher Mitarbeiter. Dazu kommen die Unmengen an Daten, die täglich das Internet oder verschiedene Quellen generieren. In dieser Form ist Wissen ein Rohstoff. Wie lässt er sich zu brauchbarem Wissen veredeln? 

In den letzten Jahren sind bei der automatischen bzw. halbautomatischen Wissensextraktion und -organisation dank künstlicher Intelligenz und Lernalgorithmen große Fortschritte erzielt worden. Die entscheidende Frage für Wissensarbeiter wie Redakteure und Übersetzer ist, welchen Beitrag sie beim Aufbau von Wissen leisten können. Vor allem bei der Verarbeitung von Informationen in natürlicher Sprache können Redakteure oder Übersetzer mitwirken. Und mit natürlicher Sprache ist nicht nur Deutsch, sondern sind auch die üblichen Handelssprachen gemeint.

Zuerst ist es wichtig zu verstehen, was ein Unternehmen eigentlich unter Wissen versteht. Wissen besteht aus Informationen, die strukturiert verfügbar und mit Metadaten (Daten über die Daten) angereichert sind. Damit können nicht nur Menschen das vorhandene Wissen nutzen. Vor allem Programme können es für unterschiedliche Unternehmensprojekte verwenden. Einige Beispiele solcher möglichen Anwendungen sind:

  1.  Analyse der Wahrnehmung des Unternehmens in der Öffentlichkeit, z. B. in sozialen Medien, um schneller auf bestimmte Entwicklungen zu reagieren (Sentiment Analysis). 
  2. Optimierung der Kundenbetreuung durch automatische Beantwortung von Fragen in Deutsch oder Fremdsprachen (Smart Assistenten, Chatbots. Beispiel: Lufthansa mit Mildred oder Sixt mit seinem Jobbot).
  3. Empfehlungssystem für Endkunden bei ihrer Suche nach Produkten oder Leistungen. 

Der Aufbau von Wissen ist Teamarbeit, bei der unterschiedliche Spezialisten mitwirken: Ingenieure, Computerlinguisten oder Data Science Spezialisten und einige mehr. Die besondere Kompetenz von Redakteuren liegt darin, dass sie ständig mit Wissensvermittlung zu tun haben. Sie haben ein breites Wissen über Unternehmensprodukte und haben auch ein gutes Netz an Informationsquellen aufgebaut. Fachübersetzer haben vor allem ein gutes linguistisches Knowhow. Sie sind in der Lage, sprach- oder kulturbedingte Unterschiede bei der Organisation von Wissen zu erkennen und zu dokumentieren. Beispiel: Kraftfahrzeuge, die in den USA oder in Japan anders klassifiziert sind als in Deutschland. 

Inwiefern ist das für Wissensprojekte von Interesse? Um das nachzuvollziehen, müssen wir grob verstehen, wie Wissen extrahiert und verfügbar gemacht wird. Am Anfang stehen größere Mengen an Daten in natürlicher Sprache zur Verfügung: Sammlungen von Texten, Webseiten, Beiträgen aus sozialen Medien, etc. Diese Mengen sind zu groß, um sie in einem vernünftigen Zeit- und Kostenrahmen manuell auszuwerten. Künstliche Intelligenz, Verfahren der Computerlinguistik und maschinelles Lernen erkennen Wissenselemente und machen sie sichtbar. 

In einem ersten Schritt ist die Verarbeitung der natürlichen Sprache stark statistisch, wenn bereits andere Aspekte (z. B. Syntax) zum Tragen kommen. Damit kann ein System irgendwann lernen, dass zum Thema "Auto" Elemente wie "Lenkrad", "Sitz", "Gaspedal", "Blinker" und "Rückspiegel" gehören. Es wird außerdem einen besonderen Zusammenhang zwischen "Blinker" und "Rückspiegel" erkennen und diese Begriffe vielleicht einer Kategorie "Sicherheit" zuweisen. Dieses Wissen wurde u. U. nirgendwo ausdrücklich als Wissen formuliert. Wissensspezialisten werten diese Informationen aus, um daraus computerlesbares Wissen zu erzeugen, etwa in Form von Ontologien.

Damit ist der Punkt erreicht, an dem Redakteure oder Übersetzer dazu beitragen können, Lernverfahren und Methoden der Wissensorganisation nachhaltig zu verbessern. Sie können bereits im Vorfeld semantische Informationen bereitstellen, die diese Verfahren deutlich präziser, schneller und effizienter machen. Seit einigen Jahren entstehen vermehrt Terminologiebestände, die Redakteure oder Übersetzer für ihre tägliche Arbeit anlegen. Bei einigen Großunternehmen erreicht die Zahl der erfassten Termini beeindruckende Größenordnungen, wie bei SAP mit ca. 245.000 Begriffen und 4,6 Millionen Terminologieeinträgen in 48 Sprachen1. Während die meisten Wissensspezialisten diese Bestände bisher wenig beachtet haben, stellt die erfasste Terminologie eine große Chance für die Wissensarbeit dar. Um auf unser Autobeispiel zurückzukommen, stehen in einer professionell aufgebauten Terminologiedatenbank unter dem Begriff "Rückspiegel" neben der Definition und der Benennung "Rückspiegel" auch Synonyme wie "Innenspiegel" oder Fremdsprachenbenennungen wie "rearview mirror" oder "interior mirror". Ähnlich bei "Blinker" mit Synonymen wie "Fahrtrichtungsanzeiger". Es sind qualitativ hochwertige und validierte Informationen, mit denen Lernverfahren für die Wissensextraktion optimiert und beschleunigt werden können. Als weiterer Effekt sind dadurch geringere Mengen an Trainingsdaten erforderlich, um gute Lernergebnisse zu erzielen. 

Seit wenigen Jahren können manche Terminologieverwaltungssysteme, wie das von D.O.G. entwickelte LookUp, Relationen zwischen den Begriffen darstellen. Das sind weitere nützliche Elemente, auf die Wissensexperten zurückgreifen können. Mit Relationen wie "A ist Teil von B" oder "A ist Voraussetzung für B" liefern wissenshaltige Terminologiesysteme geprüfte Informationen, die sonst anderswo noch mühsam aufgebaut werden müssen. Das schafft bei Wissensprojekten einen wertvollen Zeitvorsprung.

Schließlich können mithilfe von Terminologiedaten Wissensbestände wie Ontologien oder annotierte Dokumente deutlich präziser ausgetauscht werden. Ihre Schwäche ist ja, dass sie oft sprachlich wenig aufbereitet sind. Der Zugang zu oder der Austausch von Informationen erfolgt bisher oft nur über die hinterlegten Klassenbezeichnungen. Das ist natürlich ein Problem, wenn die menschliche oder maschinelle Suche andere Bezeichnungen verwendet. Ferner sind Ontologien meistens in nur einer Sprache definiert. 

Künstliche Intelligenz, Big Data, Wissensextraktion und Wissensmanagement sind die Bereiche, die in den nächsten Jahren sehr schnell wachsen werden. Dafür braucht man Ressourcen und gute Trainingsdaten. Das eröffnet neue Chancen für Terminologen, Redakteure und Übersetzer, die über Jahre und mit viel Fleiß Terminologien aufgebaut haben.


1 Mark Childress. Terminology Management at SAP. Präsentation bei der Frühjahrsschule der FH Anhalt in Köthen. März 2018.

Terminologie: Wie nützlich sind Nomenklaturen?

Seit Jahrtausenden versucht der Mensch, alles zu klassifizieren. Es gibt laut Jonathan Swift in Gullivers Reisen die Menschen, die ein gekochtes Ei am spitzen oder am stumpfen Ende aufschlagen, es gibt den Metallbohrer und den Holzbohrer, usw. Es ist daher nachvollziehbar, dass sich Terminologen für dieses Thema interessieren und versuchen, Termini in eine bestimmte Nomenklatur einzuordnen. Ist das eine gute Idee und ist diese Idee in einem internationalen Umfeld leicht umzusetzen? Das möchten wir hier kurz prüfen.

Um beim Beispiel des Bohrers zu bleiben, wäre es die Aufgabe des Terminologen festzulegen, dass es einen Oberbegriff "Bohrer" gibt und dass dieser Oberbegriff verschiedene Unterbegriffe wie "Metallbohrer" oder "Universalbohrer" umfasst und dass diese Unterbegriffe gegebenenfalls weitere Unterkategorien wie "HSS-Co-Metallbohrer (mit Cobaltlegierung)" oder "HSS-TiN-Metallbohrer (mit Titannitrit)" enthalten.

Was beim ersten Hinsehen logisch und einfach erscheint und für das Verständnis einzelner Begriffe sicherlich eine große Unterstützung bietet, ist bei näherer Betrachtung nicht immer leicht umzusetzen. Die erste Frage, die sich stellt, lautet: Welches Klassifikationssystem (Nomenklatur) nehmen wir? In manchen Situationen gibt es ja weltweit anerkannte Klassifikationssysteme wie etwa beim eCl@ss- Standard zum digitalen Austausch von Produktstammdaten. Aber das ist bei weitem nicht immer der Fall. Bestimmte Nomenklaturen gelten nur für einzelne Länder oder Regionen. Das ist z. B. bei der Klassifikation von Krankheiten der Fall, die in den USA bzw. in der EU oder in Japan unterschiedlich gegliedert sind. Nicht umsonst arbeiten weltweit viele Ausschüsse oder Arbeitsgruppen daran, Nomenklaturen zu harmonisieren.

Auch die vielen Landesnormen wie DIN (Deutsche Industrienormen), AFNOR (Frankreich) oder BSI (Großbritannien) klassifizieren keineswegs Produkte einheitlich. Dabei spielen auch die nationalen Gesetze eine Rolle, die bestimmte Begriffe (etwa in Bezug auf die Versteuerung der Produkte) anders definieren und auslegen.

Schließlich gibt es auch viele Situationen, in denen es einem Ingenieur, Terminologen oder Marketingverantwortlichen freigestellt bleibt, wie er Produkte oder Komponenten klassifiziert.

Ob aus einem festen Bestand anerkannter Klassifikationen oder aus frei definierten Nomenklaturen, festgelegte Klassifikationssysteme bringen einige Probleme mit sich. Zuerst einmal entsprechen Klassifikationen nicht immer dem aktuellen Stand der Technik. Technologien entwickeln sich weiter, Produkte können sehr schnell ganz neue Funktionen erhalten und dadurch in neue Kategorien fallen bzw. mehreren Kategorien angehören. Wir leben in einer Zeit raschen technologischen Wandels und neue Technologien wie Künstliche Intelligenz werden althergebrachte Klassifikationssysteme auf den Kopf stellen. Wie lange wird z. B. ein Industrieroboter noch als "automatisch gesteuerter, frei programmierbarer Mehrzweck-Manipulator" (DIN EN ISO 10218-1:2012-01) gelten?

Des Weiteren ist es speziell in Bezug auf die Terminologiearbeit von großer Bedeutung, Terminologien global aufzubauen. Das bedeutet konkret, dass keine Sprache die Organisation der Begriffe einseitig bestimmt, sondern dass sowohl der deutsche als auch der amerikanische oder griechische Nutzer sich mit den angebotenen Definitionen und Klassifikationen zurechtfindet. Es wird oft unterschätzt, wie stark Sprachen und lokale Gegebenheiten diese Faktoren beeinflussen. Verschiedene Sichtweisen für dieselbe Realität findet man immer wieder in der Technik, aber auch auf anderen Gebieten (Recht, Wirtschaft, Gesundheitswesen, usw.), sodass es besonders schwer ist, eine einheitliche universelle Klassifikation festzulegen.

Als weiterer Faktor gilt, dass Terminologien in der Regel nicht für eine einzelne Benutzergruppe, sondern auch für möglichst viele Nutzer bestimmt sind, seien es unterschiedliche Abteilungen eines Unternehmens wie Vertrieb, Entwicklung oder Produktion oder externe Nutzer wie Kunden oder Lieferanten. Hier spielt im Hinblick auf die Klassifikation der Begriffe das Nutzungsszenario des Einzelnen eine große Rolle. Wer z. B. im Supermarkt seine Einkäufe tätigt, wird sich immer wieder wundern, warum die Tomatensauce nicht bei den anderen Konserven, sondern neben Pastaprodukten aufgestellt ist. Hier steht eine verkaufsfördernde Klassifikation im Vordergrund. Der Redakteur blickt auch nicht zwangsläufig mit denselben Augen auf Produkte wie der Produktentwickler. Für ihn stehen Sicherheitsaspekte und die Vermittlung von Informationen über die Bedienung und Wartung des Produktes im Vordergrund, nicht die Bestellung von Produktionsmaterial oder bestimmte Produktionsabläufe.

Sobald die Terminologiearbeit mehr als eine klar abgegrenzte Benutzergruppe erreichen soll, bilden feste Nomenklaturen in vielen Fällen bei der Terminologieanreicherung eher ein Hindernis. Sie sind nicht sehr flexibel, zwingen die Klassifikation einer bestimmten Benutzergruppe auf und sind aufgrund sprachlicher oder kultureller Faktoren oft international problematisch.

Daher bieten Terminologien, die mehr auf individuelle Relationen zwischen Begriffen bauen, eine größere Flexibilität. Sie lassen z. B. zu, dass ein Begriff mehrere Oberbegriffe hat oder dass weitere assoziative Beziehungen wie "Ist_Teil_Von", "Beeinflusst" oder "Wird_Verkauft_Mit" Begriffe miteinander verbinden. So bleibt die Organisation der Terminologie flexibel, sie kann die Ziele und Bedürfnisse einzelner Benutzergruppen einbeziehen und berücksichtigt besser die Unterschiede zwischen Sprachen und Ländern.

Suchen und Finden im Internet

Für Wissensmitarbeiter wie es Redakteure und Übersetzer sind, ist es besonders wichtig, schnell und zuverlässig gute Informationen zu finden. Kaum jemand startet heute ohne Google-Suche. In vielen Fällen erhält man mit entsprechenden Suchtechniken die benötigte Antwort oder Übersetzung in einer akzeptablen Zeit. Es bleibt jedoch die Frage, ob Google eventuell noch bessere Informationen vorenthalten hat bzw. wo man sonst suchen könnte, wenn die Ergebnisse nicht zufriedenstellend sind.

Google hat als Mainstream-Suchmaschine einen großen Einfluss auf das, was Menschen an Informationen erhalten und verwendet inzwischen mit der RankBrain-Komponente Verfahren der künstlichen Intelligenz. Besonders wenn man nach innovativen oder sensiblen Informationen sucht, ist es daher ratsam, nach weiteren Quellen zu suchen.

Google selbst bietet neben seinem standardmäßigen Browser spezielle Suchmaschinen an. Eine hat sich auf akademische Publikationen und Fachartikel spezialisiert und ist sehr nützlich, wenn man wissenschaftliche Literatur sucht: Google Scholar (scholar.google.de, scholar.google.com). Ergänzend kommt dazu die spezielle Suche nach Büchern mit Google Books (books.google.de, books.google.com). Hier findet man neben Büchern, die man kommerziell erwerben kann, eine Vielzahl von eingescannten Büchern aus öffentlichen Bibliotheken, bei denen es sich oft um ältere Publikationen handelt. Ein Teil dieser Bücher lässt sich als PDF-Datei herunterladen.

Ein Dienst wie Slideshare (de.slideshare.net) gehört zu der Kategorie der Bookmarking-Websites und bietet Links zu Publikationen, Präsentationen und weiteren Dokumenten zu einem gewünschten Thema.

Es gibt mehrere Tausend Suchmaschinen auf der Welt, welche teils die durch Google indizierten Seiten, teils eigene Indizierungsverfahren verwenden. Besonders interessant sind natürlich dabei die Maschinen, die selbst das Internet nach Content durchforsten. Eine dieser Suchmaschinen ist beispielsweise Qwant. Qwant ist interessant, weil es eine in Europa und mit EU-Unterstützung entwickelte Suchmaschine ist (www.qwant.com).

Einige dieser alternativen Suchmaschinen bieten anonymes Surfen, d. h., dass die Suche und die Suchergebnisse nicht archiviert und für Dritte nicht zugänglich sind. Eine der am weitesten verbreiteten ist DuckDuckGo (www.duckduckgo.com).

Wer sich auf bestimmte Themen oder Länder spezialisiert, kann Suchmaschinen verwenden, die sich explizit damit befassen. Es gibt Suchmaschinen, die Informationen zu spezifischen Ländern oder Regionen indizieren, während sich andere mit Themen wie Programmieren oder Wirtschaft befassen. So ergibt die Suche nach einem medizinischen Thema bei der Suchmaschine PubMed (www.ncbi.nlm.nih.gov/pubmed) interessante alternative Informationen zu Google.
Einige Suchmaschinen haben sich auf die Suche nach Bildern spezialisiert. Eine der bekanntesten heißt Flickr (www.flickr.com). Weitere sind die bekannten Instagram- und Pinterest-Seiten (www.instagram.com bzw. www.pinterest.de).

Eine weitere Kategorie von Suchmaschinen bilden die Metasuchmaschinen, d. h. dass sie den gesuchten Ausdruck an eine Reihe von Suchmaschinen schicken und die Ergebnisse in einer gemeinsamen Oberfläche darstellen. Es gibt globale Metasuchmaschinen wie Search (www.search.com), oder dogpile (www.dogpile.com), aber auch welche, die in Deutschland, wie MetaGer (www.metager.de), oder in der Schweiz, wie eTools (www.etools.ch), entwickelt worden sind.

Ferner gibt es solche, die man als semantische Suchmaschinen benennt. Es sind Suchmaschinen, die nicht exakt nach einem Ausdruck, sondern eher nach einer Bedeutung suchen. Dafür benutzen sie Quellen, die semantisch aufbereitet worden sind, d. h. in welchen weiterführende Informationen wie Quellen, Relationen zu anderen Begriffen, Sachgebiete und noch einiges mehr hinterlegt sind. Leider sind manche dieser Maschinen auf Eingaben in Englisch beschränkt. Einige der Suchmaschinen sind: Swoogle (http://swoogle.umbc.edu/2006/), WolframAlpha (www.wolframalpha.com) oder Semager in deutscher Sprache (www.semager.de).

Internetbasierte Wissensdatenbanken wie DBpedia (http://wiki.dbpedia.org/) sind weitere nützliche Informationsquellen. Das Wissen von DBpedia basiert auf Wikipedia und auf weiteren Wissensbeständen über Linked Open Data. DBpedia lässt sich sogar mithilfe eines Chatbots durchsuchen. Man kann eine Frage eingeben und wird dann zu passenden Beiträgen weitergeleitet.

Für technisch versierte Internauten besteht noch die Möglichkeit, direkt auf Ontologien zuzugreifen. Unter Ontologien versteht man maschinenlesbare Wissensbestände über ein Thema ("Domain"), die man mithilfe von Tools wie das Open Source Programm Protégé (https://protege.stanford.edu/) durchsuchen kann. Da Ontologien XML-basierte Dateiformate wie OWL und RDF verwenden, kann eine gezielte Suche in Google nach Dateien in diesem Format (mit dem Ausdruck "filetype: OWL" bzw. RDF) zu Ontologien führen, die man notfalls in einem Texteditor öffnen und "lesen" kann.

Schließlich lässt sich auch über YouTube oder über soziale Netze nach Informationen suchen. So kann man über Twitter bestimmte Stichwörter eingeben und erhält Links zu entsprechenden Artikeln, Produkten oder Präsentationen.

Sicherlich haben wir hier nicht alle Möglichkeiten geschildert und dargestellt, um nach alternativen Informationsquellen zu Google im Internet zu suchen, aber diese Tipps sind ein guter erster Schritt. Wie immer bleibt am Ende die Auswahl und Entscheidung über die bessere Information beim Menschen, und das ist auch gut so.

Bildquelle: http://winfwiki.wi-fom.de/index.php/Analyse_der_Suchmaschine_Wolfram_Alpha; Stand: 19.09.2017

Terminologiequalität aufrechterhalten

Wie oft wird über die Bäume aber nicht über den Wald nachgedacht? Mit der Terminologie ist es nicht anders. Im Terminologieleitfaden stehen gute und sinnvolle Regeln für die Schreibweise deutscher Komposita, für das Erstellen von Definitionen oder für die Festle­gung von Verwendungsattributen. Was jedoch oft fehlt, sind Regeln und Methoden für die Sicherung der Qualität und Konsistenz des Terminologiebestands insgesamt.

In der Aufbauphase einer Firmenterminologie spielen sprachliche oder technische Kriterien für die Erfassung einzelner Begriffe oder Be­nennungen die Hauptrolle. Nach einer Weile treten sie allerdings in den Hintergrund, so­bald die Hauptbeteiligten an der Terminolo­giearbeit die Basisregeln verinnerlicht haben. Mit dem Anwachsen des Terminologiebe­stands und mit der Erweiterung der Nutzer­gruppen treten dafür andere ganzheitliche Problempunkte in den Vordergrund, die mehr die innere Konsistenz der Daten, die konkre­ten Verwendungssituationen und die Zielgrup­pengerechtigkeit der Terminologie betreffen. Im Einzelnen geht es um folgende Aspekte:

  1. Erkennung von Synonymen, Homonymen und von neuen bzw. veralteten Bedeutungen.
  2. Sicherstellung der Benennungskonsistenz. 3. Multilingualer Abgleich der Begriffe und Begriffssysteme.
  3. Einheitliche Handhabung, Vollständigkeit und Widerspruchslosigkeit der verschie­denen Datenfelder.
  4. Zielgruppengerechte und zweckmäßige Metadaten und Ansichten.

Wenn eine gewisse kritische Masse an Be­griffen und Benennungen erreicht ist, wächst gleichzeitig die Chance, dass dabei unerkannt Synonyme oder Homonyme in die Terminolo­giedatenbank aufgenommen wurden. Leicht abweichende Schreibvarianten oder morpho­logische Varianten wie "Dichtungsring" und "Dichtring" sind noch relativ leicht zu erkennen. Schwieriger wird es, wenn es sich um komplett unterschiedliche Benennungen handelt, die man allerdings mithilfe öffentlich zugänglicher Wörterbücher noch identifizieren kann. Und ganz schwierig ist es letztendlich, wenn nur Kenntnisse des Unternehmensjargons oder detailliertes Produktwissen das Erkennen ei­nes Synonyms ermöglichen. Woher soll z. B. ein Terminologe wissen, dass für einen bestimmten Automobilhersteller die Benennungen "Erste- Hilfe-Set" und "Verbandtasche" synonym sind?

In ähnlicher Weise ist das Aufspüren von Homo-nymen nicht immer einfach. Das Grundprinzip begriffsorientierter Terminologien besteht darin, dass ein Begriff eine Grundbedeutung darstellt. Durch den regelmäßigen Einsatz und die Er­weiterung eines Terminologiebestands kommt es aber immer wieder vor, dass der gedachte Begriff eigentlich zwei oder mehr Bedeutungen abdeckt. "Aufnahme" wird auf einmal nicht mehr ausschließlich für das aufnehmende Ma­schinenteil eines Werkstücks, sondern auch im Sinne eines Aufzeichungsvorgangs verwendet. In solchen Situationen soll der Terminologie­kreis die Begriffe trennen und nach Möglichkeit Alternativbenennungen für einen der getrenn­ten Begriffe suchen. Diese Entwicklung beein­flusst ebenfalls die Verknüpfung zwischen Be­griffen, die regelmäßig überprüft werden muss.

Es gibt leider kein Patentrezept für das au­tomatische Aufdecken unerkannter Syno­nyme bzw. Homonyme. Die Untersuchung vorhandener Datenbestände aus Redakti­onssystemen oder Translation-Memorys kann manchmal mithilfe einer Konsistenzanalyse deutscher Sätze bzw. deren Übersetzungen Hinweise liefern. Ebenfalls kann es nützlich sein, Benennungslisten nach deren Endun­gen zu sortieren ("Schlepperventil" und "Trak­torventil" haben dieselbe Endung) oder nach Homonymen in Fremdsprachen zu suchen (EN: "brush" für DE: "Pinsel" und "Bürste"). Verwendungsstatistiken können veraltete Be­nennungen oder Begriffe ausfindig machen, besonders wenn sie zeitraumbezogen sind.

Mit der wachsenden Anzahl an Benennungen im Deutschen wie in den Fremdsprachen steigt das Risiko von sprachlichen und semantischen Inkonsistenzen. Während beispielsweise in einer Terminologie Komposita die Entfernung immer mit "Abstand" ("Abstandring") angeben, taucht auf einmal die Benennung "Distanzsen­sor" auf. Ähnliches gilt für die Fremdsprachen.

Bei mehrsprachigen Begriffssystemen ist es nicht außergewöhnlich, dass eine Sprache den Begriff etwas breiter oder enger auslegt. Manche Sprachen setzen für die Vermittlung von Informatio­nen mehr auf den Kontext während andere mehr in die einzelnen Begriffe packen. So kann man aus einem einzelnen chinesischen Wort nicht erkennen, ob es sich um Einzahl oder Mehrzahl handelt. In vielen Fällen enthalten Terminologien keine Information darüber, worin die Begriffsun­terschiede liegen, was in manchen Situationen eine entscheidende Rolle spielen kann.

Viele Terminologiebestände behandeln Attri­bute und Metadaten stiefmütterlich, weil Zeit und Budget fehlen, um sie ordentlich zu befül­len und zu pflegen. Wichtig sind in erster Linie Aspekte, die den korrekten Einsatz der Ter­minologie unterstützen. Wenn beispielsweise Synonyme für einen Begriff vorkommen, dann braucht der Nutzer Verwendungsattribute, um entscheiden zu können, welche Variante er ein­setzen soll. Auch die Widerspruchslosigkeit der Attribute ist wichtig. Eine Benennung darf nicht gleichzeitig den Status "nicht geprüft" und die Verwendung "erlaubt" haben. Ferner gehört zur Datenpflege, dass dieselben Informationsty­pen einheitlich behandelt und richtig zugeord­net werden. Ein weiterer Punkt ist das Prüfen der Attribute auf formale Fehler (z. B. abwei­chende Schreibweisen oder Varianten wie "Ver­boten", "verboten", "forbidden", "deprecated"), die durch den Import von Listen neuer Termini in eine Datenbank vorkommen können.

Schließlich soll die Qualitätskontrolle sicher­stellen, dass die Metadaten Informationen be­rücksichtigen, die für neue Nutzergruppen rele­vant sind. Mit dem Erfolg und der Verbreitung der Terminologiearbeit kommen neue Anwen­der hinzu, die eigene Anforderungen an die Ter­minologie haben und sie für bestimmte Zwecke einsetzen möchten, etwa für den Vertrieb oder für den technischen Support. Da diese Infor­mationen in der ersten Aufbauphase einer Fir­menterminologie nicht vorhanden waren, muss man sie im Nachhinein einpflegen. Das kann auch dazu führen, dass neue Attributfelder be­nötigt werden. Weil mit der Zeit die Anzahl der Sprachen und Informationen in einem Termino­logiebestand überhand nehmen können, ist es gleichzeitig empfehlenswert zu überlegen, ob alle Nutzer wirklich alle Informationen sehen müssen. Daraus können Gruppenansichten entstehen, eine Funktion, die aber nicht alle Terminologieverwaltungssysteme anbieten.

Sehr hilfreich für die Gesamtpflege eines Terminologiebestands ist die Möglichkeit, die Daten nach anderen Applikationen wie Excel zu exportieren, um mithilfe von Funktionen, Makros und Filtern Problemfälle zu entde­cken und zu korrigieren. Nur wenige Termino­logieverwaltungssysteme, wie das von D.O.G. entwickelte Terminologieverwaltungssystem LookUp, unterstützen den fehlerfreien Ab­gleich und Reimport aktualisierter Daten.

Wir leben in einer Zeit, in der Redakteure und Übersetzer Inhalte zunehmend wiederverwen­den. Um Zeit und Kosten zu sparen, werden nicht selten diese Inhalte unbesehen wie­derverwendet. Wenn die darin vorkommende Terminologie unzureichend geprüft ist, kann es leicht geschehen, dass die Daten fehler­hafte oder missverständliche Informationen enthalten. Man ist daher gut beraten, die hier skizzierten Aspekte der Terminologiepflege nicht dem Zufall zu überlassen und in einen Standardprozess einzubinden.

Terminologie: Was gehört dazu?

Wie oft hat man sich schon über die Auswahl der Termini gewundert, die in einer Terminologiedatenbank stehen? Warum hat der Terminologe ein Wort wie "Bedienungsanleitung" oder ein Verb wie "einschalten" aufgenommen? Ist es in Ordnung, wenn in der Firmenterminologie allgemeine technische Wörter, Produktnamen oder standardisierte Fehlermeldungen aus einer Software auftauchen?

Allgemeingültige feste Regeln gibt es nicht. Pragmatische Ziele bestimmen das, was wir als Terminologie aufnehmen. Unterschiedliche Abteilungen oder Mitarbeitergruppen haben unterschiedliche Bedürfnisse nach Terminologie und werden sich für unterschiedliche Termini oder Typen von Termini entscheiden. Je mehr Benutzergruppen involviert sind, desto größer wird die Vielfalt an Termini sein, was ganz neue Herausforderungen an das Terminologiemanagement stellt. Ziele bestimmen nicht nur die Terminologieauswahl, sondern die Metadaten (Attribute, Einsatz- und Verwaltungsinformationen) sowie die Tools, die für die Terminologieverwendung nötig sind. Last but not least bestimmen die Ziele die Budgets und die Ressourcen.

Heißt es nun, dass es wie im "Wilden Westen" zugehen darf? Nein. Die Vielfalt will geordnet sein, sonst findet sich im Dschungel von Informationen, Datenbeständen und Supportsystemen jeglicher Art niemand mehr zurecht. Man braucht also ein Konzept, damit zum einen nicht jeder seine eigene Terminologie separat aufbaut und zum anderen die Benutzer einer gemeinsamen Terminologie nicht überfordert sind. Sie sollen nicht mit einer Unmenge an terminologischen Informationen und Termini konfrontiert werden, die sie teilweise nicht benutzen und die sie mehr verwirren als unterstützen.

Ein technischer Redakteur konzentriert sich vor allem auf die Termini, die für die normgerechte Beschreibung der Bedienung eines Geräts oder einer Software wichtig sind. Der Übersetzer wird zwar weitgehend ähnliche Termini aufnehmen wollen, aber auch solche, die eventuell schwer zu übersetzen sind, in seiner Sprache mehrere Bedeutungen oder produkt- bzw. kontextabhängige Übersetzungsvarianten haben.

Der Produktentwickler wird Termini vorziehen, die für die Umsetzung seiner Entwicklungsaufgaben relevant sind, etwa die in der Benutzeroberfläche vorkommenden Strings oder die Teilebezeichnungen, die für die Konstruktion einer Maschine über den zentralen Einkauf zu bestellen sind.

Der Vertrieb interessiert sich dagegen für Termini, die ihm helfen, seine Kunden zu erreichen. Solche Termini sind nicht unbedingt identisch mit den Termini, die das Unternehmen für die Bezeichnung eigener Produkte und Dienstleistungen verwendet.

Bei der Auswahl der Benennungen stellt sich zuerst die Frage, wie umfangreich die Terminologiesammlung werden soll. Je mehr Begriffe und Benennungen gesammelt werden, desto größer wird der Verwaltungs- und Pflegeaufwand. Auch beim Einsatz der Termini - etwa durch Qualitätssicherungsprogramme für Autoren oder Übersetzer – entsteht Arbeit, denn die Anzahl der Fehlermeldungen, die bearbeitet werden müssen, steigt. Es empfiehlt sich also in der Regel, bei der Auswahl von Termini relativ restriktiv vorzugehen.

Welche Benennungen kommen infrage? Folgende Hinweise haben sich bewährt:

  • Richtige komplexe Fachbegriffe sind meistens als Terminologiekandidaten unumstritten.
  • Schwieriger wird es bei relativ allgemeinen Fachbegriffen, die zum allgemeinen Wortschatz eines Benutzers gehören sollten, etwa "Manometer" bei einer technisch vorgebildeten Benutzergruppe. Die Entscheidung, den Terminus aufzunehmen, beeinflussen Aspekte wie die Häufigkeit des Begriffs in der Dokumentation bzw. im Produktangebot des Unternehmens, die Möglichkeit von Missverständnissen und Fehlbedienung oder auch potenzielle Übersetzungsfehler in bestimmten Sprachen (z. B. bei kontextabhängigen Übersetzungen).
  • Auch einige allgemeine Wörter können berechtigterweise als Termini gelten. Dazu gehören zuerst einmal häufig vorkommende Wörter wie "Abschnitt", "Abbildung" oder "Montage", für die es oft in Deutsch oder in weiteren Sprachen mehrere Alternativen gibt, die in der Dokumentation eine wichtige Rolle spielen. Da Dokumentationen heute häufig aus Redaktionssystemen oder mithilfe von Translation-Memory-Systemen erzeugt werden, möchte man damit sicherstellen, dass über alle Module oder Übersetzungssegmente hinweg eine einzige Variante verwendet wird.
  • Bei Softwarestrings, die oft in mehreren Sprachen benötigt werden, kommen häufig allgemeine Wörter wie "Beenden" vor, die in Software und Dokumentation einheitlich verwendet werden sollen.
  • Ferner kommen Wörter infrage, die eine legale Bedeutung haben. Beispiele: "Gefahr" oder "Hinweis". Für diese Wörter müssen ganz bestimmte Übersetzungen stehen.
  • Produkt- und Firmennamen, Abteilungsbezeichnungen, Titel und ähnliche offizielle Bezeichnungen können als Termini aufgenommen werden.

Was die Worttypen anbelangt, machen Substantive den Hauptteil von Terminologien aus, aber nichts spricht dagegen, dass andere Worttypen vorkommen: Adverbien ("maschinenseitig"), Adjektive ("bestätigt/unbestätigt") aber auch Abkürzungen und Akronyme (Abb., SPS) sowie Phrasen ("An Fensterbreite anpassen"). Besonders in Softwareterminologien kommen Phrasen häufig vor, und es ist daher nicht immer leicht zu entscheiden, welche Phrasen zur Terminologie gehören und welche als Segment in einem Translation- Memory (TM) aufgenommen werden sollen. Als Regel ließe sich hier Folgendes anwenden: Strings der Benutzeroberfläche, sofern sie keine kompletten Sätze sind, gelten als Terminologie, während komplette Sätze sowie Softwaremeldungen als Segmente in einem TM zu speichern sind.

Wie lassen sich die vielfältigen Benennungen für den Redaktions- und Übersetzungsalltag organisieren? Unumstritten ist heute, dass professionelle Terminologiedatenbanken begriffsorientiert sind. Zuerst steht der Begriff als abstraktes Konzept, dann alle möglichen Benennungen, die sich darauf beziehen, alle nach Sprachen zusammengefasst.

Sind einmal alle Begriffe und Benennungen erfasst, liegt die nächste Herausforderung darin, dem Benutzer nur die Informationen anzubieten, die er für seine Arbeit benötigt. Der Verwaltungsmitarbeiter, der Daten in SAP eingibt, muss nicht unbedingt wissen, wie viele Synonyme es für ein bestimmtes Produkt gibt, während diese Information für den Supportmitarbeiter, der ständig Kontakt zu Kunden hat, sehr wichtig sein kann. Abhängig von typischen Nutzungsszenarios ermöglichen Attribute wie Verwendung (erlaubt/ verboten), Publikationstyp (technische Dokumentation/Website/Soziale Medien), Abteilung oder Prozess (Export/Beschaffung) das Herausfiltern der benötigten Informationen und Benennungen. Fortgeschrittene Terminologiemanagementsysteme lassen die Bildung von Nutzergruppen mit individuellen Ansichten zu, sodass jeder die Terminologie sieht, die er braucht. Es ist im Grunde ein ähnliches Verfahren wie die Produktion individueller Dokumentationen aus einem Redaktionssystem.

Nur wenn alle von der Terminologie profitieren, wird sie sich auf die Dauer als ganz normaler Unterstützungsprozess im Unternehmen etablieren können. Bereits im frühen Stadium lohnt es sich, Tools und Methoden auszuwählen, die der Vielfalt der Nutzerprofile und Bedürfnisse gerecht werden.

Nutzerorientierte Terminologie

"Sie müssen nur den Nippel durch die Lasche zieh'n", wer kennt diesen Satz aus einem Lied von Mike Krüger nicht? Er illustriert, wie Kommunikation außerhalb des Unternehmens eigenen Regeln unterworfen ist. Jeder benutzt seine eigene Sprache und beherrscht nicht immer die fachspezifische Sprache, die ein Unternehmen festgelegt hat. Ein Besuch von Diskussionsforen für die Reparatur von Autos oder für den Kauf von mobilen Geräten macht deutlich, wie vielfältig und kreativ die deutsche Sprache sein kann. Von "Drehknopf" für "Potentiometer" bis "Dingens" für "Durchflussregler" scheint die Fantasie der Nutzer keine Grenzen zu kennen. Kann es sich ein Unternehmen, dessen Vertrieb oder Technischer Support leisten, diese Sprache zu ignorieren?

Um Alternativbenennungen zu sammeln, könnte man theoretisch jedes einzelne Fachwort in einem Synonymwörterbuch nachschlagen. Das gibt aber keinen Hinweis über ihre tatsächliche Verwendung durch einzelne Nutzergruppen. Die Herausforderung liegt darin, die Sprache des Marktes zu identifizieren und zu erfassen, um sie mit den eigenen Benennungen für Produkte und Leistungen zu verbinden. Und dies gleichzeitig in mehreren Sprachen. Wie lässt sich das mit einem vertretbaren Aufwand durchführen? Welche Quellen gibt es dazu? Was ist mit den Fremdsprachen? Reicht dafür eine einfache Übersetzung?

Die Lösungen sehen sicherlich von Fall zu Fall unterschiedlich aus. Im Grunde besteht aber die Vorgehensweise aus folgenden Schritten: Zuallererst grenzt man die Zielgruppen ein, die man erreichen möchte. Das ist die Basis für relevante Informationsquellen. Man extrahiert dann aus diesen Quellen Synonyme zu firmeneigenen Benennungen. Als letzten Schritt reichert man diese Alternativbenennungen mit semantischen und organisatorischen Informationen an. Dadurch können bestimmte Prozesse oder bestimmte Applikationen sie gezielt benutzen.

Firmeninterne Quellen wie Berichte vom Technischen Support, Korrespondenz mit Kunden, Anfragen oder Ausschreibungsunterlagen liefern bereits einiges an Material für die Extraktionsarbeit. Ferner kommen diverse Publikationen, Kataloge, Websites, Fachartikel oder Fachbücher von Verbänden, Hochschulen und anerkannten Experten dazu. Amtliche Quellen wie Normen, Richtlinien, Gesetze eignen sich ebenfalls für diesen Zweck. Auch Wettbewerber setzen u. a. Alternativbenennungen ein, die bei der eigenen Kommunikation mit Externen vorkommen können. Schließlich kommt ein Teil der unzähligen Blogs, Facebook-Beiträge oder anderen relevanten Foren und Diskussionsgruppen infrage.

Es wäre eine Sisyphusarbeit, alle diese Quellen ausführlich zu untersuchen und auszuwerten. Sie sind auch nicht gleich relevant. Für eine systematische Suche nach Synonymen eignet sich das Bootstrapping-Verfahren. Es nutzt die Tatsache, dass Wörter nie allein erscheinen, sondern immer in einen Kontext eingebettet sind. Das Prinzip besteht darin, eine kleine Menge an Stichwörtern festzulegen, die sozusagen als Köder oder Initialzündung fungieren, um Texte und danach Kontexte zu identifizieren, die sich mit einem bestimmten Thema befassen. Diese Köder (englische Fachterminologie: "seeds") gibt man in Kombination von 2-3 Wörtern als Suchbegriffe in einer Suchmaschine bzw. Suchapplikation für Dokumente wie dtSearch (www.dtsearch.com) ein. Beispiel: Eine Suche nach "Transformator – Wicklung – Magnetfeld", bringt Kontexte hervor, die auch Synonyme zu "Transformator" wie "Trafo" und "Stromwandler" enthalten. Das Bootstrapping-Verfahren erfolgt meistens iterativ, d. h. die in einem ersten Lauf extrahierten Synonyme dienen dazu, weitere Synonyme oder neue Begriffe zu identifizieren.

Wer auf regelmäßiger Basis die Nutzersprache extrahieren möchte, kann das Verfahren teilweise automatisieren. Dies ermöglichen einige wenige Tools wie das kostenlose BootCaT (http://bootcat.sslmit.unibo.it/) und das professionelle kostenpflichtige WebBootCaT (www.sketchengine.co.uk). Sie liefern bereinigte relevante Korpora und Listen von Termkandidaten mit Kontext und Häufigkeitsangaben, die evaluiert werden müssen.

Hat man als Erstes eine Liste von Alternativbenennungen in Deutsch gefunden, so geht es dann um das Festlegen von Synonymen in weiteren Sprachen. Man kann nicht davon ausgehen, dass es ausreichen würde, diese deutschen Wörter zu übersetzen. Erstens sind Fremdsprachen kein Spiegelbild der deutschen Sprache (ein deutsches Wort kann mehrere Entsprechungen in der Fremdsprache haben und umgekehrt). Und zweitens gibt eine Übersetzung keine Auskunft darüber, wie intensiv Benutzer sie im Ausland tatsächlich verwenden. Man müsste also theoretisch in allen Sprachen genauso vorgehen wie in der deutschen Sprache, was aus Kostengründen nicht immer umsetzbar ist. Übersetzungsdienstleister oder Auslandsniederlassungen können trotzdem helfen, für einige Schlüsselbegriffe die geläufigen Synonyme in ihren Sprachen zu ermitteln.

Die identifizierten Synonyme werden in den zentralen Terminologiebestand mit den firmeneigenen Benennungen in gemeinsamen Begriffen zusammengefasst. Um sie richtig einzusetzen, sind entsprechende Verwendungsattribute notwendig, die die Situationen klar abgrenzen, in denen sie anstelle der offiziellen Firmenterminologie zum Einsatz kommen. Das ist u. a. für Qualitätssicherungsprogramme für Dokumentationen oder Übersetzungen wichtig. Es können Attribute wie die Nutzergruppe (Unternehmen, Kunde, Behörde oder Lieferant) sein.

Die neu gewonnenen Termini kommen überall in der Kommunikation mit Nutzern zum Einsatz:

  • In der Technischen Dokumentation können sie ergänzend zu den eigenen Benennungen für die Suche nach Informationen im Stichwortverzeichnis erscheinen.
  • Sie können helfen, die Webpräsenz des Unternehmens mehrsprachig zu optimieren. Die Aufnahme von alternativen Benennungen in Metadaten, in semantischen Feldern trägt zu besseren Trefferquoten bei der Internetsuche bei.
  • Die Arbeit des Technischen Supports profitiert vom Einsatz von nutzerorientierten Benennungen, da Kunden sich bei Fragen in der Regel nicht immer an der Firmenterminologie orientieren, sondern ihre eigene Sprache einsetzen.
  • Als Abfallprodukt der Extraktion können Zusammenhänge zwischen Begriffen gewonnen werden. Damit kann man Produkte bzw. Dienstleistungen bündeln. Das lässt sich mithilfe von Ontologien bewerkstelligen. Beispiel: Wenn aus dem Bootstrapping-Verfahren ein Zusammenhang zwischen "Ventil", "Steuerung" und "Software" hervorgeht, erhält der Nutzer entsprechende Paketangebote bei seiner Suche nach einem dieser Begriffe im Internet.

Die Terminologie von morgen kann es sich nicht leisten, die individuellen Sprachen der unterschiedlichen Nutzergruppen zu ignorieren. Unternehmen brauchen ein flexibles terminologisches Instrument, mit dem sie jederzeit und situationsgerecht klar kommunizieren. Das können am besten begriffsorientierte Terminologiedatenbanken, die über Attribute den Einsatz der jeweiligen Benennungen steuern. Damit steht der Informationsgewinnung und dem Informationsaustausch nichts mehr im Wege. Erfahrene Übersetzungsdienstleister können ihren Beitrag dazu leisten.

 

  • 1