print logo

Ein Fundament für den Wissensaustausch

Die Verbindung von Terminologie und maschineller Übersetzung
Petra Dutz | 21.10.2013
In einer Wissensgesellschaft ist die effektive Nutzung von Informationen ein entscheidender Wettbewerbsfaktor. In Zeiten der massiven Datenproduktion (Nach einer Schätzung von IBM werden täglich 2,5 Trillionen Bytes an Daten produziert) und der Globalisierung (Laut Wikipedia stieg der weltweite, statistisch erfasste Warenexport zwischen 1960 und 2008 um mehr als das 15-fache) gewinnen die Themen schnelle Verfügbarkeit und Mehrsprachigkeit im Zusammenhang mit Wissen immer mehr an Bedeutung.

Wissensmanagement im Arbeitsalltag

In der Arbeitspraxis stehen Wissensarbeiter in internationalen Organisationen oder Projektteams vor der Aufgabe, dezentral entstandenes Wissen zu vernetzen und interdisziplinär einzusetzen. Auf diese Weise wird Wissen zur strategischen Ressource, die Wettbewerbsvorteile schafft. Wenn dezentrales, mehrsprachiges Wissen aufeinander trifft, entstehen jedoch oft Einstiegshürden, die den Wissenstransfer unnötig in die Länge ziehen oder ein produktives Miteinander stören. Hierbei sind vier Faktoren entscheidend:

Eindeutigkeit
Verständlichkeit
Datenmenge
Schnelligkeit


Werden diese Faktoren als Teil des Wissensmanagements berücksichtigt, entsteht ein solides Fundament für den Wissensaustausch auf internationaler Ebene.

Faktor Eindeutigkeit und Verständlichkeit

Mit Eindeutigkeit ist gemeint, dass nicht für ein und dieselbe Sache verschiedene Benennungen im Umlauf sind. Laut der Tekom-Studie “Successful terminology management in companies” (Straub und Schmitz, 2010) verwenden 85 Prozent der Arbeitnehmer eine andere Bezeichnung als Kollegen in anderen Abteilungen, obwohl sie von ein und derselben Sache sprechen.

Neologismen werden nicht zwangsläufig verstanden, wenn sie aus ihrem Entstehungsumfeld in andere Bereiche transportiert werden. Die Tekom-Studie “Successful terminology management in companies” (Straub und Schmitz, 2010) hat gezeigt, dass 50 % der Arbeitnehmer häufig Benennungen rund um das Produkt, das sie dokumentieren, nicht verstehen.

Lösung: Terminologiearbeit

Mit Terminologiearbeit ist die Planung, Erarbeitung, Bearbeitung, Verarbeitung und Verbreitung eines Fachwortschatzes in einer oder mehreren Sprachen gemeint. Dazu werden relevante Benennungen identifiziert, bestimmt, gesammelt und in Form von Terminologiedatenbanken, Glossaren, Wortlisten oder Wörterbüchern zur Verfügung gestellt. Terminologiearbeit unterstützt dabei, eine gemeinsame Sprache zu finden und festzulegen, um Inkonsistenzen im Sprachgebrauch auszuschließen.

Faktor Datenmenge und Schnelligkeit

Nach einer Schätzung von IBM werden täglich 2,5 Trillionen Bytes an Daten produziert. 90 Prozent der Firmendaten sind allein in den letzten beiden Jahren entstanden. Die Größe des Datenvolumens und die Geschwindigkeit der Datenproduktion sind zwei Kriterien, die aktuell unter dem Schlagwort Big Data zusammentreffen und die für Unternehmen nach wie vor eine Herausforderung darstellen. Technische Veränderungen, wie Web 2.0, höhere Rechnerleistung und Speicherkapazitäten, haben diesen Trend zusammen mit dem Aufschwung der Schwellenländer verschärft, der zu größerer Sprachvielfalt führt.

Lösung: Maschinelle Übersetzung

Maschinelle Übersetzung (MÜ) ist eine Technologie aus dem Bereich der künstlichen Intelligenz, die in der Lage ist, in kurzer Zeit große Textmengen ohne menschliches Zutun von einer Sprache in die andere zu übersetzen. Kern der Technologie ist die MÜ-Engine, die aus einem breitgefächerten, großen, aus öffentlich zugänglichen Daten generiertem Textkorpus besteht. Dieser Textkorpus muss pro Engine in zwei Sprachen vorliegen. Über eine Analyse der Zuordnung von Ausgangs- und Zielsprache extrahiert die Software Wörterbücher und Grammatikregeln, anhand derer die Engine die maschinelle Übersetzung (MÜ) durchführt.

Maschinelle Übersetzung und Terminologie verbinden

Der aktuelle Stand der Technik erlaubt es, maschinelle Übersetzung und Terminologie zu verbinden. Auf diese Weise können alle wichtigen Faktoren, die für den Aufbau einer Wissensplattform im mehrsprachigen Umfeld vonnöten sind, vereint werden.

Mit Systemen zur maschinellen Übersetzung lassen sich große Textmengen in Sekundenschnelle von einer Sprache in die andere bringen. Natürlich darf nicht erwartet werden, dass das Ergebnis einer Übersetzung durch einen professionellen Übersetzer entspricht. Ist der Grund der Übersetzung jedoch, dass ein erstes Verstehen eines fremdsprachlichen Textes erfolgen können soll, ist maschinelle Übersetzung in puncto Zeit und Kosten unschlagbar.
Um zu verhindern, dass ein maschineller Text zur Wissensvermittlung fehlinterpretiert wird, bieten kommerzielle Systeme heutzutage die Möglichkeit der Individualisierung, die höchste Präzision auf Wortebene gewährleistet. Das bedeutet konkret: Zentrale (unternehmensspezifische) Benennungen werden vom System richtig erkannt und übersetzt. Dazu werden Wortlisten (z. B. aus einer Terminologie-Software extrahierte Terminologie-Datenbanken) in das System geladen und bei der maschinellen Übersetzung 1:1 übernommen.

Das Ergebnis ist ein Text, der fremdsprachlich erstelltes Wissen verständlich wiedergibt und so die Grundlage für eine weitere Zusammenarbeit gegebenenfalls in einer gemeinsamen Sprache bildet.