Bücher  |  Webinare  |  Fachartikel  |  Kurzmeldung / Ticker  |  Verbände  |  Partner  |  Presse  |  Newsletter Kosten  |  AGB  |  Impressum

> Das Dienstleisterverzeichnisfür Marketing <

{DETAILANSICHT}: Michael Wetzel, Stuttgart
Michael Wetzel  |  19.03.2010

Konsistente Terminologie als Fundament für Text Mining

Die Qualität unstrukturierter Daten mit Autoren-Tools und Terminologiemanagement verbessern
Wie eine Veröffentlichung des Karlsruhe Institute of Technology (KIT) bereits im Jahr 2006 verlauten ließ, bestehen 85 % der Datenbankinhalte aus unstrukturierten Daten wie beispielsweise E-Mails, Webseiteninhalte oder Direktmarketing-Anschreiben (vgl.: Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten von Witte, René und Mülle, Jutta, 2006). Um aus diesen Daten wertvolle Schlüsse für Marketing- und Vertriebsstrategien in Unternehmen zu ziehen, hat sich der Bereich des Text Minings entwickelt. Bei Text Mining handelt es sich um Analyseverfahren, die unstrukturierte Texte klassifizieren und dadurch für eine schnellere Erschließung der Inhalte sorgen. Hierdurch sollen im Optimalfall Informationen generiert werden, über deren Existenz bislang noch keine Erkenntnis vorlag (vgl. Text Mining, Gesellschaft für Informatik e.V.).

Die Qualität unstrukturierter Daten mit Autoren-Tools und Terminologiemanagement verbessern

Dass dem Management linguistischer Ressourcen eine wesentliche Bedeutung bei der Konzeptfindung für Text Mining zukommt, ist nicht mehr unbekannt (vgl. Ratgeber Text Mining von Sascha Alexander, Computerwoche online vom 15.07.2008). Hierbei spielt die Tatsache, dass ein solides Fundament mittels konsistenter Inhaltserstellung die Ergebnisse von Text-Mining-Verfahren entscheidend verbessern kann, eine wichtige Rolle. Wird schon für die Erstellung von Inhalten innerhalb eines Unternehmens eine Richtlinie zur unternehmensspezifischen Corporate Language definiert und konsequent auf ihre Einhaltung geachtet, vereinfacht dies einen Textabgleich erheblich. Zwar kann mit dem Einsatz einer fehlertoleranten Suche orthographische Ungereimtheiten wie unterschiedliche Schreibweisen (Potential und Potenzial) überwunden werden, diese greift jedoch nicht, wenn Synonyme oder Produktnamen statt der eigentlichen Benennung gebraucht werden (Tempo statt Taschentuch oder Strafprozess und Gerichtsverfahren). Um eine einheitliche Verwendung von geschriebener Sprache in Unternehmen zu gewährleisten, wurden Autoren-Tools und Terminologie-Werkzeuge entwickelt. Sie unterstützen Autoren dank im Vorfeld definierter Vorzugsbennenungen oder stilistischer Regeln dabei, immer die Corporate Language zu verwenden. Ist dieser erste Schritt getan, liefern die im Unternehmen erstellten Texte eine wesentlich bessere Vorlage für Text Mining und somit weitaus präzisere Entscheidungsgrundlagen für Aktionen, die mittels Text Mining vorbereitet werden.

Ein erwünschter Nebeneffekt: Verbesserung der Kundenkommunikation

Ganz nebenbei ergibt sich neben der Datenaufbereitung noch ein weiterer Vorteil aufgrund der Nutzung von Autoren-Tools und Terminologie-Werkzeugen: Die Kundenkommunikation verbessert sich nachhaltig. Muss sich ein Interessent oder Bestandskunde nicht mit mehreren Benennungen für ein und dasselbe Gerät (Hebevorrichtung und Hubanlage) auseinandersetzen, sinkt die Gefahr, dass er das entsprechende Bedienungsanleitung oder Produkt als qualitativ minderwertig und unseriös betrachtet oder die Handhabung missversteht, was wiederum Anwenderfehlern oder Unfällen vorbeugt.

Alles in allem lässt sich sagen, dass der Einsatz von Authoring- und Terminologiemanagement gründlicher Vorbereitung bedarf und sorgfältig geplant werden muss – der Nutzen, der sich im Anschluss daran langfristig erzielen lässt, macht die im Vorfeld investierte Zeit mit Sicherheit wett.


Quellen: Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten (http://digbib.ubka.uni-karlsruhe.de/volltexte/1000005161)
Text Mining, Gesellschaft für Informatik e. V. (http://www.gi-ev.de/no_cache/service/informatiklexikon/informatiklexikon-de
Ratgeber Text Mining von Sascha Alexander (http://www.computerwoche.de/software/bi-ecm/1868692/=)

> Weitere Fachartikel von Michael Wetzel

> Neueste Fachartikel

Kommentare
NEUERSCHEINUNG,  | Leitfaden Online-Marketing Band 2,  | Leitfaden Online Marketing Band 2. Mit 1120 Seiten und 166 Autoren das umfangreichste deutschsprachige Werk zum Thema. Subskriptionspreis 39,95 EUR. Partner:,  | Absatzwirtschaft, Düsseldorf | Zeitschrift für Marketing HORIZONT  - Zeitung für Marketing, Werbung und Medien, Frankfurt am Main | Horizont ist eine der beiden führenden Marketing - Fachzeitschriften Absolit Seminare, Waghäusel | Seminare zu Social Media und E-Mail-Marketing acquisa, Würzburg | Benchpark GmbH & Co. KG, Hamburg | Initiator und Betreiber des Portals Benchpark.com für Markt- und Leistungstransparenz unter 4500 Marketing- und IT-Anbietern. E-Commerce-Magazin,  | Das e-commerce magazin gibt praktische Hilfestellung bei der Einführung, bei der Integration, beim Betrieb und Weiterentwiclung von IT-Systemen BusinessVillage, Göttingen | .. Schimmel Media Verlag, Würzburg | Martina Schimmel-Schloo ist Managerin der Fachinformationsdienste Expert-Sites und Geschäftsführerin im Schimmel Media Verlag. CallCenter SCOUT, Berlin | Logomarket.de, Berlin | Auf Logomarket.de präsentieren über 350 internationale Logo Designer über 19.000 exklusive Logo Design Entwürfe zum Festpreis. CompetenceSite, Köln |