print logo

Big Data, Big Language (oder was?)

Von großen Datenmengen und ihrer Echtzeitübersetzung von Ewald Gehrmann
SDL Language Solutions | 08.08.2013
Die Bitkom und andere Meinungsbildner der IT-Branche haben Big Data zum Trendthema 2013 ausgerufen. Die Datenberge wachsen. Das wird jeder beim morgendlichen Blick ins eigene E-Mail-Postfach feststellen können. Anders als im Postfach, das sich mit einigen Tricks und Kniffen aus der Outlook-Hilfe meist schnell in den Griff bekommen lässt, stellt die digitale Informationsflut für viele Unternehmen nach wie vor eine echte Herausforderung dar. Ganz so neu ist das Thema nämlich nicht. Der Umgang mit großen Datenmengen beschäftigt Business Intelligence, Datenmanagement, Informations- und Wissensmanagement schon seit vielen Jahren.

Datenvolumen, Datenquellen, Datenproduktion

Big Data wird anhand von drei Kriterien charakterisiert: Datenvolumen, Vielzahl von Datenquellen, Geschwindigkeit der Datenproduktion. Die Geschwindigkeit mit der die Menge an digitalen Daten wächst, ist tatsächlich beeindruckend. Laut einer Schätzung von IBM werden täglich 2,5 Trillionen Bytes an Daten produziert und 90% der von Unternehmen erstellten Daten stammt aus den letzten beiden Jahren. Neu an Big Data ist nach Dr. Carsten Bange (BARC), dass nicht mehr nur strukturierte Daten, wie im klassischen Business-Intelligence-Umfeld, analysiert werden, sondern dass sich „Big Data“-Initiativen mit polystrukturierten Daten auseinandersetzen.


Zur höheren Kundenbindung
Der Treiber für „Big Data“-Projekte ist aus Unternehmenssicht natürlich ein ökonomischer. Allerdings kommt er denjenigen zugute, um derentwillen Zeit und Geld investiert wird, nämlich dem Kunden. Dr. Wolfgang Martin fügt im Strategic Bulletin „Big Data“ den bisherigen Kriterien Datenvolumen, Datenquellen, Datenproduktion eine weitere hinzu: den Verbraucher und meint damit dass die Zahl all jener, die ein Interesse an der Auswertung der Datenberge haben, ebenfalls angewachsen ist. Und nennt an erster Stelle die Steuerung von personalisierten Kampagnen im Handel und Stimmungsanalysen in den Social Media. Hieraus ergeben sich Vorteile in der Ad-hoc-Kundenkommunikation, denn „das ist der Schritt von Outbound- und Inbound-Kundenkommunikation zur Unbound-Kundenkommunikation. So schafft man eine gesteigerte Time-to-Market und eine höhere Kundenbindung bei einer vergleichsweise überschaubaren Investition.“


Klingt gut, aber war da nicht noch was?
Der Eurid-Bericht „Internationalised Domain Names – State of play 2011“ zieht die Schlussfolgerung, dass der Trend im Internet in Richtung Mehrsprachigkeit geht. Internationalisierte Domainnamen (Englisch: Internationalized Domain Names; IDN) werden hierfür in Korrelation zu lokalen Inhalten gesetzt. Das wiederum führt zu der Frage, sind Unternehmen für die „Big Language“-Herausforderung gewappnet, die zusammen mit Big Data auf sie zukommt?


Wenn Sprache zur Herausforderung wird
Tatsächlich stellen viele Unternehmen bereits fest, dass Sprache ein ernstzunehmender Wirtschaftsfaktor ist. Von Nicht-Muttersprachlern erstellte Informationen, werden von Muttersprachler nicht verstanden und müssen erst von einer Sprache in dieselbe Sprache übersetzt werden. Anfragen über Webformulare können nicht dechiffriert werden und bleiben unbeantwortet. Was Kunden über Unternehmen und Produkte twittern, bleibt unerkannt und kann im positiven Sinne nicht als Werbeeffekt genutzt und im negativen keine größeren Folgeschäden abwenden.

Big Language meistern
Dabei gibt es eine recht einfache Möglichkeit, Mitarbeiter in Sekundenschnelle mehrsprachig werden zu lassen. Zumindest auf dem Bildschirm. Mit dem Einsatz von maschineller Übersetzung können digitale Inhalte in Echtzeit zu einem Bruchteil der konventionellen Übersetzungspreise von einer Sprache in die andere transportiert werden und zumindest auf sprachlicher Seite Licht ins Big-Data-Dunkel bringen.