print logo

Sprachcomputer als Stimmungskanone?

Möglichkeiten und Grenzen der Maschine - Mensch - Kommunikation
marketing-BÖRSE | 23.05.2006
Hamburg/Düsseldorf/Bonn, www.ne-na.de - Monotone Computerstimmen beherrschen Navigationssysteme und Call Center. Forscher arbeiten nach einem Bericht der Financial Times Deutschland http://www.ftd.de daran, den redenden Rechnern ein paar Emotionen beizubringen.

„Alle sind froh, dass die Fahrt vorbei ist. Nur das Navigationssystem bleibt nüchtern: ‚Sie haben das Ziel erreicht’, leiert die Stimme aus dem Computer, als würde sie einen Standardbefehl zum Abbiegen erteilen. Sie erfüllt ihren Zweck, so wie die anderen ewig gleichen Stimmen von automatisierten Call Centern, Durchsagen oder Anrufbeantwortern: unaufgeregt, klar verständlich und meist weiblich“, so die FTD. Wissenschaftlern sei das nicht mehr genug: „Während es in den Anfangsjahren der Sprachsynthese vor allem darum ging, dass Menschen die Worte aus dem Rechner überhaupt verstehen, erforschen die Spezialisten heute, wie die künstliche Sprache menschenähnlicher gemacht werden könnte - durch Rhythmik, Satzmelodie und emotionale Färbung, aber auch durch so genannte paralinguistische Elemente wie Räuspern, und Atem holen“, berichtet die FTD.

Der Mensch soll sich im Gespräch mit den Maschinen wohler fühlen und zum Beispiel Hinweise aus dem Automaten ernster nehmen oder weniger Hemmung spüren, wenn ihm eine Computerstimme etwas verkauft. „Um die entsprechenden Regeln und Modelle zu entwickeln, arbeiten Sprachwissenschaftler interdisziplinär mit Technikern und Neurobiologen zusammen. Ihr Spezialgebiet heißt ‚Prosodie’, ein Teilgebiet der Linguistik, das sich mit sprachlichen Eigenschaften wie Intonation, Akzent, Lautdauer und Sprechpausen befasst“, schreibt die FTD. Stand der Technik sei derzeit die so genannte konkatenative Sprachsynthese: „Ein Profisprecher liefert die Ausgangsstimme, Wörter und Satzteile werden aufgezeichnet. Die Synthese-Software wählt dann die Bausteine nach Bedarf aus und spielt sie nacheinander ab“, führt die FTD weiter aus.

Die Entwicklung von synthetischen Stimmen, die frei in menschenähnlicher Anmutung Sprachausgaben liefern, wird nach Ansicht von Bernhard Steimel, Sprecher der Brancheninitiative Voice Business http://www.voiceday.de, den Markt für Sprachautomatisierung weiter vorantreiben. „Derzeit sind noch aufwendige Aufnahmen in Tonstudios notwendig um in ansprechender Qualität einen Dialog zu führen. Soll der Sprachautomat zukünftiger noch flexiblerer auf das Anliegen der Anrufer reagieren können, dann nützen auch die schablonenhaft aufgenommen Texte nichts mehr. Insofern liegen in diesem Bereich Innovations- und Kostensenkungspotenziale gleichermaßen“, sagt der Düsseldorfer Unternehmensberater Steimel.

Unbeholfenheit in künstlich erzeugten Sätzen nehmen Menschen inzwischen in Kauf - und sei es notgedrungen, weil man die Information über eine Zugverbindung eben nur vom Computer erhält. „Dass Sprachcomputer zukünftig die Emotionen des Anrufers anhand der Stimme erkennen können, ist aber eine interessante Perspektive, sofern dann auch adäquate Gesprächsstrategien eingeschlagen werden, die die Stimmung erfolgreich beeinflussen“, weiß Steimel. Ein Ergebnis aus psychologischen Tests zur Akzeptanz von Sprachcomputern bleibe sicherlich auch in Zukunft eine Konstante: „Die Maschine hat nur eine Chance, wenn Sie sich als solche auch dem Anrufer klar zu erkennen gibt. Pseudo-realistische Sprachanwendungen dürfen mit keinem Mit-Gefühl rechnen“, so das Fazit von Steimel.