print logo

Die Stimme erobert den PC - Multimodale Interfaces prägen das nächste digitale Jahrzehnt

Gunnar Sohn | 11.01.2008
Las Vegas/Berlin, 10. Januar 2008, www.ne-na.de - Bill Gates hat auf der Elektronikmesse Consumer Electronics Show (CES) http://www.cesweb.org in Las Vegas ein neues digitales Jahrzehnt beschworen. Damit bringt er seine Zuversicht auf den Punkt, dass die Digitalisierung des Alltags weiter voranschreitet und sich in vielen neuen Anwendungsmöglichkeiten widerspiegeln wird. Waren es bisher Tastatur und Maus, die die Bedienung von Geräten dominierten, werde sich das schon bald flächendeckend ändern. Dann werde die Steuerung über Bilderkennung, Berührungen und Sprache zum Alltag. Nicht zufällig hat Microsoft im vergangenen Jahr das US-Unternehmen Tellme http://www.tellme.com übernommen, einen Spezialisten für Spracherkennungssoftware. Denn mittels Tellme-Technik sollte die Spracheingabe beim Arbeiten mit Computern zur Selbstverständlichkeit werden. Unter anderem kann damit auch die Internetsuche mit Windows Mobile per Spracheingabe erfolgen. „Alle Utopien gehen seit Jahrzehnten in diese Richtung, weil damit ja auch gesagt wird, dass jeder mit der Grundausstattung seiner Menschlichkeit, dem Vermögen, seine Stimme zu erheben, zu fragen und zu antworten, mit den komplexesten Formen von Technologie umgehen könnte“, beschreibt der Medien- und Kommunikationswissenschaftler Norbert Bolz von der Technischen Universität Berlin http://www.tu-berlin.de den Siegeszug der Sprachtechnik. „Wenn Sie auf Ihr Auto zugehen und können es öffnen und starten, indem Sie es ansprechen, das lässt sich niemals überbieten“, erläutert er einen alten Traum der Zivilisation. Das Geheimnis eines guten Interface Designs sei dabei, „das Interface verschwinden zu lassen, die Leute also gar nicht mehr spüren lassen, dass sie es mit Technik zu tun haben und das kann man letztlich nur mit einem einzigen Medium erreichen – nämlich im Medium der Stimme.“



In der Praxis verzeichnet die Branche eine deutlich gestiegene Nachfrage nach natürlich-sprachlichen Nutzerschnittstellen. Die Tellme-Akquisition war nach Ansicht vieler Experten eng verzahnt mit den Spracherkennungsfeatures des Betriebssystems Vista. „Die integrierte Sprachsteuerung im Microsoft Exchange Server und der aggressive Einstieg in die mobile Endgerätewelt sind zentrale Puzzlesteine für die Zukunftsstrategie von Microsoft. Der Gates-Konzern will nicht nur sein Betriebssystem-Monopol bei Computern verteidigen, sondern bemüht sich um die Vorherrschaft im Internet und im Markt für Telekommunikation“, prognostiziert der Berliner Sprachdialogexperte Lupo Pape, Geschäftsführer SemanticEdge http://www.semanticedge.de.



Gates präsentierte in Las Vergas den bereits im letzten Frühjahr vorgestellten und per Berührung steuerbaren Surface-PC, einen Tischcomputer. Damit führte vor, wie man diesen zum Beispiel dazu nutzen kann, selber ein Snowboard zu gestalten und die Daten über ein mobiles Gerät zu übertragen. Außerdem stellte er einen mobilen Navigator vor, der nicht nur auf geografische Daten zugreift, sondern auch Informationen über Sehenswürdigkeiten oder Einkaufsmöglichkeiten mitliefert. „Die natürlich-sprachlichen Interfaces werden immer intelligenter, nutzerfreundlicher und werden um eine grafisches Ebene ergänzt. Multimodale Userinterfaces werden schon bald unser Leben bereichern und die Nutzung vieler Anwendungen und Geräte deutlich erleichtern“, bestätigt Pape. Microsoft und auch Google seien dabei wichtige Treiber der Entwicklung. „Beide widmen dem Thema Spracherkennung viel Aufmerksamkeit und haben eine klare Produktstrategie, die es vielen anderen Anbietern ermöglicht, in dieser Kerntechnologie des 21. Jahrhunderts Fuß zu fassen.“ Am Rande der CES zeichnete sich auch ein Trend in der Bloggerszene ab, wonach sich erste Blogger auf die Vorteile so genannter Voice-Blogging-Software verlassen, ihre Einträge in ihr Handy diktieren. Die Aufzeichnungen werden automatisch zu einem Text konvertiert auf der entsprechenden Webseite veröffentlicht.



Die Möglichkeiten der Spracheingabe machen sich auch immer mehr Automobilhersteller zunutze. Bei Volkswagen http://www.volkswagen.de erklärt eine sprechende Assistentin namens Carla, eine digitale und multimediale Betriebsanleitung, das Radionavigationssystem. Unterstützt durch animierte Illustrationen ist Carla in der Lage, in einem interaktiven Dialog mit dem Nutzer die einzelnen Bedienungselemente zu erläutern. In Japan gehen die Autobauer bereits einen Schritt weiter, berichtet Die Welt http://www.welt.de: „Schon heute sind in vielen japanischen Navigationssystemen virtuelle Sekretärinnen programmiert, die den Fahrer morgens begrüßen, ihm einen schönen Tag wünschen und erst nach einer höflichen Verbeugung den Bildschirm für die Karte frei machen", wird der deutsche Designer Tobias Nagel zitiert. Er untersucht für Nissan http://www.nissan.de in Tokio die künftige Techniktrends im Auto.



Redaktion
medienbüro.sohn
Ettighoffer Straße 26 A
53123 Bonn
Tel: 0228 – 620 44 74
Fax: 0228 – 620 44 75
Mobil: 0177 620 44 74
medienbuero@sohn.de;
http://www.ne-na.de




Img of Gunnar Sohn
Über Gunnar Sohn

Gunnar Sohn ist Freiberufler und u.a. Wirtschaftspublizist, Buchautor, Blogger, Medienberater, Moderator und Kolumnist.