print logo

Ist Sprachsuche am Handy DER Quantensprung zu mehr Benutzerfreundlichkeit?

Visuelles Verarbeiten und Tippen ist laut Analysten der falsche Ansatz für mobile Geräte. Sprache bringt viele Vorteile.
Detlev Artelt | 15.02.2008
Tarzana, Kalifornien, USA, 15.02.2008. „Das alt Bekannte ist des neuen Feind, so auch bei den Benutzerschnittstellen auf mobilen Geräten“, bemerkt Bill Meisel, Präsident der TMA Gesellschaft und Herausgeber der Speech Strategy News. Das Design einer Tastatur hat sich seit Jahrzehnten nicht verändert trotz unzähliger Versuche, die Bedienung einfacher zu gestalten. Die 12 Tasten des Telefons haben sich bis heute ebenfalls hartnäckig gehalten. Die eigentlichen Tasten werden zwar durch Touch Screens wie auf dem iPhone zunehmend virtuell, bleiben aber Tasten.

„Die Langlebigkeit dieser Benutzerschnittstelle stellt eine große Barriere für den ständig steigenden Gebrauch mobiler Geräte dar“, fügt Meisel hinzu. Er glaubt, dass Handys in naher Zukunft durch die Nutzung von Sprache zum Durchsuchen, z.B. des Telefonbuchs oder der Navigation, viel leichter bedient werden können. Nach Ansicht des deutschen Experten und Fachbuchautor Detlev Artelt wird Sprache zum Mainstream. Sprachanwendungen werden nicht nur mobilen Geräten eine neue und viel einfachere Benutzung ermöglichen, sondern auch in Haussteuerungen und anderen Bereichen des täglichen Lebens Einzug halten. Meisel und die Non-Profit Organisation AVIOS (Applied Voice Input Output Society) werden diesen Ansatz auf der Voice Search Konferenz in San Diego vom10.-12. März vertreten (www.voicesearchconference.com).

Herausforderung für die Grafische Benutzerschnittstelle (GUI)

Die wichtigste Schnittstelle bei Mobiltelefonen ist die Grafische Benutzerschnittstelle – das GUI – das uns auch durch PCs und Web-Browsern vertraut ist. Das GUI hat sich ebenso fest verankert wie die Tastaturanordnung, sagt Meisel. Innovationen dieser Schnittstelle sollen die Handhabung für den Menschen vereinfachen. Schrittweise soll an die Neuerung herangeführt werden, indem z.B. kleine Änderungen der Menü-Elemente, der Fenster oder der Scroll-Point-Mechanismus vorgenommen werden. Einige innovative Ansätze im Bereich des Scrolling und Pointing kommen von Apple, die dem Benutzer kleiner Geräte eine einfachere Bedienung ermöglicht. Beispiele sind hier das Scroll-Rad des iPod´s und das Multi-Touch Screen des iPhone´s.

Eine Schwierigkeit das GUI-Modell auf kleinen Geräten zu verbessern ist, dass sich die Anpassungen nur teilweise auf die Probleme bei den kleinen Geräten richten: (1) kleine Bildschirmgröße; (2) die Schwierigkeit, Text einzugehen; und (3) die Schwierigkeit, sich auf das kleine Display zu konzentrieren, beispielsweise während der Fahrt mit einem Auto. Das GUI allein ist nicht der Grund für die Kunden, die vielen Sonder-Dienste der Mobiltelefone in Anspruch zu nehmen oder mobiles Marketing akzeptabel zu machen. Es löst auch nicht die fundamentalen Probleme wie die langsame und frustrierende Navigation durch multiple Möglichkeiten oder die Schwierigkeit, durch ein kleines Fenster ein Übermaß an Auswahlmöglichkeiten oder Informationen zu betrachten.




Die Alternative durch Sprachsuche

Die grundlegende Philosophie der „Voice Search Konferenz“ besagt „Sag einfach was Du willst“. Das Ergebnis wird per Sprache, oft aber auch durch Text oder Grafiken ausgegeben, die in voller Auflösung auf dem Display angezeigt werden. In einigen Fällen kann sogar eine Funktion direkt aktiviert werden, wenn der Befehl „Kamera“ lautet.
Ein zweites Element des Voice Search Paradigmas ist „Klärung durch Dialog“. Wenn die erste Anfrage des Benutzers ungenau oder zu viele Alternativen bietet, kann das System dem Benutzer eine genaue kontextbezogene Anfrage wiedergeben, um die gewünschte Information einzugrenzen. Dieser Sprachdialog ist ein natürlicher und effizienter Weg, Mehrdeutigkeiten zu vermeiden.

Das mentale Modell einer gut funktionierenden Sprachsuch-Schnittstelle ist ein „persönlicher Assistent“. Wie ein persönlicher Assistent soll die Anwendung mit der Zeit lernen, wie eine Anfrage zu verstehen ist, um damit einen Dialog so kurz wie möglich zu halten. Das Modell des persönlichen Assistenten ist eine wirkungsvolle Methode, um ein Voice User Interface für ein Gerät zu entwickeln, das immer bei dir ist, betont Meisel.

Was wäre, wenn man in einer bestimmten Situation nicht sprechen kann? Die Sprachsuche dient dem Benutzer als erste Instanz. Wenn man nicht sprechen kann, kann man den Text einfach in eine Textbox tippen. So kann man dem persönlichen Assistent schreiben, was man ihm sonst gesagt hätte.

Die Sprachtechnologie besitzt endlich die Reife, um die Suche per Sprache als neue und einfachere Benutzerschnittstelle zu erlauben. Die Voice Search Konferenz ist die erste Konferenz, die den Schwerpunkt auf diesen Durchbruch und die daraus resultierenden Produkte und Dienstleitungen legt.

Auf der Voice Search Konferenz zeigen zahlreiche Sponsoren aus dem Segment Sprachtechnologie Ihre neuesten Entwicklungen. Hauptsponsoren, die sich an dem Event beteiligen, sind:
Call Genie, Inc. - führender Anbieter von sprachaktivierten Such- und Serviceprodukten für drahtlose Carrier, Telefonauskunft-Anbieter und Herausgeber der Gelben Seiten (Yellow Pages)
IBM - Pionier in der Spracherkennungs-Technologie, der diese Technologie nun auf den stetig wachsenden mobilen Markt erweitert
Nuance Communications, Inc. - einer der führenden Anbieter von Sprach- und Bildlösungen für Geschäfts- und Endkunden weltweit
Vlingo-Corporation – Entwickler einer auf Sprache basierten Schnittstelle für Mobiltelefone
VoiceBox – Entwickler sprachgesteuerter Suchsoftware für Dialoge, die es erlaubt, Gesprächsinhalt und Leistungsangebot suchen und finden können, indem natürliche und freie Aussprache benutzt wird

Zudem unterstützen folgende Sponsoren das Event:
Loquendo - führender Gestalter in der automatischen Spracherkennung und Sprachsynthese. Loquendo vertreibt eine große Auswahl an Servertechnologien sowie eingebaute Desktop Lösungen.
Nexidia - Marktführer bei hoch skalierbarer Multimediasuche und Sprach-Analytik-Software
Novauris – Anbieter von Spracherkennungs- und Such-Technologie. Diese bietet enorme Geschwindigkeit und Genauigkeit für großangelegte Client-Server und die eingebundenen mobilen sprachbasierten Suchanwendungen.
West Interactive - erstklassiger Vertreiber automatisierter Kunden-Contact Lösungen
Opus Research und Speech Strategy News - als Sponsoren im Bereich Medien/ Analysten

Die aixvox GmbH aus Aachen (www.aixvox.com) wird als Event-Sponsor auf der Voice Search die neue, noch nicht veröffentlichte, Ausgabe des voice compass präsentieren – den voice compass 2008. Der voice compass ist das Kompendium für die Informations- und Telekommunikationstechnologie und beleuchtet den Bereich der Sprachanwendungen in aller Tiefe. In leicht verständlichen Worten zeigt es Unternehmern und Entscheidern aus der Industrie, aus Marketing und Vertrieb wie auch Call Center Managern die Möglichkeiten von Sprachanwendungen (www.voice-compass.com).

Über AVIOS
Die Applied Voice Input Output Society ist eine non-profit Organisation, die vor über 25 Jahre gegründet wurde. Die Bildungseinrichtung widmet sich der Entwicklung und Qualität von praktischen Anwendungen der Sprachtechnologie. Sehen Sie dazu auf www.avios.org.

Über die Voice Search Konferenz
Die Bedeutung der Sprachsuche wurde bisher unterschätzt. Was unterstützt die Sprachtechnologie? Nach welchen Anwendungen fragen die Kunden? Wofür zahlen die Kunden und wie realisierbar sind Werbungen in Sprachsuch-Anwendungen? Die Voice Search Konferenz findet vom 10. bis 12. März in San Diego statt und behandelt diese Themen. Über 100 Redner und 12 Sponsoren nehmen an diesem Ereignis teil.
Mehr Informationen finden Sie unter www.voicesearchconference.com
Ihr persönlicher Kontakt ist Peggie Johnson (info@avios.org).

Kontakt

Deutscher Ansprechpartner:
aixvox GmbH
Sonja Abel
Monheimsalle 22
52062 Aachen
Tel: + 49 241 4133 123
E-Mail: sa@aixvox.com
www.aixvox.com

AVIOS
Peggie Johnson
Phone:+1 408-323-1783,
Peggie@avios.org
www.avios.org

TMA Associates
Geschäftsführer: Bill Meisel
P.O. Box 570730
Tarzana, CA 91357-0730
Phone: +1 (818) 708-0962
Fax: +1 (818) 345-2980
info@tmaa.com
http://www.tmaa.com



Img of Detlev Artelt
Über Detlev Artelt

Als Kommunikations-Architekt berät er seit 25 Jahren europäische Unternehmen & Service Center zur Nutzung von neuer Technologien & Spracherkennung.