Sprachassistenten: Status Quo und Ausblicke in die quasselnde Zukunft

Der kleine Helfer immer mit dabei.

Den kleinen Helfer immer mit dabei. (Quelle: „Nokia Lumia 635 Cortana Helping | Flickr – Photo Sharing!“ von Bhupinder Nayyar, Lizenz: CC BY 2.0)

Siri, Cortana, Google Now & Facebook M: dass wir mit Geräten quasseln, war einst undenkbar. Und in Zukunft? Reden wir häufiger mit Maschinen als mit Menschen?

1990er Jahre: Bluetooth macht Handys am Ohr unnötig

Die Bluetooth-Headsets prägten die 90er Jahre.

Die Bluetooth-Headsets prägten die 90er Jahre. (Quelle: „voyager_legend_woman_driving“ von plantronicsgermany, Lizenz: CC BY-ND 2.0)

Erinnerst du dich noch an die 90er? Ist schon eine Weile her, aber ich erinnere mich noch genau, wie Bluetooth erste Handys eroberte. Man sah Menschen mit klobigen Bluetooth-Headsets am Ohr, die mit sich selbst zu reden schienen. Merkwürdig wirkten sie und man war geneigt, ihnen zu antworten – erst beim näheren Hinsehen wurde klar, dass sie über ihr Headset telefonieren. Oftmals haben diese Trendsetter, die bereits mit Bluetooth unterwegs waren, ziemlich laut gesprochen; die Verbindungsqualität ließ noch zu wünschen übrig. Das änderte sich zügig und der scheinbar ins Nichts sprechende Passant ging ins Alltagsbild über, als die Bluetooth-Headsets zu schrumpfen begannen und sich unauffälliger ans Ohr des Telefonierenden schmiegten.

2000er Jahre: Siri bringt den Durchbruch

Es war im Oktober 2011, als Apple das iPhone 4s mit Siri vorstellte und Sprachassistenten salonfähig wurden. Versuche gab es bereits vorher, das Unternehmen Siri Inc., das Apple später kaufen sollte, arbeitete seit 2007 an der sympathischen Stimme, die ihrem Anwender jeden Wunsch von den Lippen ablesen sollte. Deep Learning, ein komplexes Vorgehen, um Maschinen das Lernen beizubringen, ist Grundlage jedes Sprachassistenten. Mit Microsofts Cortana und Google Now folgten Konkurrenzprodukte.

Termine und Erinnerungen mit Siri ganz leicht erstellen.

Termine und Erinnerungen mit Siri ganz leicht erstellen. (Quelle: „With UK English Siri understands me much better“ von Kārlis Dambrāns, Lizenz: CC BY 2.0)

Facebook möchte mit „M“, der hauseigenen Antwort auf Siri und Cortana, deutlich weitergehen: während bei Siri und Cortana künstliche Intelligenz im Spiel ist, ergänzt Facebook ein Team an reellen Mitarbeitern, die „M Trainer“ genannt werden. Diese hybride Form ist neu; sie soll helfen, immer eine Antwort auf Fragen zu finden. Der Nutzer erkennt dabei nicht, ob er mit Mensch oder Maschine spricht.

Aktuell sind wir an einem Punkt angelangt, an dem die Sprachassistenten der unterschiedlichen Hersteller kleine Hilfen im Alltag sind. Mit ihrer Humorlosigkeit können sie uns zum Schmunzeln bringen – so sprach MarketingLand-Gründer Danny Sullivan seine Apple Watch jüngst mit „OK, Google“ an und Siri war etwas pikiert. Auf shitthatsirisays.tumblr.com findest du allerhand solcher Siri-Antworten. Der große Wurf fehlt jedoch noch. Okay, wir können sprachgesteuert Wecker stellen, Termine und Erinnerungen einrichten, Notizen erstellen oder an fällige Rechnungen erinnert werden. Es kommen auch kaum noch komische Blicke, wenn wir mit unseren Smartphones quatschen, ohne dass ein Gesprächspartner in der Leitung ist. Aber der echte Nutzen, der den Alltag vereinfacht, ist noch nicht gekommen.

Die Zukunft: das goldene Zeitalter der Sprachassistenten

Es ist Freitag, der 25. November 2039. Meine Schwiegermutter hat sich zu Besuch angekündigt. Mein empathischer Wecker weiß um das gespaltete Verhältnis zur Schwiegermutter: nachdem sie alles kritisch betrachtet und kommentiert hat, kommen wir eigentlich ganz gut klar – der Klassiker eben. Gefühlvoll, wie mein Wecker ist, piepst er mit dem ersten Klingelton die Kaffeemaschine an, die zischend das erste Getränk des Tages zubereitet. Nicht ohne den gesundheitlich wertvollen Hinweis, dass nach der dritten Tasse zur Magenschonung genug sein sollte. Wir haben ein Zeitalter erreicht, in dem mein Wecker meine Gesundheitswerte besser kennt als ich. Ich habe mich schon daran gewöhnt und lasse mir manches Mal eben auch diktieren, dass frische Kartoffeln gesünder sind als gepresste in Chipsform. Mein persönlicher Assistent regelt den Einkauf – drahtlos via Web.

Mir ist kalt. Das sage ich einfach so in mein Schlafzimmer hinein – zack, springt die Heizung an. Mein smartes Zuhause weiß, dass ich nur bei kühlen Temperaturen schlafen kann, tagsüber aber eine gewisse Wärme herrschen muss. Als ich den Flur entlang stolpere, um meinen Kaffee zu holen (das muss ich leider noch selbst machen), fallen mir Flusen auf dem Teppich auf. Um der Schwiegermama keinen weiteren Anlass zur Kritik zu geben, sage ich dem Staubsauger, er möge sich bitte direkt an die Arbeit machen. Gesagt, getan – herrlich!

Um die liebe Schwiegermama abzuholen, brauchen sich mein Mann und ich nicht bewegen. Wir sagen unserem Smartphone einfach, es soll ein Taxi zu ihr senden und den fälligen Betrag vom Konto abbuchen. Kein Bargeld, kein Stadtverkehr und noch mehr Zeit, weitere Aufgaben an unsere Haushaltsgeräte zu delegieren. Während Waschmaschine, Staubsauger- und Rasenmäherroboter ihre Arbeit verrichten, hat mein Mann frei und zappt sich sprachgesteuert durch sämtliche Kanäle. Ich habe noch einen Blogbeitrag zu schreiben. Bzw. zu sprechen, denn so macht man das mittlerweile. Ich sage der Software, welche Recherchequellen ich für unwichtig erachte, die Software sucht mir Informationen für meinen Artikel. Nach dem Lesen der Rechercheergebnisse sortiere ich für mich, spreche meinen Artikel ein, die Software tippt für mich. Redigieren brauche ich nicht, die gefühlte 210. Rechtschreibreform kann das Programm viel besser als ich umsetzen.

Meine Schwiegermutter steht vor der Türe. Sie hat nicht geklingelt; unser Haus meldete den Besuch an, als der Taxifahrer die Markierungspunkte des Parkplates erreichte. Ähnlich wie Kontaktampeln arbeitet unser Parkplatz: wir sagen unserem sprachgesteuerten persönlichen Assistenten, dass sich Besuch angekündigt hat, und der Parkplatz erkennt, wann dieser ankommt. Unangekündigter Besuch muss konventionell klingeln, angekündigter Besuch wird durchgelassen, ohne zu klingeln. Na toll: ich gebe in der Küche just in diesem Moment die Anweisung, bei wie viel Grad der Nachmittagskuchen 40 Minuten lang backen soll, meine Schwiegermutter sieht das jedoch anders und bringt meinen charmanten Sprachassistenten mit anderen Angaben durcheinander.

„Mir ist kalt“, stellt meine Schwiegermutter fest, nachdem wir dem Ofen die nun richtige Anweisung gegeben haben und gemeinsam auf der Couch lümmeln. Die Heizung hört das Dilemma und reagiert promt. „Die bauen wieder alles zu in Hamburg“, schimpft Schwiegermütterlein, genervt von der staulastigen Fahrt von der Stadt zu uns aufs Land. „Die Baustelle an der A24 wird am 14. Dezember aufgehoben“, meldet sich mein allwissendes Smartphone zu Wort, „allerdings wird die nächste Ausfahrt ab dem 16. Dezember wieder gesperrt“, ergänzt es. „Immer Stau auf der A24, da ist immer Stau!“, echauffiert sich meine Schwiegermutter – und mein Smartphone pflichtet empört bei. So schwätzen die beiden noch eine Zeitlang, scherzen und empören sich.

Das neue „Facebook M“ mit menschlicher Unterstützung. (Bild: ©Facebook)

Das goldene Zeitalter der Sprachassistenten ist angebrochen und Facebook setzt bei „M“ mittlerweile nur auf Maschinen. Weil es funktioniert. Endlich! Die Maschinen können empathisch auf unsere Emotionen reagieren. So kommen echte Unterhaltungen zustande – Sprachassistenten sind nicht mehr nur kleine Hilfen im Alltag, sondern Gesprächspartner, die andere Maschinen anleiten, Dinge zu tun, die früher unsere Zeit gekostet haben. Sie lernen durch unseren Lebensrhythmus unsere individuellen Vorlieben kennen, reden mit uns darüber und helfen uns, nach unseren Vorlieben zu leben. Manchmal nerven sie auch. Zum Beispiel, wenn ich vor dem Vertilgen der Chips wieder Gesundheitswarnungen bekomme. Auf mein entnervtes „Jetzt halt die Klappe!“ kommt mittlerweile als Antwort ein schnippisches: „Bitte, spiel doch mit deiner Gesundheit …“. Sprachassistenten sind intelligent geworden. Sie reagieren – mit Humor, mit Ironie, manchmal sogar mit erhobenem Zeigefinger. Und niemand guckt mehr komisch, wenn wir mit Maschinen sprechen. Was waren die 90er Jahre doch verrückt …

Die künstliche Intelligenz im Film „Her“, wird das bald die Zukunft sein? Was meinst du?


Starte deine eigene Tekkie-Story


Sag uns deine Meinung!