Die FAZ.NET-Nachrichten-App
Kostenlos für iOS und Android
Anzeige
Digitale Sprachassistenten

Wie kann ich behilflich sein?

Von Tobias Bug und Anna Steiner
 - 15:41
Noch nicht im Handel: der Apple Homepod Bild: F.A.S.

Haben Sie auch schon Ihren Amazon Echo ausgepackt? Falls ja, geht es Ihnen wie vielen Deutschen in diesem Jahr: Geräte für den Haushalt, in denen Sprachassistenten stecken, sind ein beliebtes Weihnachtsgeschenk. Was für die meisten Verbraucher zunächst nur eine Spielerei ist, lässt die Kassen der Hersteller klingeln, denn die diversen Sprachboxen – allen voran das Flaggschiff von Amazon und der Konkurrent Google Home – verkaufen sich wie geschnitten Brot.

Anzeige

Einer Studie der Marktforschungsfirma Tractica zufolge nutzen schon heute mehr als 500 Millionen Menschen auf der Welt einen digitalen Sprachassistenten, typischerweise ist er in ihrem Smartphone eingebaut. Bis 2020 sollen sich die Nutzerzahlen verdreifachen. Jede dritte Internetaktion soll dann schon über die Stimme gesteuert werden. Die großen Suchmaschinen, so die Prognose, werden rund die Hälfte aller Anfragen über Sprachbefehle empfangen. Ein enormes Potential, das die Tech-Firmen im Silicon Valley längst erkannt haben.

Vorteile für Apple Music

Nicht nur Privathaushalte geben viel Geld für Sprachassistenten aus, auch die großen Unternehmen schlagen zu. Der neueste Deal: Apple übernimmt Shazam, einen Musikerkennungsdienst, für 400 Millionen Dollar. Doch wozu?

Zunächst einmal ist Shazam eine App, die es dem Smartphone-Besitzer ermöglicht, Lieder zu identifizieren und sie sich dann herunterzuladen oder in einem Musik-Streamingdienst wie Apple Music oder Spotify anzuhören. Shazam analysiert den akustischen Fingerabdruck eines Liedes und ordnet ihn einem Eintrag in der Datenbank zu. In der Praxis ganz einfach: Der Nutzer startet die App, hält sein Handy vor den Lautsprecher, aus dem das Lied kommt, das er nicht kennt, und erhält innerhalb weniger Sekunden den Namen des Interpreten und den Titel.

Anzeige

Das macht Shazam nicht erst seit kurzem, sondern schon seit gut fünfzehn Jahren. Auch Apple ist kein unbeschriebenes Blatt in der Erkennung von Sprachmustern: Als die Kalifornier im Jahr 2011 ihr iPhone 4s vorstellten, war der Sprachassistent Siri schon an Bord – und machte Schwierigkeiten. Denn die Technik war längst nicht ausgereift. Siri verstand schlecht, hatte Probleme, Logiken nachzuvollziehen und gab standardisierte Antworten – wenn auch manchmal recht amüsante.

Vordergründig geht es Apple nun darum, den hauseigenen Streaming-Dienst Apple Music zu stärken, der derzeit weit abgeschlagen hinter dem schwedischen Marktführer Spotify liegt. Bei Shazam oder Soundcloud, einem ähnlichen Dienst, stand Spotify standardmäßig an erster Stelle der Streaming-Dienste und wurde damit häufiger von den Nutzern ausgewählt, um das gefundene Lied abzuspielen. Nun soll Apple Music hier nach vorn rücken.

„Vorsicht, hinter dir steht ein Biber im Tauchanzug“

Noch mehr Sinn hat der Zukauf allerdings, wenn Apple mit dem selbst entwickelten Sprachassistenten Siri und Shazam ein Kompetenzzentrum zur Spracherkennung bildet, der in Zukunft nicht nur Apple Music zugutekommt.

Die Idee, die Sprache als Steuerungsinstrument für Geräte aller Art zu nutzen, ist nicht neu. Schon in den Sechzigern forschten Firmen an der Entwicklung solcher Anwendungen, jedoch ohne Erfolg. Seitdem hat sich in der Branche vieles getan. Die großen Tech-Firmen haben ihre eigenen Assistenten entwickelt, viele kleine ziehen gerade nach. Mit den Helferlein von Google, Amazon und bald auch Apple (der „Homepod“ ist noch nicht im Handel) lässt sich im vernetzten Zuhause die Heizung steuern, der Rollladen öffnen und die Alarmanlage aktivieren. Statt das Handy in die Hand zu nehmen und eine Suchmaschine aufzurufen, kann man Alexa – die Software, die im „Echo“ von Amazon steckt – auch einfach fragen, wann der Film im Kino läuft, den man abends gerne sehen würde, und welches Restaurant in der Nähe die besten Bewertungen hat. Auch für Spielereien ist Alexa offen. Auf die Ansprache „Alexa, sag etwas Lustiges!“ antwortet die Sprachbox schon mal: „Vorsicht, hinter dir steht ein Biber im Tauchanzug. Ha – reingefallen!“

Aber mal ehrlich, wer braucht so einen sprechenden Lautsprecher wirklich? Natürlich lässt sich Zeit sparen, wenn man nicht tippen muss, sondern einfach losreden kann. Aber lohnt sich das? Die Geräte, in denen die Software der Sprachassistenten „wohnt“, sind meist recht teuer: Je nach Ausführung kostet Amazons Echo bis zu 100 Euro, die neueste Variante von Google Home kommt auf 150 Euro. Dafür, dass die meisten Smartphones ohnehin schon einen integrierten Sprachassistenten haben, ist das viel Geld.

Für die Nutzer bedeutet ein Sprachassistent zunächst einen Komfortgewinn. Anfragen könnten einfach per Sprachbefehl angebahnt werden, währenddessen sind beide Hände für anderes frei. Und die Dienste werden immer besser: Sie können per Stimmerkennung an ihren Besitzer angepasst werden, lernen aus den Anfragen, können Vorlieben identifizieren und entsprechend handeln.

Nachts Besuch von der Polizei

Schon gibt es Firmen, die sich darauf spezialisiert haben, Geschäftsmodelle für diese Technik zu entwickeln. Man kennt das von der „App Economy“ rund um die unzähligen Smartphone-Programme. „Diese Anwendungen werden in Zukunft auf jeden Fall eine zentrale Rolle in unserem Leben spielen“, wirbt Malte Kosub, einer der Gründer und Geschäftsführer des Berliner Unternehmens Future of Voice. Die Firma verspricht Unternehmen, deren Angebote für die Welt der Spracherkennungsdienste zu optimieren.

Bis daraus ein Massengeschäft wird, gilt es noch einige Hindernisse aus dem Weg zu räumen. Denn immer wieder machen Meldungen die Runde, nach denen sich Alexa und Co. selbständig gemacht haben. So geschehen in Pinneberg. Dort bekam ein junger Mann die Tücken der Technik zu spüren: Sein Wohnzimmer-Assistent hatte sich nachts in Abwesenheit des Besitzers eigenständig eingeschaltet und laute Musik abgespielt. Die Nachbarn wachten auf und riefen die Polizei. Als die Beamten nach längerem Klingeln und Klopfen nicht in die Wohnung gelassen wurden, ließen sie die Wohnungstür von einem Schlüsseldienst öffnen. Den Besitzer der Sprachbox kam das teuer zu stehen.

Doch auch abseits solcher Kuriositäten sollten die Sprachassistenten nicht unüberlegt genutzt werden. Die eingesprochenen Daten werden von den Boxen zur Recherche genutzt. Kritiker werfen den Herstellern deshalb immer wieder Spionage im heimischen Wohnzimmer vor. Apple, Google und Co. bestreiten das: Die Assistenten würden erst dann aktiv, wenn eine Taste gedrückt oder ein Signalwort gesprochen („Okay, Google“ oder „Alexa“) werde. Mitgehört werde zunächst nur im Wohnzimmer. Und alle Gespräche, die nicht das Signalwort enthielten, würden kurzfristig wieder gelöscht. Erst nach direkter Ansprache samt Signalwort werde die Übertragung in die Daten-Cloud des Herstellers gestartet, wo die Kommandos oder Anfragen analysiert, interpretiert und dann beantwortet beziehungsweise umgesetzt werden.

Verbraucherschützer warnen dennoch: Nichts, was mit dem Internet verbunden ist, sei wirklich sicher gegen Hacker-Angriffe geschützt. Das Prinzip der Datensparsamkeit gelte gerade bei solchen Assistenten, sagt Peter Lassek vom hessischen Verbraucherschutz. Er rät Anwendern, nur die nötigsten Informationen auf vernetzten Geräten zu speichern, und die Funktionen, die nicht genutzt werden, abzuschalten. Zudem sollten Verbraucher ihren Sprachboxen eine konsequente Nachtruhe verordnen. Denn das eigentliche Problem sei nicht die unzureichend sichere Software, sondern die ständige Verbindung mit dem Internet. Weniger Zeit online bedeute weniger Zeit zum Datenklau für die Hacker und damit weniger Gefahren.

Trend zum „Smart Home“

Ganz legal profitieren die Hersteller vom Boom der Sprachassistenten. Über die Suchanfragen erhalten sie – zumindest temporär – Daten über viele Tausende von Nutzern, und das oft standortbezogen und direkt aus deren privatester Umgebung. Für die Konsum- und Produktforschung ist das eine Goldgrube. Was genau ein Sprachassistent tatsächlich aufzeichnet und weitergibt, ist nicht abschließend geklärt. Immerhin können Nutzer die Suchprozesse in ihrem Konto einsehen und löschen. Apple verknüpft die Daten nicht direkt mit der Apple-ID, stattdessen wird eine Zufallkennung für den Sprachassistenten Siri erstellt. Die Anfragen seien damit anonymisiert, argumentiert Apple.

Die Marktprognosen der Firma Strategy Analytics sagen für 2022 einen Umsatz mit Sprachassistenten von 5,5 Milliarden Dollar voraus. Das wäre dreimal mehr als derzeit. Entscheidender Treiber könnte der Trend zum sogenannten „Smart Home“ werden, in dem Rollläden, Licht und die Kühlschranktemperatur zentral steuerbar sind. Da macht dann auch erst eine Steuerungszentrale richtig Sinn, die sich auf Zuruf bedienen lässt.

Quelle: F.A.S.
Anna Steiner
Redakteurin in der Wirtschaft.
  Zur Startseite
Ähnliche ThemenShazamAmazonSpotifyGoogle HomeStreamingAmazon EchoDollarPolizei
Anzeige