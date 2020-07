Die immer weiter verbreiteten Sprachassistenten übertragen keineswegs nur nach einer bewussten Aktivierung durch den Nutzer Aufnahmen ihrer Umgebung in die Cloud. Sie werden auch von zahlreichen Triggern aktiviert, an die Anwender kaum denken würden.

Alexa: "unacceptable", "election" und "a letter"

"unacceptable", "election" und "a letter" Google Home: "OK, cool" und "Okay, who is reading"

"OK, cool" und "Okay, who is reading" Siri: "a city" und "hey jerry"

"a city" und "hey jerry" Cortana: "Montana"

Amazons Echo wird unvorhersehbar aktiv

Trigger-Liste ist nur der Anfang

Das ist das Ergebnis eines Untersuchungsprojekts der Ruhr-Uni Bochum und des Max-Planck-Instituts (MPI) für Cybersicherheit und Schutz der Privatsphäre. In einer automatisierten Umgebung wurden verschiedenen Geräten diverse populäre Fernsehserien vorgespielt und erfasst, wann die Geräte ansprangen, obwohl niemand "Alexa", "Hey Siri" oder "OK Google" gesagt hat. Und das ist sehr viel häufiger der Fall, als man denken würde - wie beispielsweise bei:Das Problem besteht hier darin, dass die Besitzer solcher Geräte natürlich davon ausgehen, nicht belauscht zu werden. Denn es sollen nach offizieller Darstellung ja nur Aufnahmen an das Datenzentrum der Betreiber geschickt werden, wenn der Anwender die Systeme durch das Schlüsselwort aktiviert. Da sie sich aber ziemlich unvorhersehbar selbst anschalten, ist davon auszugehen, dass ebenso unkontrollierbar Audio-Aufnahmen aus dem privatesten Lebensbereich verschickt und von KI-Servern und teilweise auch Mitarbeitern der Unternehmen ausgewertet werden.Die Forscher konnten anhand ihres Experiments eine Liste von über tausend Begriffen und Redewendungen zusammenstellen, die die Sprachassistenten aktivierten und demnächst komplett im zugehörigen Paper veröffentlicht wird. Die Trigger-Wörter müssen nicht immer funktionieren, in den meisten Fällen hängt es davon ab, wer sie ausspricht und wie sie dabei betont werden. Dabei kommt es teils zu kuriosen Szenen: So startet Amazons Echo die Sprachaufnahme, wenn Margaery Tyrell in Game of Thrones anmerkt: "We like some privacy."Die beteiligten Forscher haben solche Fehl-Trigger anhand der bekannten recht Sprachassitenten von Amazon , Apple, Google und Microsoft ausgewertet, zusätzlich wurden Systeme von der Deutschen Telekom und den chinesischen Betreibern Xiaomi, Baidu und Tencent hinzugezogen. Ihnen wurde über lange Zeit deutsches, englisches und chinesisches Audiomaterial vorgespielt, während Sensoren erfassten, wann welches System aktiv wurde.Man beließ es allerdings nicht bei der Liste falscher Trigger. Diese dient den Forschern als Grundlage für weitere Arbeiten. So werden die Wörter und ihre Aussprache in kleinstmögliche Klangeinheiten heruntergebrochen, um herauszufinden, wie die Sprachassistenten genau zu falschem Verhalten gebracht werden könnten - was letztlich der Verbesserung der Systeme dienen kann.