Intelligenter Lautsprecher: Unboxing und Eindrücke zu Amazon Echo

Amazon, Sprachassistent, Lautsprecher, Unboxing, Daniil Matzkuhn, Assistent, Amazon Echo, Alexa Amazon, Sprachassistent, Lautsprecher, Unboxing, Daniil Matzkuhn, Assistent, Amazon Echo, Alexa
In Form des intelligenten Lautsprechers Echo bringt Amazon die digitale Assistentin Alexa auch nach Deutschland. Ähnlich wie Siri und Cortana nimmt Alexa verschiedenste Sprachbefehle vom Nutzer entgegen und kann so beispielsweise Musik abspielen, an bevorstehende Termine erinnern oder Verkehrshinweise mitteilen. Unser Kollege Daniil Matzkuhn hat Amazon Echo ausgepackt und ausprobiert.

Amazon Echo erscheint zum Preis von knapp 180 Euro in den Farben Schwarz und Weiß. Das Kunststoffgehäuse hinterlässt einen hochwertigen Eindruck, in dem überraschend schweren Gerät befinden sich insgesamt sieben Lautsprecher und ebenso viele Mikrofone. Dadurch werden eine optimale Klangwiedergabe und Erkennung des Sprechers sichergestellt.

Das Einrichten von Echo über die passende Smartphone-App funktionierte problemlos und war in wenigen Minuten erledigt. Schwierigkeiten gab es hingegen bei der Konfiguration des zu verwendenden Musikdienstes. Danach klappte das Steuern von Musik erstaunlich gut, wenn auch nicht vollkommen fehlerfrei.

Insgesamt scheint Alexa den Nutzer recht gut zu verstehen. Manche Worte beziehungsweise der Satzbau scheinen ihr jedoch noch kleinere Probleme zu bereiten. So war es zunächst nicht möglich, das Ergebnis des letzten Hertha-Spiels abzufragen, wohingegen dies bei anderen Vereinen funktionierte. Es ist aber davon auszugehen, dass Amazon hier noch nachbessern wird.

Amazon EchoAmazon EchoAmazon EchoAmazon EchoAmazon EchoAmazon Echo

Mehr von Daniil: TBLT.de Daniil Matzkuhn auf YouTube
Dieses Video empfehlen
Kommentieren39
Jetzt einen Kommentar schreiben
 
Das Problem bei Sprachassistenten in Deutschland, egal von welchem Hersteller, ist dass sie nur in Englisch wirklich gut funktionieren. Der deutsche Sprachraum ist nunmal ziemlich klein, da wird bei der Entwicklung keine Priorität drauf gelegt. Sieht man ja bei Cortana, die seit Release stagniert. Wenn ich sage "erinnere mich daran, das Auto zu waschen", lautet die Erinnerung "Auto zu waschen". Ein Problem, das bekannt ist uns sich einfach beheben ließe, macht aber niemand.
 
@FuzzyLogic: manche brauchen halt auch einen Führerschein um Sprachassistenten richtig anzusprechen. Gibt meist genügend Vorschläge um es "richtig" zu machen. Oder wer erwartet schon perfektes Verstehen aller Satzbauten zum heutigen Zeitpunkt? Unmöglich.
 
@GermanPenguin: Der Sinn eines modernen Assistenten ist "intelligent" zu sein und nicht nur auf Art XY angesprochen zu werden.
 
@cvzone: Das ist korrekt. Nur ist es logisch, dass es nicht perfekt starten kann und die Produkte in den nächsten Jahren noch beim Kunden reifen müssen.
 
@GermanPenguin: Absolut richtig, das ist alles noch in der Entwicklung und kann nicht perfekt sein. Ich will damit nur sagen, das nicht zwangsläufig der Kunde am Ende der "Böse" ist, weil er sich nicht das Handbuch angesehen hat.
 
@FuzzyLogic: Ich verstehe jetzt ehrlich gesagt das Problem nicht. Wenn bei "erinnere mich daran, das Auto zu waschen" eine Erinnerung erstellt wird, die mit "Auto zu waschen" betitelt ist, wurde doch genau das getan, was es soll, oder?
 
@iPeople: der Zeck wird schon erfüllt, richtig. Schöner wäre es halt wenn die Meldung dann hieße "Das Auto waschen".
 
@FuzzyLogic: Tja und wo ist dann das Problem das einfach anders anzusagen. Ich mein dein Computer und die Software darauf befolgt schließlich auch nur Befehle und dein Beispiel zeigt nur wie genau der Computer das nimmt.

Beispiel: "erinnere mich, Auto waschen"

Vor dem dem Komma ist der Befehl und hinter dem Komma die abzuspeichernde Variable. Ist auch viel effizienter da du nicht so viel Quatschen musst um zum Ziel zu kommen.

Bis Skynet erwacht wird es noch lange dauern. Also einer Software die Grammatik einer Sprache, insbesondere unserer Sprache, beizubringen funktioniert nie richtig. Fehler gibt es immer, auch in Englisch. Bestes Beispiel sind hier die online Übersetzer. Zieh dir da mal die Grammatik rein.

Da gibt es auch andere Beispiele. Nehmen wir an du hast ein Passwort was 64 Zeichen lang ist, aber nur die ersten 4 Ziffern unterschiedlich sind und darauf einfach 60x die Nummer 1 folgt. Da müsste man jetzt denken das dies unsicher ist. Als Mensch ist das ja total einfach zu merken. Dennoch wäre das Passwort nahezu unknackbar da der Computer nicht so denken kann wie wir. Bei einem Bruteforce Angriff müsste der dennoch für alle 64 stellen jede mögliche Kombination durchgehen um es herauszufinden, was genau soviel Zeit kosten würde als wären alle 64 Stellen komplett durcheinander mit allen möglichen Buchstaben, Zahlen und Sonderzeichen.

Mit der Grammatik ist das ähnlich. Du kannst einem Gerät, was nicht selbstständig denken kann, kaum zu verstehen geben was ein Wort für einen Menschen zu bedeuten hat und warum es da eingesetzt wird wo es eingesetzt wird. Du müsstest hier für jede Situation die es gibt Regeln erschaffen um die Fehlerquote zu senken. Das dass zu viel ist, kann man sich denken. Man kann ja kaum jede Situation erahnen. Darum wäre das auch wieder ein Bereich wo die Schnüffelei sogar richtig wichtig dafür wäre die Fehlerquoten zu senken da man sich auf die Sachen konzentrieren kann die der Nutzer in Anspruch nimmt, um die bereits eingesetzten Algorithmen mit Regelsätzen für bestimmte Situationen zu erweitern.

Denn wie schon in den anderen Beispielen erklärt. Der Computer wird das nie richtig verstehen bevor er nicht so denken kann wie wir. Da müssen wir schon darauf warten bis Skynet erwacht und vor allem auch darauf hoffen das es uns freundlich gesonnen ist.
 
@Tanyyya: nein, das ganze nennt sich Natural language recognition und sollte meine Sprache richtig erkennen wenn ich normal damit Rede. Erinnerung mich, Auto waschen ist zwar einfach zu verstehen aber kein Mensch redet so.
 
@FuzzyLogic: Die Grammatik und den Sinn, bzw umformulierungen einem Computer beibringen lässt sich einfach beheben? Meld Dich mal wahlweise bei Apple, Google oder Microsoft, ich glaub, Du bist einer der wenigen die sowas als einfach bezeichnen, Du musst echt gut sein.
 
@Tintifax: bezog mich jetzt auf dieses konkrete Beispiel. Man muss eigentlich nur das "zu" weglassen, um es sprachlich korrekt zu machen. Funktioniert eigentlich immer im Fall von "zu". Dass andere Grammatik Probleme schwerer zu lösen sind will ich nicht bestreiten.
 
@FuzzyLogic: Jedes zu rauslöschen wäre aber nichts anderes als ein ganz unsauberer Hack. Da hab ich lieber dass er mir das einträgt was ich sag
 
@Tintifax: Soweit ich weiß funktioniert das in der Englischen Version aber, und da ist es mit "to" genau dasselbe.
 
@FuzzyLogic: Keine Ahnung. Du hast grundsätzlich natürlich Recht dass alles andere als Amerika bei MS schwer vernachlässigt wird. Ich glaub aber trotzdem dass englisch einfacher für Computer "zu verstehen" ist, und dass es mir lieber ist wenn es richtig gemacht wird, und dafür etwas dauert, als dass es einen nach dem anderen Hack gibt. Irgendwann kennt sich dann keiner mehr aus, und eine Weiterentwicklung wird immer schwerer
 
@FuzzyLogic: Spracherkennung am Computer ist auch heute noch ein Krampf, genau wie vor 20 Jahren. Das Siri kaum mehr versteht als Dragon Natural Speaking auf Windows 95, hat Apple nur geschickt damit kaschiert, das sie witzige Antworten auf Heiratsanträge liefert.
 
@FuzzyLogic: So klein ist der deutsche Sprachraum aber nun wieder auch nicht.
Das Problem liegt eher darin, dass die Englische Sprache gegenüber der deutschen doch recht primitiv und einfach ist.

Zudem ist deutsch die meistverbreitete Muttersprache in Europa.
 
@FuzzyLogic: Du magst da ja wirklich recht haben, aber ich glaube das die entwickler aus den fehlern der vergangenheit gelernt haben. Außerdem haben die jetzt auch mehr möglichkeiten die Sprachanalyse umzusetzen. In einem Bericht (keine ahnung ob das jetzt werbung ist und ob man das machen darf o.O) auf http://my-echo.de/amazon-echo-cloud-service/ kann man die Funktionsweise des Echos mit der Cloud entnehmen (sofern das stimmt!) und diese 5 Level sprachanalyse ist schon interessant. Was noch unklar ist ist die sache mit dem dialekt! :D (sorry nichts diskriminierendes) wenn ein Sachse spricht ist das schon anders als hochdeutsch :D
 
Echo, Siri, Cortana, Google Spracherkennung - Stasi-Träume werden wahr...
 
@Paradise: Weil sie dich ja auch alle zwingen das zu benutzen... Nimm deinen Aluhut und setz dich auf die stille Treppe.
 
@Chiron84: Echte Männer tragen Vendelhelm!

Ich benutze nichts davon - aber was in Menschen vorgeht die da mitmachen und noch Geld dafür ausgeben...

Den ollen Aluhut-Witz solltest du mal Menschen in Krisengebieten an den Kopf werfen.
 
@Paradise: Die Leute in den Krisengebieten haben andere Sorgen als Cortana, Alexa oder Siri...

Abgesehen davon, dass die ständigen Stasi-Vergleiche absolut daneben sind, weil sie in meinen Augen ein Unrechtsregime verharmlosen (würdest du den gleichen Spruch mit der Gestapo bringen?), wieso glaubt eigentlich jeder, dass er für die Geheimdienste so interessant wäre?

Mag ja sein dass dein Datenabdruck irgendwo analysiert und gespeichert wird, aber glaubst du im Ernst dass schaut sich irgendjemand an?
 
@Chiron84: Fakt ist es geht niemand was an wann ich wo nen Termin habe und auch nicht wann ich das Licht einschalte oder die Rollos hoch und runter mache.

Im Moment interessierts vielleicht noch keinen...
 
@Paradise: Dann mußt Du halt das Internet meiden. Ich kann mich nicht darüber beschweren das mich jemand überfährt wenn ich auf der Straße spazieren gehe, da gibt es nun mal kriminelle die das machen.
 
@Besenrein: Wenn jemand über eine grüne Ampel geht und wird überfahren wird er sich sehr wohl beschweren.
 
@Paradise: Deswegen ist es ja auch schlau auch bei der Ampel nach links und rechts zu schauen, denn wie sagt die StVO: Mit Fehlern Anderer ist zu rechnen.
 
@Paradise: Und selbst wenn es so wäre, im Gegensatz zu Stasi und vergleichbaren Sauereien bieten diese Dienste wenigstens einen ordentlichen Mehrwert für die "Überwachten". Daran sollten sich die Geheimdienste mal ein Beispiel nehmen.
 
@Paradise: Dir ist schon klar, das die Stasi für die Ermordung von Regierungsgegnern verantwortlich ist??
 
@Besenrein: Und dir ist klar das unsere Regierung ganz schnell eine andere sein kann und du aufgrund deiner Daten dann der Gegner bist?
 
@Paradise: Die Befürchtung dass die extreme Linke oder Rechte in Deutschland an die absolute Macht kommt halte ich doch für sehr weit hergeholt.
 
Dieser Mensch hinter der Kamera wirkt etwas verloren. Vielleicht hätte eine bessere Vorbereitung geholfen. So wirkt das Video etwas tollpatschig meiner Meinung nach.
 
@TheWonder: Es simuliert halt den typischen User, wie jeder beim Auspacken rangehen würde. Warum etwas verfälschen. Hier wird gleich auf die Kinderkrankheiten des Systems aufmerksam gemacht und das ist ja auch gut so für die Kaufentscheidung.
 
Blöd, wenn dann die eigene Hündin Alexa heißt.. die wird dann voll verwirrt durch die ganzen neuen Befehle. ^^

Und wenn man gar ne Freundin mit gleichen Namen hat, wirds sicher auch einige amüsante Momente geben. :D
 
@Trashy: Der gute Nerd weiß was da zu tun ist. Lautsprecher kaufen, Tussi wegschicken.
 
@Besenrein: ein Nerd weiß vor allem, wie man Nerd schreibt ;-)
 
@Trashy: Du kannst auch die Namen Echo oder Amazon verwenden. Aber, wenn natürlich deine Katze Amazon und dein Hamster Echo heißen, wird es problematisch ;)
 
Ein Mikrofon, das die ganze Zeit zuhört und das auch noch von Amazon. Der Alptraum der Datenschützer und Gewerkschafter ist da. Würde ich solche Menschen persönlich kennen, hätte das perfekte Weihnachtsgeschenk für sie. Aber ich mache generell einen Bogen und Gewerkschafter - das sind die schlimmsten Menschen auf der Welt, dicht gefolgt von den unehrlichen Medien.
 
@regulator: Dass das Mikrofon zuhört ist egal, solang es nachweislich erst Daten sendet, sobald das Kommando-Keyword gesprochen wird. Letztendlich ist es ja das gleiche Prinzip wie Siri, Viv oder Cortana, nur in ner anderen Verpackung.
 
@Trashy: Wäre ich einer von Paranoiden, würde ich so argumentieren: Wer garantiert dir denn, dass diese Box nicht alles, was du sagst aufzeichnet, um es später unauffällig - anlässlich der von dir erwartenen Datenübertragung - mitzuübertragen?
 
@regulator: Gab schon mehrere unabhängige Langzeit-Tests, was da wirklich an Traffic übers Netzwerk läuft. Es wurde nichts Unerwartetes gefunden. Ausgehend gibts nur alle paar Sekunden ein 2kb-Ping json-Query als Verbindungstest, und rein kamen nur Software-Updates ca 1x pro Monat.

Zudem ist die Software auf Echo ja auch Open Source und kann von jedem downgeloaded werden. Da kann jeder selbst analysieren, ob das System mehr macht als es soll.
https://www.amazon.com/gp/help/customer/display.html?nodeId=201626480

Sämtliche übertragene Audio-Aufzeichnungen kannst du zudem auch auf deiner persönlichen Amazon-Seite einsehen und bei Bedenken (auch einzeln) wieder löschen - wobei allerdigs der Lerneffekt für dein Profil verloren geht.
Kommentar abgeben Netiquette beachten!