Beeindruckend: Microsoft-KI beschreibt Blinden, was um sie passiert

Build, Künstliche Intelligenz, Build 2016, Ki, Microsoft BUILD 2016, Microsoft Cognitive Services Build, Künstliche Intelligenz, Build 2016, Ki, Microsoft BUILD 2016, Microsoft Cognitive Services
Der wahrscheinlich berührendste, aber auch technologisch beeindruckendste Moment der Tag-1-Keynote der Microsoft-Entwicklerkonferenz Build gehörte dem blinden Entwickler Saqib Shaikh. Dieser stellte per Video und auf der Bühne das Projekt Seeing AI der Microsoft Cognitive Services vor, dieses hilft sehbeeinträchtigten Menschen mit KI-Hilfe, besser ihre Umwelt zu erfassen.

Saqib Shaikh erzählt im Video zunächst, dass er im Alter von sieben Jahren seine Sehkraft verloren hat. Wenig später besuchte er eine spezielle Schule für Blinde, dort hatte er dann zum ersten Mal Kontakt mit "sprechenden Computern." Diese haben ihm dann eine "völlig neue Welt an Möglichkeiten" aufgezeigt.

Leben verbessern

Vor zehn Jahren ist er dann als Informatiker zu Microsoft gestoßen und wollte dort etwas erschaffen, was das Leben von Menschen wahrhaft verbessern kann. Und sein Traum sei es gewesen, ein System zu schaffen, das jemandem zu jeder Zeit beschreiben kann, was gerade um die Person herum passiert.

Dabei wird Saqib Shaikh mit einer Kamera-Brille gezeigt, per Geste wird dann ein Foto geschossen und von einer Künstlichen Intelligenz analysiert. Eine Computerstimme beschreibt dann das, was (vermutlich) gerade passiert, im Video wird das unter anderen anhand eines Skateboarders gezeigt, der einen Trick vollführt.

Die dazugehörige App basiert auf den Intelligence-APIs bzw. den Microsoft Cognitive Services. Die APIs bieten Entwicklern die Möglichkeit, Anwendungen das Sehen, Hören, Sprechen, Verstehen und Interpretieren menschlicher Bedürfnisse beizubringen. Das funktioniert über spezielle Brillen, aber auch über eine Smartphone-Anwendung.

Beeindruckend ist, dass die App Menschen erkennen, aber auch ihre Emotionen einschätzen kann bzw. dies versucht. Außerdem kann sie blinden Menschen Text vorlesen und auch eine Anleitung geben, wie sie das Smartphone halten sollen, damit das gelingt.

Weitere Ankündigungen vom ersten Tag:
Dieses Video empfehlen
Kommentieren16
Jetzt einen Kommentar schreiben
 
Wunderbar...! Und all die netten unauffällig gemachten Bilder (später möglicherweise auch Videoaufzeichnungen) werden dann selbstverständlich an Microsofts Cloudserver übermittelt, wo sie ausgewertet und analysiert werden, um eine möglichst genaue Beschreibung des Bildinhaltes vorzunehmen. Was bei Googles Glass (aus meiner Sicht zu Recht) noch zu deutlichen Protesten geführt hat, avanciert bei MS offenbar plötzlich zur unbekümmert akzeptierten Technologie. Neben blinden Menschen, dürfte MS mit diesem Gadget aber mindestens noch Geheimdienste und Dedektive als potentielle Interessenten bzw. Kunden ansprechen können. ;)
 
@KoA: Der Mensch ist sein Mensch, ein Mensch und ein Mensch... Leider. So viele Technologien die unser Leben, die Interaktion mit der Umgebung, Mitmenschen usw. Bereichert. Unsere Wahrnehmung erweitert. Und vieles mehr. Werden verhindert, verkrüppelt, weil der Mensch ist, wie ein Mensch eben so ist. Leider
 
@darius_: Und weil "der Mensch" ist, wie er ist, merkt er oft auch nicht, dass die Medaille stets zwei unterschiedlich zu betrachtende Seiten besitzt. ;)
 
@KoA: eine Goldmedaille ist auf der anderen Seite aus Gold.
 
@Norodon: Das glaubst aber auch nur du! ;)

Sorry, muss mich berichtigen. ...nicht nur du! :)
 
@KoA: Ja die tolle Spracherkennung und das hier ist dann richtig gut wenn es ohne Cloud funktioniert. Ich gehöre auch zu den beschimpften Aluhut-Trägern weil ich keinen TV mit Sprachsteuerung bzw Mic und Cam ins Internet hängen würde usw...
Was hat man sich über die Stasi aufgeregt und heute hat auf einmal keiner mehr was zu verbergen.
 
@Paradise: Wenn du die Server mit den notwendigen Datenbanken auf dem Rücken mit dir führst, sollte es auch ohne Cloud funktionieren.
Könnte dann nur problematisch werden bei 'nem Update. Weiß ja nicht ab wie viel Terabyte dein Inet-Provider drosselt.
 
@KoA: Sicher ist der Datenschutz auch in diesem Fall einzuhalten (als kritische Hinterfragung). aber die Technologie dahinter kann wie die Brailleschrift um vieles mehr an Lebensqualität bringen.

https://de.wikipedia.org/wiki/Brailleschrift
 
@AlexKeller: Hierbei geht es nicht allein nur um Datenschutz. Problematischer ist das automatisch damit einhergehende Missbrauchspotential solcher Entwicklungen, so nett diese für z.B. blinde Menschen auch sein mögen. Aber der Einsatzbereich im Umfeld von blinden Menschen ist lediglich ein ganz geringer Bruchteil des Ganzen Anwendunsspektrums. Und dieser Aspekt ist definitiv nicht trivial und einfach mal so als Unsinn abzuhandeln.
 
wo kann man das kaufen
 
Ganz ganz groß.
 
Woher weiß er, in welchem Moment er das Foto machen soll? Beim Skater ziemlich unrealistisch ihn in der Luft beim Sprung zu erwischen. Und er programmiert die Software auch noch selber, wie soll das gehen?
 
@Tazzilo: Beim Skater wird es wohl schwierig aber im Park, Restaurant usw. sicher sehr nützlich/hilfreich.
 
Beeindruckend was Menschen mit solch einer Einschränkung alles erreichen können.
Da kann man als gesunder Mensch nur seinen Hut vor ziehen.

Was ich mich allerdings gerade Frage (...)
es mag an und für sich eine wirklich gute Sache sein.
Aber könnte es auch nicht passieren, dass manche Menschen dadurch extrem deprimiert werden?
Stellt euch vor ihr wärt Blind und eine KI erklärt euch eure Umgebung.
Ich würde innerlich explodieren weil ich es selber nicht sehen könnte.
Mag sein das mein denken in diesem Punkt falsch ist, denn ich denke nicht, dass ich beurteilen kann wie ein Blinder sich dabei fühlen würde.
Ich wünsche allen blinden Menschen auf dieser Welt von Herzen das die Technologien von Morgen ihnen das Leben erleichtern können.
 
@Muhviehstarx3: Ich kann jetzt nicht für Blinde sprächen, da ich selber sehen kann.
Dennoch könnte ich mir schon vorstellen, das einer der erblindet ist so empfinden könnte.
Doch wird es ihn eh traurig stimmen, wen irgendwas um ihn geschieht und er nicht in der Lage ist daran teil zu nähmen.
Aber wenn er diese Technik hat und sie auch richtig funktioniert, bleibt er wenigstens verschont, von der Unsicherheit was da gerade passiert.
Wenn er auch noch Psychisch labil ist, könnte er panisch reagieren und oder Angstattacken erleiden, wenn er Geräusche hört die er nicht zuordnen kann.
Ein blind geborener, so kann ich mir das vorstellen, würde sich riesig darüber freuen genauere Informationen zu haben, über das was vor ihm passiert und mit Sicherheit viel Spaß damit haben :)
Kommentar abgeben Netiquette beachten!