Rokid Glasses im Test: Gemini und ChatGPT direkt auf der Nase

Die Rokid Glasses wollen mit einem integrierten Display und freier KI-Wahl von ChatGPT bis Gemini die AR-Brillen von Meta, Google und Co. angreifen. Wird der einstige Hype wirklich neu entfacht? Wir haben die smarte Brille im Alltag getestet.
Headset, Augmented Reality, AR, AR-Brille, Rokid Glasses, Rokig

Eine smarte Brille, die mehr sein will als ein Gadget

Der Markt für smarte Brillen kommt nach Jahren eher zaghafter Anläufe zunehmend in Bewegung. Während Meta mit den in Zusammenarbeit mit Essilor Luxottica entstandenen Ray-Ban- und Oakley-Modellen den westlichen Massenmarkt dominiert, drängen inzwischen auch Hersteller aus Asien in das Segment. Dazu zählt vor allem Rokid.

Das Unternehmen legt nun mit den Rokid Glasses ein Modell vor, das in einem zentralen Punkt über das hinausgeht, was Meta zumindest hierzulande aktuell anbietet: Die Brille besitzt nämlich ein in die Gläser integriertes Display. Wohlgemerkt existiert parallel dazu das günstigere Modell Neo, das auf den Bildschirm verzichtet und ausschließlich auf akustische Rückmeldungen durch den KI-Assistenten setzt, also gleich wie es die bekannten KI-Ray-Bans machen.

Die unverbindliche Preisempfehlung für die Rokid Glasses beträgt 699 Euro, zum Marktstart bietet der Hersteller noch bis Ende Mai einen Rabatt auf 589 Euro, im Handel selbst bekommt man das Gerät auch unter 600 Euro.
Rokid GlassesRokid Glasses: Etwa doppelt so schwer eine normale Brille

Hardware der Rokid Glasses

Technisch gehört die Brille durchaus zur derzeit führenden Generation smarter Wearables. Im Inneren arbeitet Qualcomms Snapdragon-AR1-Chip der ersten Generation, ergänzt durch zwei Gigabyte Arbeitsspeicher und 32 Gigabyte internen Speicher. Die Funkverbindung erfolgt über Wi-Fi 6 und Bluetooth 5.3.

Beim Gewicht weichen die Herstellerangaben und Messungen leicht voneinander ab: Offiziell gibt Rokid 49 Gramm an, wir haben allerdings (wie die meisten Tester) 52 Gramm gemessen. Sieht man über die drei Gramm hinweg, dann bewegt sich die Rokid-Brille auf ähnlichem Niveau wie die zweite Generation der Meta Ray-Ban, die ein Gewicht von 50 Gramm hat.

Das Gestell besteht aus einer Magnesium-Aluminium-Legierung. Die Brille fühlt sich auf der Nase entsprechend leicht an. Doch wird das Gewicht durch die etwas breiteren Bügel und Stege subjektiv deutlicher wahrnehmbarer als bei einer klassischen Sehhilfe. Die durchaus bequemen Nasenpads sind großzügig dimensioniert und lassen sich austauschen.


Ob die Brille optisch als alltagstauglich gilt, ist eine Frage des Geschmacks. Während einige Betrachter das schlichte, am Wayfarer-Stil angelehnte Design als so unauffällig empfinden, dass es im öffentlichen Raum nicht weiter ins Auge fällt, könnten andere die sichtbaren Displayumrandungen sowie dicken Bügel bemängeln. Das liegt aber natürlich in der Natur der Sache, denn irgendwo muss die Technik untergebracht werden.

Micro-LED-Waveguide-Displays

Das Herzstück und zugleich Al­lein­stel­lungs­merk­mal der Brille sind die beiden Micro-LED-Waveguide-Displays in den Gläsern. Sie projizieren textbasierte Inhalte oder simple Grafiken direkt ins Sichtfeld und erinnern in ihrer einfarbig grünen Darstellung an die Schrift früher Computermonitore. Das Sichtfeld wird je nach Quelle mit 23 bis 30 Grad angegeben, die Auflösung liegt im Bereich von 640 × 480 Pixeln, und die Helligkeit kann bis zu 1500 Nits erreichen. Rokid GlassesBedient wird die Brille über Tappen (vorne) und Wischgesten (Strich am Bügel) Eine automatische Helligkeitsregelung gibt es nicht; geregelt wird in zehn Stufen manuell. Bei strahlendem Sonnenlicht verblasst die Anzeige spürbar, vor sehr hellen Hintergründen wird das Ablesen unzuverlässig. Vor dunklem oder neutralem Hintergrund ist die Darstellung dagegen klar lesbar.

Funktional ist die Beschränkung auf eine Farbe weniger ein Nachteil, als es zunächst klingen mag. Die Brille konzentriert sich auf die Einblendung von Text, Symbolen und sehr schematischen Karten, nicht auf Medienwiedergabe. Für Navigation, Übersetzungen, Benachrichtigungen oder die Ausgabe von KI-Antworten reicht die monochrome Darstellung völlig aus.

Längere Textpassagen können allerdings Teile des realen Sichtfelds verdecken, und nicht in jeder Situation entscheidet die Software passend, ob eine Information besser eingeblendet oder lediglich akustisch ausgegeben werden sollte. Aus bestimmten Blickwinkeln kann das grüne Leuchten der Displays zudem für Außenstehende erkennbar sein. Rokid GlassesIm 'richtigen' Winkel sieht man das integrierte Display - der Effekt wirkt auf dem Foto aber stärker als in der Realität Ein klarer Nachteil ist, dass die Brille in ihrer ausgelieferten Form vor allem für Menschen mit perfektem Sichtvermögen geeignet ist. Wer Korrekturlinsen benötigt, der kann eine Korrekturbrillenfassung bestellen, muss die passenden Linsen aber extra beim Optiker anfertigen.

Dazu kommt, dass ältere Menschen womöglich Schwierigkeiten beim Fokussieren auf den Bildschirm haben können. Der Tester (der leider schon eine Lesebrille nutzt), muss etwa jedes Mal, wenn er Text auf dem Display lesen will, Bruchteile einer Sekunde scharfstellen und gefühlt schielen, um diesen zu lesen. Das ist leider nicht vollständig alltagstauglich.

Bedienung und Sprachausgabe

Bedient wird die Brille grundsätzlich über drei Wege: Spracheingabe mit dem Schlüsselwort "Hey Rokid", Wischgesten auf dem berührungsempfindlichen Bügel der rechten Seite sowie einen physischen Knopf, der per Klick die Foto- und per längerem Druck die Videoaufnahme auslöst. Essentiell ist natürlich die Smart­phone-App, über die sich Einstellungen vornehmen und Inhalte verwalten lassen. Rokid Glasses Das Wechseln zwischen diesen Eingabearten gelingt grundsätzlich solide, doch die Touch-Erkennung reagiert mitunter zu sensibel, sodass bei unbedachten Bewegungen ungewollt Funktionen gestartet werden. Eine Steuerung über Handgesten oder ein zusätzliches Armband, wie es Meta bei der Display-Variante seiner Ray-Ban-Brille mit einem Neural Band umsetzt, gibt es bei Rokid nicht.

Nicht gefallen hat uns die Stimme der KI-Assistentin. Diese klingt synthetisch und fast schon kindlich, sie wirkt eher gehaucht als sachlich und lässt sich nicht anpassen. Wer sich daran stört, kann die bessere männliche Stimme wählen oder die akustische Ausgabe deaktivieren und ausschließlich die Textanzeige im Display nutzen. Hier sollte Rokid per Update bessere Varianten und mehr Auswahl nachliefern, Stimmen sind schließlich auch ziemliche Geschmackssache.

KI-Funktionen und Modellwahl

Den vielleicht interessantesten Aspekt der Rokid AI Glasses bildet die offene (derzeit auf zwei Optionen beschränkte) Wahl des KI-Sprachmodells. In der Begleit-App lässt sich für sprachbasierte und für visuelle Anfragen jeweils festlegen, ob Googles Gemini oder OpenAIs ChatGPT zum Einsatz kommen soll.

Diese Flexibilität ist im aktuellen Marktumfeld ein löbliches Allein­stellungs­merkmal, da konkurrierende Brillen typischerweise an ein einziges KI-Ökosystem gebunden sind. In der Praxis zeigt sich, dass die beiden Modelle unterschiedliche Stärken aufweisen: Gemini liefert in der Bilderkennung und bei standortbezogenen Fragen häufig die plausibleren Ergebnisse, während ChatGPT bei klassischen Wissens- und Logikfragen schnell und treffend antwortet.

In der Anwendung erkennt die Brille Objekte, Pflanzen, Gebäude und Texte vor der eingebauten Kamera und liefert dazu mitunter überraschend detaillierte Erklärungen. Über die Schlüsselsignale "Hi Rokid" oder einen Sprachbefehl analysiert das System ein Foto und gibt Hintergrundinformationen zum Erkannten aus. Rokid GlassesEin zentrales KI-Feature ist die Objekterkennung Allerdings ist das verwendete Modell offenbar eine kompakte Variante ohne zuverlässige Internetrecherche, weshalb die Antworten zwar flüssig formuliert wirken, aber nicht durchgängig korrekt sind. In Einzelfällen liefert die KI Bestätigungen für Vorgänge, die so nicht stattgefunden haben, etwa beim Versand vermeintlich aufgenommener Fotos an einen Kontakt. In diesem Sinne gilt: Vertrauen ist gut, Kontrolle ist besser.

Navigation, Übersetzung und Teleprompter

Wo das Display tatsächlich einen klaren Mehrwert bietet, sind an­wen­dungs­orien­tier­te Funktionen. Die Navigation blendet am unteren Rand des Sichtfelds Abbiegehinweise, eine geschätzte Ankunftszeit und eine schematische Minikarte der Umgebung ein. Im Fußgängermodus ist das ziemlich praktisch, weil der Blick nicht ständig zwischen Smartphone und Umgebung wechseln muss. Beim Autofahren lenkt die Funktion hingegen eher ab, wir würden sie deshalb auch nicht empfehlen. Rokid GlassesAuf dem Fahrrad und dem Auto lenkt das Display durchaus (zu sehr) ab Die Übersetzungsfunktion unterstützt nach Herstellerangabe 89 Sprachen, sofern eine Online-Verbindung besteht. Für eine kleinere Auswahl steht zudem eine Offline-Variante bereit, was insbesondere auf Reisen nützlich sein kann. Die Echtzeitübersetzung gesprochener oder gefilmter Inhalte funktioniert dem Grunde nach, kann aber in der Praxis darunter leiden, dass sich Satzteile noch während der Anzeige verändern, der Text springt oder die Lesegeschwindigkeit nicht zur tatsächlichen Sprechgeschwindigkeit passt.

Eine durchweg überzeugend umgesetzte Funktion ist der Teleprompter. Über die App lädt man einen Text hoch, der dann beim Vorlesen automatisch in passendem Tempo durch das Sichtfeld rollt. Die Spracherkennung erfasst, wie weit der Sprecher im Text ist, und scrollt entsprechend mit. Rokid GlassesDas Teleprompter-Feature ist praktisch für alle, die viele Präsentationen halten Für Vorträge, Präsentationen oder Videoaufnahmen ergibt sich daraus ein konkreter, alltagstauglicher Nutzen. Ergänzend lassen sich mit der Tran­skrip­tions­funktion ganze Meetings mitschneiden, in Sprecherabschnitte unterteilen und anschließend zusammenfassen.

Kamera und Audio

Für Foto- und Videoaufnahmen verbaut Rokid einen 12-Megapixel-Sensor vom Typ Sony IMX681 mit einer Blende von f/2,25. Videos sind in Auflösungen bis 3K bei 30 Bildern pro Sekunde möglich, in 720p auch mit 60 Bildern pro Sekunde. Bemerkenswert ist die Flexibilität bei den Formaten, denn man kann sowohl Hoch- als auch Querformat nutzen, ebenso ein 4:3-Seitenverhältnis. Die maximale Videolänge liegt übrigens bei zehn Minuten.

Rokid zeigt die unterschiedlichen Anwendungsfälle seiner AR-Brille

Die Bildqualität reicht für spontane Aufnahmen aus der Ich-Perspektive und für KI-Bilderkennung mehr als aus. Im direkten Vergleich mit den Meta-Brillen (zweite Generation) zeigt sie sich allerdings nicht ganz auf demselben Niveau: Farben wirken teils zu kräftig gesättigt, in schwierigen Lichtverhältnissen geht Dynamikumfang verloren.

Dazu kommt, dass Wind den Ton in Außenaufnahmen schnell unbrauchbar machen kann. Eine kleine Animation auf dem Display zeigt vor der Aufnahme den Fokusbereich, und nach dem Auslösen lässt sich eine Vorschau einblenden, um den Bildausschnitt zu prüfen. Eine LED neben dem linken Glas signalisiert das Aufzeichnen.

Der Ton wird über offene Lautsprecher in den Bügeln ausgegeben. Die Qualität ist für ein Open-Ear-Konzept ordentlich, reicht jedoch natürlich nicht an In-Ear-Kopfhörer heran. Bei lauter Umgebung stoßen die Lautsprecher an ihre Grenzen, und schon ab mittlerer Lautstärke ist die Wiedergabe für Personen in un­mit­tel­ba­rer Nähe hörbar - ein Punkt, der je nach Empfinden und Einsatzort als störend wahrgenommen werden kann. Insgesamt vier Mikrofone mit KI-gestützter Geräusch­unter­drückung sind für Telefonate und Sprachbefehle vorhanden.

Rokid GlassesRokid GlassesRokid GlassesRokid Glasses

Akku und Laden

Der wohl kritischste Punkt der Rokid Glasses ist die Akkulaufzeit. Der verbaute Akku fasst 210 mAh, was der Hersteller mit einer Laufzeit von bis zu sechs Stunden angibt. Im realen Einsatz fällt diese Angabe aber deutlich geringer aus.

Bei intensiver Nutzung mit dauerhaft aktivem Display, Navigation oder Teleprompter sind eher knapp zwei Stunden zu erwarten. Bei zurückhaltender Nutzung kann man die Laufzeit zwar in Richtung eines vollen Tages strecken, doch sobald die anspruchsvolleren Funktionen häufiger zum Einsatz kommen, ist regelmäßiges Nachladen erforderlich.

Geladen wird über ein magnetisches Kabel mit Pogo-Pin-Anschluss am Bügelende, das sich auch im aufgesetzten Zustand verwenden lässt. Ein Ladeetui gehört bei Rokid nicht zum Lieferumfang. Stattdessen lässt sich ein optionales Case für rund 99 Euro nachkaufen, das bis zu zehn vollständige Aufladungen ermöglichen soll. Dass beim Listenpreis von rund 699 Euro keine vollwertige Ladelösung beiliegt, dürfte für viele Käufer schwer nachzuvollziehen sein.

Unser Fazit zu den Rokid Glasses

Die Rokid Glasses sind zweifellos ein spannendes Produkt und der Hersteller kommt damit auch Meta zuvor, zumindest in Hinblick auf die Display-Variante. Ist es ein Gamechanger? Das eher nicht.

Die Brille kombiniert mehrere Funktionsbereiche - KI-Assistent, Kamera, offene Lautsprecher, Mikrofone und ein in das Sichtfeld eingeblendetes Display - in einem vergleichsweise leichten Formfaktor. Doch wie so oft gilt: Sie macht vieles, aber nichts wirklich gut. In den einzelnen Disziplinen gibt es spezialisierte Geräte, die mehr leisten: Kopfhörer bieten besseren Klang, Smartphones bessere Kameras, dedizierte KI-Aufnahmegeräte ausgereiftere Transkription. Rokid GlassesÜbersetzungen beherrschen die Rokid Glasses natürlich auch Klare Stärken bestehen in der Modellwahl bei der KI, im funktional gut umgesetzten Teleprompter, der echten Mehrwert bietet, in der unmittelbar verfügbaren Navigation im Sichtfeld und in den flexiblen Aufnahmeoptionen der Kamera. Ebenso klar zu benennende Schwächen sind die unzureichende Akkulaufzeit unter alltäglicher Belastung.

Wer den Mehrwert eines integrierten Head-up-Displays in einer alltags­tauglichen Brille schätzt und die noch typischen Kinderkrankheiten einer jungen Produktkategorie zu akzeptieren bereit ist, erhält mit den Rokid AI Glasses einen technisch ambitionierten und in seinem Segment derzeit weitgehend konkurrenzlosen Vorboten dessen, was smarte Brillen in den kommenden Jahren leisten könnten.

Aber man sollte sich im Klaren sein, dass "Vorbote" nicht Perfektion bedeutet. Denn immer wieder denkt man sich, vor allem in Bezug auf das Display: Das wäre verdammt cool, wenn es etwas besser funktionierte.

Würdet ihr euch eine smarte Brille mit integriertem Display holen, oder reicht euch der reine Audio-Ansatz für den Alltag aus? Teilt eure Meinung dazu gerne mit uns in den Kommentaren. Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!