Rabbit R1 im Test: Doch keine Katastophe?

Das KI-Gadget Rabbit R1 wurde gehypt, dann in Grund und Boden kritisiert und sogar als "Scam" bezeichnet. Doch laut c't 3003 ist die Wahrheit komplizierter.

In Pocket speichern vorlesen Druckansicht 23 Kommentare lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 17 Min.
Von
  • Jan-Keno Janssen

Das knallige KI-Gadget Rabbit R1 gilt als Superflop. c't 3003 hat sich das Gerät mal genauer angeschaut.

(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)

Guckt mal hier, wie nice sieht bitte dieses Gadget aus? Allein die Farbe, oder? Und dann auch noch so ein nettes Kaninchen! Ach, herrlich! Ja, das ist der Rabbit R1 und der verspricht, dass man damit das Internet und Apps komplett in natürlicher Sprache bedienen kann. Und zwar sogar mit komplexen Anweisungen, also sowas wie: "Bestell mir mal bitte die gesündeste Pizza, die in weniger als 30 Minuten bei mir sein kann." Ja, das Ding verspricht, uns nervige Tipp- oder Klick-Arbeit abzunehmen, also das, was wohl die meisten von uns hassen: erstmal gucken, welche Pizzadienste liefern, wie lange das dauert und so weiter und so fort. Möglich machen soll es ein "Large Action Model" (LAM), also ein KI-Modell, das mit Websites und Apps interagieren und hier Aktionen auslösen kann, deshalb "Action".

Also, erstmal gute Idee, aber wenn ihr häufiger mal auf Tech-YouTube unterwegs seid, dann wisst ihr vielleicht schon: Das Teil hat ganz große Probleme, sogar von Scam ist die Rede. Aber: So schwarz-weiß ist die Welt nicht, sondern die Wahrheit hat ein paar Graustufen (oder besser gesagt Orangestufen). Bleibt dran!

Liebe Hackerinnen, liebe Internetsurfer, herzlich willkommen hier bei …

So, also der Rabbit R1, der hat ja mächtig Welle gemacht im Januar auf der CES-Messe in Las Vegas. Die hatten nicht mal einen eigenen Messestand, sondern halt nur ein paar Journalisten auf eine Suite eingeladen und ein Keynote-Video ins Netz gestellt. Und das hat viele Leute echt beeindruckt, unter anderem mich. Weil das Konzept zumindest nicht komplett aus der Luft gegriffen war und sich technisch möglich anhörte.

Naja, und dann gab es zwischendurch noch ein anderes sehr gehyptes KI-Gadget, nämlich den AI Pin von Humane. Und das Ding kam kurz vor dem Rabbit auf den Markt und zwar so kaputt, dass da wohl nichts mehr zu holen ist. Marques Brownlee hatte seinen Videotest zu dem AI Pin betitelt mit "Das schlechteste Produkt, das ich je getestet habe – bis jetzt".

Ja, und der Negativ-Hype um den AI Pin, den hat der Rabbit R1 auch ein bisschen erwischt – weil das ja auch so ein neuartiges KI-Gadget ist. "Eigentlich nicht testfähig" hieß Marques’ Video dazu Mitte April.

Der YouTuber Coffeezilla hat dann später zwei ziemliche Zerstörungsvideos dazu veröffentlicht, beide mit dem Ergebnis, dass der Rabbit ein Scam ist, Betrug.

Jo, und nun ist das Teil auch bei uns angekommen. Zwei Geräte haben wir in der c’t-Redaktion und was man schon mal sagen kann: Wir gehen da nicht zu 100 % mit, dass das Betrug ist.

Aber der Reihe nach, lasst uns mal erstmal angucken, was wir da für 198,90 Euro inklusive Versand gekauft haben. Also erst einmal muss ich hier wirklich nochmal deutlichst das ganze Hardwaredesign loben: Das Teil sieht nicht aus wie irgendwas, was man kennt. Also nicht wie ein Smartphone, nicht wie eine Spielkonsole – das ist irgendwie was Eigenes. Ok, und was man wahrscheinlich sehen kann: Das ist von Teenage Engineering designt aus Schweden, die haben auch schon das Playdate gestaltet, diese Minikonsole. Wenn man das weiß, erkennt man die Verwandtschaft sofort. Der Flipper Zero hier mit der orangen Hülle ist übrigens nicht von Teenage Engineering, aber der passt da ganz gut rein, in meine orangene Gadgetsammlung.

Apropos Orange: Also, das ist so ein knalliges Orange, die Farbe finde ich richtig nice. Witzig ist, dass die Farbe wirklich offiziell LEUCHTORANGE heißt, also deutsch, also überall auf der Welt, so steht es international auch drauf. Ich weiß gar nicht, wie Amerikaner das aussprechen würden, "Leuktorängsch"?

Und was ich auch sehr schön finde, ist diese Hartplastikhülle, in der das Teil drin ist und das man als Case verwenden kann. Kann man damit sogar so hinstellen.

Ja, und dann beim ersten Einschalten diese schönen Animationen mit dem Kaninchen im Hamsterrad. Also haltet mich für oberflächlich, aber für mich sieht so kein Scam aus – da steckt einfach zu viel Liebe drin. Ja, und auch die Ersteinrichtung funktioniert wirklich elegant und durchdacht. Ich weiß aus Erfahrung: Wenn eine Firma das so hinbekommt, dann ist da mindestens ein bisschen Enthusiasmus und Liebe eingeflossen.

Ist der Rabbit dann geupdatet und hochgefahren, merkt man: Ok, krass, ich kann den nicht mit dem Touchscreen bedienen, diese Rolle hier macht nichts – muss man wohl reinsprechen. Und das steht da auch auf dem Case: PTT, also Push-to-Talk, so Walkie-Talkie-mäßig: Drückt man da drauf, stellt das Kaninchen die Ohren auf, lässt man los, entspannen die Ohren wieder. Finde ich sehr gelungen.

Ja, aber jetzt fängt der tolle Ersteindruck schnell an zu bröckeln. Obwohl ich bei der Ersteinrichtung Deutschland als Standort auswählen konnte und alle Sprachmodelle problemlos Deutsch beherrschen, will der Rabbit nur auf Englisch angesprochen werden. Spricht man Deutsch, ignoriert er die Befehle komplett. Und wenn man dann auf Englisch nach dem Wetter fragt, erkennt er zwar den Standort in Deutschland, gibt aber alles nur in Fahrenheit an. Wenn ich dann sage (also auf Englisch) "Bitte ab jetzt IMMER nur alles in Grad Celsius und metrischen Einheiten machen", meldet er brav: "Ja, ok, mach’ ich jetzt." Und dann geht das ungefähr dreimal und dann fällt er wieder zurück zu Fahrenheit und imperialen Einheiten.

Fragt man "Kannst du Fotos machen?", kommt als Antwort: "Nee, ist aus Sicherheitsgründen deaktiviert." Ich musste dann erst im Netz nachschauen, dass man für den Fotomodus doppelt den Anschaltknopf drücken muss. Ja, und dann kann man aber auch Fotos machen. Selfie- und Rückfahrkamera lassen sich mit der Walze hier motorisch umschalten, das ist cool. Die Bildqualität ist aber so ungefähr wie ein Billighandy vor vielen Jahren. Naja, was aber zumindest cool ist: Ich kann Sachen fragen, was der Rabbit sieht. Also: "Wie viele Bananen sind auf dem Foto?", "Was ist das?" und "Wie repariere ich das?" Aber ja, hmm, das geht natürlich auch mit ChatGPT und Google Gemini und anderen multimodalen Sprachmodellen, das ist jetzt kein wirkliches Alleinstellungsmerkmal.

Alles, was man mit dem Rabbit macht, landet im sogenannten Rabbithole, das ist quasi die Steuerungswebsite oder das Archiv. Die Fotos landen hier per Default als Magic-Kamera-Bild, das ist ganz nett: Da sieht nämlich alles aus wie aus einem Computerspiel. Letztendlich werde ich aber das Gefühl nicht los, dass das nicht nur charmant sein soll, sondern auch über die schlechte Bildqualität hinwegtäuschen soll – denn die Magic-Kamera-Bilder sehen immer besser aus als die Originalen. Hier mal ein paar Beispiele.

Ja, und ansonsten kann man auch noch übersetzen. Da können die Sprechenden immer das Gerät weitergeben und halt so Push-to-Talk-mäßig reinsprechen, und das klappt toll – also besser als das klassische Google Translate zum Beispiel, unserer Meinung nach. Wenn man das viel benötigt, also viel reist – dafür ist das Teil wirklich geeignet, gerade wenn man nicht immer das eigene Handy weitergeben will, wo ja viele wichtige Daten drauf sind. Außerdem noch an Bord: ein Sprachrekorder mit automatischer Transkription plus Zusammenfassung.

Ja, ok, aber jetzt kommt das Problem: Das war's auch schon fast mit den sinnvollen Dingen. Und alles sind keine Sachen, die anders nicht auch gingen. Aber was ist denn jetzt mit diesem Large Action Model?

Also man kann halt in diesem Rabbithole Accounts hinterlegen, das ist also zurzeit:

Spotify, Apple Music für Musik, Uber für Fahrdienste, DoorDash für Essen bestellen und Midjourney und Suno für generative KI. In Deutschland funktionieren sowohl Uber als auch DoorDash nicht. Das heißt, ich kann halt per Sprache Midjourney-Bilder generieren oder Spotify-Musik abspielen. Aber, ey, Spotify kann ich auch mit meinem Amazon Alexa, Siri oder Google Assistant bedienen, das ist ja nun ein echt alter Hut. Wozu soll man das brauchen? Ich hatte kurz gedacht, dass halt diese "Intelligenz" irgendwie praktisch wäre, dass der sehr spezifisch Lieder aussucht, also zum Beispiel "Spiel mal ein Lied einer weiblichen Sängerin, deren Nachname mit F anfängt und die einen Nummer 1 hatte" – spielt der Rabbit Frankie Goes to Hollywood. Ja, ok. Das wirkt alles wie ein Proof-of-Concept, damit man schon mal irgendwas hat, mit dem der Rabbit interagieren kann. Geplant war ja ursprünglich so ein Lernmodus, der noch nicht da ist. Damit soll man dem LAM einfach was beibringen können, indem man die Website bedient. Anschließend erklärt man noch, was man gerade gemacht hat: "Ich habe ein blaues iPhone in den Amazon-Warenkorb gelegt." Danach soll es dann bei Amazon einkaufen können.

Aber da ist Rabbit noch lange nicht. Und ich weiß auch nicht, ob sie da jemals hinkommen.

Interessant ist auch, dass Dienste ja vielleicht auch nicht unbedingt wollen, dass sie von einer KI bedient werden.

Wir hatten das zum Beispiel mehrfach im Test mit dem Rabbit R1, dass uns Spotify eine Mail geschrieben hat: "Um dein Spotify-Konto zu schützen, haben wir dein Passwort zurückgesetzt. Bitte neues Passwort erstellen." Das kann aber auch mit der etwas problematischen Sicherheit zu tun haben.

Wo wir jetzt aber ein bisschen in Scam-Territory kommen, ist halt, wie genau die Logins darauf verwaltet werden. Also, wenn man in diesem Rabbithole Accounts connecten will, dann öffnet man wirklich einfach per Fernzugriff auf einem Rechner bei Rabbit ein Browserfenster und soll da dann Login und Passwort eintippen. Also, dass das Fernzugriff ist, sieht man hier mit den Entwicklertools im Browser. Jau, das ist NoVNC. Und sehr kurios: Man kann vom Spotify-Login über Google tatsächlich auf dem fremden Rechner auf die Suchabfrage kommen. Wenn ich da jetzt eintippe "Where am I", kriege ich die Meldung: Oregon, USA. Ok, alles klar, interessant. Warum das problematisch ist, habe ich mal c’t-Sicherheitsexperte Ronald Eikenberg gefragt:

O-Ton Ronald (kein Transkript).

Ok, verstehe ich, danke. Sicherheitsmäßig schon mal schwierig alles.

Also, was halt auch noch eine weitere Sache ist, die ein Scam-Vorwurf ist: Dass es nie ein Large Action Model gab, sondern dass der Rabbit R1 über die Open-Source-Browser-Automatisierungs-Bibliothek Playwright einfach Skripte ausführt. Playwright ist von Microsoft entwickelt und ist gedacht zum Browser-Testen und Webscrapen. Ja, und das ist tatsächlich jetzt eine schwierige Diskussion: Wenn der Rabbit auf Websites Dinge tut, dann muss das ja irgendwie konkret stattfinden und ja, das kann man halt mit Playwright machen – es ist ja durchaus denkbar, dass die KI die Playwright-Skripte tatsächlich je nach Einsatz dynamisch generiert, also nicht einfach stumpf vorgeschriebene Skripte abfährt, sondern diese Skripte selbst baut.

Und generell stellt sich die Frage: wozu überhaupt die Hardware? Denn: Es ist inzwischen sicher, dass auf dem Rabbit einfach Android läuft – das heißt, das Ding könnte auch einfach eine App auf eurem Handy sein, Kamera, Mikrofon, Display und Lautsprecher sind da ja auch drin.

Ja, ok, schwierig. Das Rabbit R1 ist auf jeden Fall ein Gerät, das auch nicht computeraffine Leute gerne in die Hand nehmen und damit rumspielen – und schnell checken: Ich drücke diese Taste und spreche da rein, mehr muss man nicht machen. Ich hab das mit Kleinkindern ausprobiert, die hatten da direkt total Freude mit. Anders als ein Smartphone, was erstmal viel verwirrender ist, gerade auch, wenn man zum Beispiel nicht lesen kann. Diese super geringe Zugänglichkeitshürde hat in meiner ganz persönlichen Zeugniskonferenz schon mal eine gute Note verdient. Das Problem ist nur: Man kann damit halt nicht viel machen. Also man kann halt die KI – was offenbar zurzeit GPT-4o ist – per Sprache abfragen und irgendwelche Sachfragen stellen oder die halt Geschichten ausdenken lassen. Aber das geht halt mit der ChatGPT-App exakt genauso. Obwohl einen Unterschied habe ich gefunden: Rabbit zeigt manchmal Bilder an, die zur Frage passen, das macht die ChatGPT-App nicht und Google Gemini auch nicht. Wirklich sinnvoll könnte die Übersetzer-Funktion sein. Die kann man zwar mit Gemini oder ChatGPT auch benutzen, dafür muss man aber immer dazu sagen "Bitte übersetze den nachfolgenden Satz von Spanisch nach Deutsch: xy". Bei Rabbit kann man einfach drauflosplappern, das ist in der Praxis deutlich einfacher.

Aber ansonsten haben wir wirklich keine sinnvollen Anwendungsgebiete gefunden. Ok, Uber bestellen oder Essen ist praktisch, aber geht ja hierzulande leider nicht. Und: Bilder generieren und Musik abspielen kann man halt mit etlichen Tools, da braucht man jetzt keinen Rabbit.

Und natürlich ist das ganze Sicherheitsthema ein Problem, also, ich muss sagen, dass ich zum Beispiel für Spotify nicht meinen echten Account hier genommen habe, sondern extra einen neuen für den Test hier gemacht habe. Midjourney das Gleiche. Also ich würde, Stand heute, da nicht meinen Google-, Facebook-, Apple-Account eintippen.

Also: Ob das ein lohnenswertes Gadget ist, steht und fällt halt mit der Frage: 1. Kriegt Rabbit die Sicherheit in den Griff und 2. Kriegt Rabbit das in den Griff, dass man damit sinnvolle Sachen machen kann? Die Wahrscheinlichkeit, ob beides eintrifft, ja, die kann ich nicht beurteilen.

Ich weiß nur: Sollten alle Stricke reißen, kann man auf dem Ding einfach Android installieren, LineageOS unterstützt zum Beispiel schon den R1 – und wer ein Smartphone haben will, was echt ungewöhnlich aussieht, ja, der ist da dann an der richtigen Adresse. Es ist übrigens ein SIM-Karten-Slot eingebaut, also man kann das Ding echt nutzen als Telefon. Akkulaufzeit ist voraussichtlich nicht die allerbeste, aber der Rabbit R1 hält im angeschalteten Zustand, aber mit deaktiviertem Display, ungefähr drei Tage durch, das ist ok – und deutlich besser als in den ersten Tests vor einigen Monaten. Es tut sich also was in Sachen Softwareupdates.

Und es ist halt auch so, dass man für ähnliche Funktionalität bei OpenAI oder Google halt ein kostenpflichtiges Abo braucht – das ist bei Rabbit, zumindest zurzeit, nicht notwendig, im Kaufpreis ist das alles inklusive. Also man bekommt für unter 200 Euro ein interessant aussehendes Gadget, mit dem man auf Englisch sprechen und das man zu einem Smartphone umbauen kann. Also das klingt für mich jetzt nicht nach einem Totalausfall, aber ja gut, ich sage mal, die Zielgruppe dürfte jetzt nicht riesig sein. Aber vielleicht wollt ihr euch ja eure Social-Media-Sucht abtrainieren und ihr wollt ein kleines, nicht sonderlich smooth zu bedienendes Handy haben – dann könnte der R1 was für euch sein. Oder ihr braucht einen Simultanübersetzer.

Leute, Leute, Leute, kurzer Einschub: Wir brauchen eure Hilfe. Wir machen nämlich ein Video über Videos. Wir machen ein Video, in dem wir die Videoqualität von Smartphones beurteilen. Und da würden wir uns freuen, wenn ihr auf die Website geht, die wir vorbereitet haben. Link ist unten in der Beschreibung. Und wenn ihr da einfach euch mal die Videos anguckt und die bewertet, dauert maximal 10 Minuten. Ich habe es neulich auch in 5 Minuten geschafft. Also würden wir uns freuen, wenn ihr mitmacht!

Ja, wie seht ihr das? Könnt ihr euch noch sinnvolle Anwendungsbereiche für den Rabbit vorstellen? Oder ist das für euch Elektroschrott? Gerne in die Kommentare schreiben und abonnieren natürlich!


c't 3003 ist der YouTube-Channel von c't. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen und Lukas Rumpler sowie die Video-Producer Şahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.

(jkj)