Microsofts Copilot sieht im Browser Edge nun, was du siehst

Mit Copilot Vision bekommt Microsofts Browser Edge nun Augen. Die neue KI-Funktion ist frei verfügbar – für ausgewählte Seiten.

vorlesen Druckansicht 31 Kommentare lesen
Startseite Copilot-Vision.

(Bild: Microsoft)

Lesezeit: 2 Min.
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Microsofts KI-Chef Mustafa Suleyman schwärmt bei Bluesky darüber, dass Copilot Vision nun für Edge verfügbar ist. Das sei "ziemlich aufregend". Mit der Funktion kann der Browser sehen, was der Nutzer sieht – das gilt freilich nur für den Bildschirm und in Wahrheit auch nur für einige ausgewählte Webseiten.

Um den Copilot Vision zu nutzen, muss man zustimmen beziehungsweise ihn aktivieren, er ist standardmäßig ausgeschaltet. Eine erste ähnliche Funktion von Microsoft namens Recall war auf massive Proteste gestoßen, weil die Idee einer dauerhaft mitschauenden KI von Menschen nicht goutiert wurde.

Videos by heise

Suleyman schreibt, mit dem Copilot Vision könne man nun gemeinsam mit der KI über das sprechen, was man sieht. Es benötige keine umfangreichen Erklärungen oder Copy-Pasting mehr. Die Funktion findet sich im Browser hinter dem Copilot-Mikrofon-Symbol als Brillen-Symbol. Sie funktioniert allerdings nicht überall. Microsoft nennt die ausgewählten Partner: Das sind zunächst Wikipedia, Amazon, OpenTable, TripAdvisor und ein paar weitere, die es in der EU nicht gibt.

Tatsächlich haben andere KI-Anbieter bereits ähnliche Funktionen in petto, die deutlich weitreichender funktionieren. Googles Gemini Live etwa kann nicht nur das sehen, was auf dem Bildschirm eines Smartphones zu sehen ist, sondern auch das, was man durch die Kamera sehen kann. Die Funktion gibt es allerdings nicht für alle Geräte.

OpenAI bietet den Advanced Voice Mode an, der im Grunde denselben Funktionsumfang hat. Meta kann mit Meta AI etwa dank der Ray-Ban-Brillen sehen, was der Träger sieht und darauf reagieren.

Microsoft bietet auch für Windows-Insider bereits eine Copilot-Vision-Funktion an. Dort kann die KI Inhalte aus geöffneten Dateien und dem Browser analysieren. Auch hier klickt man auf das Brillen-Zeichen. Die visuelle Suche bekommen zunächst nur Menschen in den USA. Eine erweiterte Suche, die ebenfalls auf KI beruht, wird derzeit weltweit für Windows-Nutzer verfügbar gemacht.

(emw)