ChatGPT Search und die Zukunft der Websuche

Google bekommt Konkurrenz: ChatGPT Search will mit KI-Antworten und Websuche punkten. c’t 3003 hat die neue Funktion getestet – mit überraschenden Ergebnissen.

In Pocket speichern vorlesen Druckansicht 18 Kommentare lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 18 Min.

Ist Googles Zeit als Suchmaschinenkönig vorbei? Mit ChatGPT Search bringt OpenAI eine KI-gestützte Websuche, die aktuelle Ergebnisse liefert und Quellen verlinkt. Doch wie schlägt sich die Funktion im Alltag? Und ist sie besser als Google oder Perplexity? c’t 3003 hat die KI getestet und untersucht, wie die Wahl der Quellen – von Heise bis Bild – die Antworten beeinflusst.

Transkript des Videos

(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)

Guckt mal hier, ChatGPT kann jetzt besser im Internet suchen als ich, also zumindest deutlich schneller. Als ich zum Beispiel neulich wissen wollte, wer eigentlich die OLED-Panels in aktuellen Samsung-Fernsehern herstellt, bin ich mit Google irgendwie nicht so richtig gut weitergekommen. Ich hätte auf jeden Fall mehrere Artikel lesen müssen, um dann vielleicht irgendwann eine konkrete Antwort zu finden. Das neue ChatGPT Search hat mir dann aber meine Frage wirklich ganz konkret beantwortet: Samsung stellt einige Panels selbst her und kauft andere vom Erzrivalen LG. Und da steht dann sogar genau, in welchen Fernsehern was drinsteckt. Das hätte mich normalerweise wirklich ziemlich viel Googelei gekostet.

Oder ein anderes Display-Beispiel: Wer stellt eigentlich die Displays in der Apple Vision Pro her? Zack, Sony. Quelle? Heise Online. Interessant. Einerseits, weil das natĂĽrlich super sinnvoll ist, dass man da so mit der Maus drĂĽber hovern kann und dann direkt weiĂź: Aha, Heise Online, also offenbar nicht halluziniert. Aber auch interessant, wie eigentlich ChatGPT entscheidet, welche Quellen genutzt werden und welche nicht, also was die Wahrheit ist und was nicht. Und ob ChatGPT jetzt eigentlich besser funktioniert als Perplexity. Und was OpenAI alles falsch macht. Bleibt dran.

Liebe Hackerinnen, liebe Internetsurfer, herzlich willkommen hier bei …

Also, ChatGPT kann ja schon länger auf das Internet zugreifen. Webbrowsing hieß das damals und konnte in ChatGPT manuell aktiviert werden. So richtig gut funktioniert hat das aber nie und wurde sogar zeitweise mal abgeschaltet. Ein Grund dafür war, dass sich ChatGPT so an den Bezahlschranken auf Websites vorbeigeschlichen hatte. So, und jetzt ist die Beta-Phase von SearchGPT vorbei. OpenAI integriert die Websuche direkt in ChatGPT, und das Ganze heißt jetzt einfach ChatGPT Search.

Aktuell muss man dafür ein zahlungspflichtiges Abo haben. Aber ChatGPT sagt, dass sie das auch bald für die kostenlosen Accounts freischalten. Dass OpenAI damit wirklich ein bisschen im Schilde führt, Google zu ersetzen, zeigt diese Chrome-Erweiterung hier. Damit wird ChatGPT nämlich eure Standardsuchmaschine, und ihr könnt eure Frage direkt in das Adressfeld eingeben. Ihr landet dann in ChatGPT statt in Google.

Warum ist das jetzt eigentlich alles so ein Big Deal mit dieser Internetsuche? Internet ist doch ein alter Hut. Ja, weil das Wissen von diesen großen Sprachmodellen halt einen sogenannten Cut-Off-Point hat. Es muss ja an einem Punkt eingefroren sein. Deshalb ist es natürlich super wichtig, dass Sprachmodelle sich in quasi Echtzeit auf den neuesten Stand bringen können. Und das machen sie, indem sie im Internet suchen.

Wenn ihr diese Suche, also ChatGPT Search, direkt in ChatGPT verwenden wollt, könnt ihr einfach dieses Globus-Icon drücken. Das müsst ihr aber gar nicht, weil ChatGPT nämlich selbst erkennt, ob es sich um eine Internetsuchanfrage handelt oder um einen Prompt, der keine Websuche erfordert, der also aus dem eingefrorenen Gedächtnis quasi beantwortet werden kann. Und das hat in unserem Test schon ziemlich gut funktioniert. Manchmal ist es aber auch an einem ganz bestimmten Wort gescheitert. Hier zum Beispiel wollte ich einfach nur wissen, wer der aktuelle Bundespräsident ist. Durchaus sinnvoll, sowas nicht offline aus dem im Zweifel veralteten Trainingsdaten zu beantworten, sondern halt aktuell aus dem Internet. Jedenfalls hat meine Anfrage „Bundespräsident Deutschland“ keine Websuche ausgelöst. „Bundespräsident wer“ aber schon. Genauso wie die längere Frage „Wer ist der Bundespräsident von Deutschland?“

Heißt: Wenn ich wirklich eine Websuche möchte, macht es aktuell auf jeden Fall noch Sinn, das extra anzuklicken. Geht aber auch nachträglich, indem ich hier bei „Modell wechseln“ auf „Im Internet suchen“ klicke. ChatGPT Search ist so in die ChatGPT-Oberfläche integriert, dass es eigentlich so unauffällig nebenbei läuft. Während zum Beispiel Perplexity euch ja hier die ganzen Suchanfragen quasi in Echtzeit anzeigt – das poppt so auf – läuft das bei ChatGPT alles im Hintergrund. In der Antwort bekommt ihr aber sowohl bei Perplexity als auch bei ChatGPT die entsprechenden Quellen verlinkt. Und ein bisschen wie bei der Google-Suche bekomme ich die Quellen hier auch nochmal aufgelistet und zusätzlich nochmal Suchergebnisse zu meiner Frage.

ChatGPT Search ist übrigens von der Tendenz her schneller als Perplexity. Manchmal liegen beide von der Geschwindigkeit aber auch gleichauf. Auf jeden Fall sorgt die Online-Suche in ChatGPT auch wirklich für bessere Ergebnisse als das normale ChatGPT-Ergebnis. Hier zum Beispiel wollte ich wissen, wie ich bei Mario Party Jamboree das sechste Spielfeld freischalten kann. Also, ziemlich konkret. Ohne Internetsuche gibt mir ChatGPT total oberflächliche Larifari-Antworten, die mir halt überhaupt nix bringen. Und wenn ich dann aber die Online-Suche aktiviere, bekomme ich direkt eine ganz konkrete Antwort auf meine Frage.

Hinter jeder guten Antwort stehen bei ChatGPT Search, genauso wie bei den anderen KI-Suchmaschinen, natürlich gute Quellen. Also Websites. Deswegen hat mich jetzt vor allem mal interessiert, wie sich die Quellen eigentlich von denen unterscheiden, die mir Google anzeigt. Wir haben dafür ganz verschiedene Suchanfragen gestellt und dabei ist uns aufgefallen, dass sich die besten fünf Ergebnisse zwischen Google und ChatGPT Search je nach Thema schon stark unterscheiden können. Ich habe Google extra im Incognito Tab verwendet, damit mein bisheriger Suchverlauf keinen Einfluss auf die Suchergebnisse nimmt.

Hier bei dieser Frage zu Homeserver oder NAS sind die Top-Quellen bei ChatGPT Search Testberichte.de, FAZ, Chip und Ninja One. Google führt mich bei den Top-Ergebnissen hauptsächlich in Foren, genauso wie Perplexity, die aber zusätzlich auch bei technischen Sachen deutlich häufiger Heise Online anzeigen. Was ich natürlich gut finde, weil ich da arbeite und sowieso davon überzeugt bin, dass Heise Online eine gute und seriöse Quelle ist.

So, hier jetzt nochmal das ganz konkrete Beispiel vom Anfang des Videos: Ich will wissen, wer die Displays in der Apple Vision Pro baut. Ganz einfache Frage. Aber die Standardsuchmaschine Google kriegt das mal so gar nicht beantwortet. Wenn ich die komplette Frage eingebe, kommt da nur so unkonkreter Kram. Und wenn ich dann so typisch Google-mäßige Stichworte eingebe, also „Apple Vision Pro Displays Hersteller“, wird mir sogar meine Ursprungsfrage vorgeschlagen: „Who makes the display for the Apple Vision Pro?“ – auf Englisch, weil ich gerade Google auf Englisch benutze. Und da kommt dann einfach stumpf eine falsche Antwort, nämlich „Samsung“. Weil in dem Artikel, der da zitiert wird, geht es gar nicht um die aktuell erhältlichen Apple Vision Pros, sondern um die Gerüchte zu einer eventuell kommenden günstigeren Version. Also genau genommen einfach richtig falsch.

Die richtige Antwort wäre „Sony“. Und diese Antwort gibt auch ohne Umschweife ChatGPT Search. Als Quelle wird Heise Online genannt, ein Artikel von meiner lieben Kollegin Ulrike Kuhlmann. Interessanterweise nutzt ChatGPT sogar diese Quelle, also Heise Online, wenn man auf Englisch nach den Apple Displays fragt. Freut mich natürlich, dass Heise international offenbar als seriös wahrgenommen wird. Aber leider macht Perplexity meiner Meinung nach da noch einen besseren Job. Perplexity sagt auf die Frage, dass beim aktuellen Modell der Apple Vision Pro Sony die Displays herstellt – was ja richtig ist –, die aber sehr teuer sind – was auch richtig ist. Und deshalb wird gemunkelt, dass in der Budget-Variante, die eventuell irgendwann kommt, günstigere Displays von Samsung zum Einsatz kommen könnten. Das ist noch mehr, als ich mir eigentlich erhofft habe. Das ist eine sehr, sehr gute Antwort.

Ja, und der Vorteil an diesen Online-Suchen ist halt ganz klar, dass mir aktuelle Informationen angezeigt werden können. Also ganz banal kann ChatGPT jetzt einfach fragen, wie mein Lieblingsfußballverein gespielt hat, und bekommt dann das Ergebnis richtig angezeigt. Wenn ich hier nach der nächsten Bundestagswahl frage, bekomme ich bei ChatGPT Search natürlich den offiziellen nächsten Wahltermin angezeigt – im September –, aber auch den Hinweis auf die aktuelle Situation und dass der Bundeskanzler angekündigt hat, die Vertrauensfrage zu stellen, und damit der Wahltermin schon früher sein könnte. Also eigentlich richtig alles.

Aber es gibt auch ein paar ziemlich weirde Sachen. Hier ist zum Beispiel eine Quelle der Antwort der Bayerische Rundfunk. Und wenn man das anklickt, steht da aber „Börsengewinner“. Hä? Also BR ist ja nicht mal BG wie Börsengewinner. Das ergibt alles überhaupt keinen Sinn. Und was ich auch komisch finde: Wenn ich einfach nur nach der Bundestagswahl frage, dann werden mir drei Links angezeigt, wo ich aktuelle Entwicklungen sehen kann. Und das sind alles Medien vom Axel-Springer-Verlag, also Bild und Welt.

Warum das so sein könnte, dazu gleich mehr. Bei Perplexity werden auf jeden Fall als Quellen Tagesschau, ZDF und Wikipedia verwendet. Und was macht Google Gemini? Ja, die sind bei politischen Themen komplett raus. Google hat seinem Chatbot da quasi einen Maulkorb verpasst. Schon bei so banalen Fragen wie dem Datum einer Wahl schlägt das an. Da kommt dann einfach: „Zu politischen Fragen kann ich keine Antworten geben.“ Fragen nach einzelnen Politikern beantwortet Gemini natürlich auch nicht. Generell kann Gemini zwar aktuell Inhalte im Netz suchen, zeigt aber meistens keine Quellen an, was es in der Praxis wirklich ziemlich unbrauchbar macht.

Zurück zu den Fragen an die KI-Suchmaschinen: Ich weiß, das ist ein schwieriges Feld aktuell, aber wenn ich die KI-Suchmaschinen frage, wie denn eigentlich Robert Habeck so als Wirtschaftsminister ist, dann sind die Unterschiede relativ groß. Perplexity versucht hier, eine ausgewogene Antwort zu geben und bindet als Quellen Medien aus allen politischen Lagern mit ein. ChatGPT Search nutzt hier als Quellen Wikipedia, T-Online und Bild. Weitere Suchergebnisse mit anderen Medien, die auch eine andere politische Färbung haben, werden zwar angezeigt, aber nur als Suchergebnis. In die Antwort fließen die aber offenbar nicht ein, sondern nur die vier Quellen hier oben.

Und das ist auch absolut nicht das einzige Mal, dass ein Medium aus dem Axel-Springer-Verlag anderen Medienhäusern gegenüber bevorzugt wurde. Hier mal die Frage, was unsere Außenministerin so für einen Job macht. Da kommen als Quellen einmal Statista und zweimal Bild. Okay, also dass ChatGPT hier vor allem Axel-Springer-Medien anzeigt, ist ziemlich sicher kein Zufall, sondern das Ergebnis einer Partnerschaft, die der Verlag mit OpenAI vor einem Jahr abgeschlossen hat. Partnerschaft – was heißt das konkret? OpenAI zahlt Springer laut Financial Times jedes Jahr mehrere zehn Millionen Euro. Und das könnte auch damit zu tun haben, dass OpenAI Springer auch ein bisschen besänftigen will, weil da eventuell Urheberrechtsstreitigkeiten auf OpenAI zugekommen sind. Offenbar hat OpenAI Springer-Texte ausgewertet für KI-Training, zumindest für einige Zeit, obwohl Springer die OpenAI-Crawler verboten hat.

Crawler, also Skripte, die das Internet nach verwertbarem Material durchkämmen. Ich werde jetzt kein Fass mit meiner persönlichen Meinung über Springer aufmachen, sondern einfach nur ganz sachlich sagen: Alleine Bild hat im Jahr 2023 vom Deutschen Presserat 28 Rügen bekommen, vor allem wegen Verstößen gegen den Schutz der Persönlichkeit, gegen die Sorgfaltspflicht und gegen Wahrhaftigkeit und Menschenwürde. Also alleine deshalb könnte man darüber nachdenken, ob Bild eine gute Quelle ist. Man kann natürlich jetzt sagen: „Es ist halt ein Boulevardmedium, die arbeiten halt so.“ Ja, kann sein, von mir aus. Aber dann sollte OpenAI zumindest darauf achten, eine gewisse Ausgewogenheit zu haben. Also nicht nur Boulevard, sondern halt auch andere Quellen. Und das Gleiche gilt dann halt auch für die politische Ausrichtung: nicht nur Springer-Medien nutzen, die ja zumindest in Deutschland klar konservativ ausgerichtet sind, sondern eben auch Vielfalt. Zumindest in Deutschland geht da noch was, OpenAI.

Ich möchte übrigens hier jetzt nicht andeuten, dass OpenAI hier bewusst eine politische Färbung plant. Das scheint nicht so zu sein. So sind nämlich die anderen europäischen Medien, mit denen da Deals abgeschlossen worden sind, eher ein bisschen auf der anderen Seite des politischen Spektrums. Zum Beispiel El Pais in Spanien und Le Monde in Frankreich, die beide eher so Mitte-links stehen. Und ich gehe auch mal davon aus, dass OpenAI bei Springer auch nicht die deutschen Zeitungen so im Hinterkopf hatte, sondern dass es da auch um die amerikanischen Medien Business Insider und Politico geht, die ja inzwischen auch zu Springer gehören. So, aber jetzt wirklich eine ganz, ganz klare Aussage: Je wichtiger solche intelligenten Antwortmaschinen in unserem Alltag werden, desto wichtiger werden die Quellen. Also wer definiert, was Wahrheit ist? Ganz, ganz wichtig.

So, jetzt aber endlich wieder Nerd-Kram: Wenn ChatGPT Search diese Internetsuche verwendet, kann ChatGPT auch auf Websites gehen, die keine Deals mit OpenAI haben. Wie gesagt, heise.de kommt da ja auch mal vor, und heise.de hat auf jeden Fall Stand heute keinen Deal mit OpenAI. Dass Heise als Quelle auftaucht, ist ja auch von Heise durchaus gewünscht, denn schließlich bringt ja so eine Quellenangabe in ChatGPT potenziell Traffic auf Heise Online. Man kann das dann anklicken, wenn man mehr wissen will. Will man das nicht – also wollen Medien das alles nicht –, kann man in die Datei robots.txt auf dem eigenen Webserver „User-agent: OAI-SearchBot Disallow: /“ eingeben. Das bedeutet dann, dass dieser OAI-SearchBot, also diese Internet-Livesuche, verboten wird.

Das bezieht sich auch wirklich nur darauf: Wenn eine Website nicht will, dass quasi die Grund-KI, also das unterliegende Sprachmodell, mit den Inhalten von dieser Website trainiert wird, muss man bei „User-agent: GPTBot“ eintragen. Ich habe mal so eine kleine Stichprobe gemacht bei den großen deutschen Medienwebsites. Die haben alle den GPTBot ausgeschlossen, also den fürs Trainieren. Interessanterweise sogar Bild.de und Welt.de, obwohl die ja den Deal mit OpenAI haben. Okay. Aber den OAI-SearchBot, also für diese Echtzeitsuche, den hat zumindest bei meiner kurzen Stichprobe niemand ausgeschlossen. Das sehen deutsche Medien offenbar sehr differenziert: Quellen-Links ja, trainieren mit den eigenen Texten nein. Ist ja auch logisch: Medien haben ja nichts davon, wenn ihre Inhalte einfach ohne Quellenangabe in so ein Sprachmodell gegossen werden. Bei der Verwendung als Quelle gibt es ja zumindest die Chance, dass Leute dadurch auf die eigene Seite kommen.

So richtig habe ich ja nicht daran geglaubt, dass das klassische Googlen irgendwann vorbei sein könnte. Aber es ist wirklich praktisch, was da jetzt mit so GPT-artigen KI-Systemen und Echtzeit-Internet geht. Gerade wenn man sehr spezifische Fragen hat, war zumindest ich schon daran gewöhnt, dass man mindestens drei, vier Texte überfliegen musste, um eine befriedigende Antwort zu finden. Das geht jetzt halt automatisch. Und auch das Risiko von Falschinformation, also von Halluzinationen, ist hier ziemlich gering, weil man ja einfach so über die Quellen hovern kann und dann sehr schnell sieht, wo die Aussagen herkommen.

Und jetzt sagt ihr wahrscheinlich: „Hä, das ist doch exakt das, was Perplexity AI macht. Da hattet ihr doch auch schon mal ein Video dazu gemacht.“ Ja, das ist richtig, ganz klar. ChatGPT Search ist eine nahezu 1:1-Kopie von Perplexity. Man muss auch leider sagen, dass mir die Antworten von Perplexity zurzeit noch besser gefallen, weil sie differenzierter sind und ausführlicher.

Aber ChatGPT hat ja noch ganz viele andere Funktionen, zum Beispiel den extrem fortschrittlichen Sprachmodus, also Advanced Voice. Darüber hatten wir auch schon ein Video gemacht. Dieser Modus kann noch nicht aufs Internet zugreifen. Aber wenn das jetzt beides verbunden wird, wäre das wirklich ein riesiger Nützlichkeitsboost, weil man damit halt wirklich sehr kleinteilig arbeiten kann. Sowas wie einfach per Sprache sagen: „Mein Drucker druckt nicht mehr, finde mal bitte heraus, wie die Patronen heißen, die da drin sind, in Gerät XY. Ah, okay, sind die bei Geschäft XY vorrätig? Check das mal online. Haben die jetzt geöffnet? Ja, alles klar.“ Da kommen wir dann wirklich persönlichen Assistenzsystemen, mit denen man ganz normal sprechen kann und die richtig auf Zack sind, schon sehr, sehr nahe.

Wie ist das bei euch? Habt ihr schon mal ChatGPT Search ausprobiert? Seid ihr überzeugt von Perplexity? Oder sagt ihr: „Ey, ne, da will ich nichts mehr zu tun haben mit dem KI-Kram. Ich nutze weiter klassisch Google oder DuckDuckGo.“ Gerne in die Kommentare schreiben und natürlich gerne abonnieren. Tschüss!


c't 3003 ist der YouTube-Channel von c't. Die Videos auf c't 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c't Magazin. Die Redakteure Jan-Keno Janssen und Lukas Rumpler sowie die Video-Producer Şahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.

(rum)