Special: Zusammen das Datacenter weiterentwickeln Secure IT für Unternehmen

Reasoning Fail: Gängige LLMs scheitern an kinderleichter Aufgabe

Alle Heise-Foren heise online Kommentare Reasoning Fail: Gängige LLMs… Re: M + 1

- 
- Beitrag
- 
- 
- Threads
- 

Ansicht umschalten

unbekannter Benutzer

mehr als 1000 Beiträge seit 30.05.2024

12.06.2024 07:21

Permalink
Melden

Re: M + 1

GPT-4o wurde multimodal trainiert (mit Bildern, vermutlich auch Bildern von Kaffeetassen)

Zählt man die Nervenfasern zum menschlichen Cortex, so sind das ungefähr:

• 40 % S1 für Touch
• 40 % V1 für Vision
• 10 % A1 für Audition

Zerlegt man Vision noch in 25 % Pixel und 15 % Bewegung, dann ist GPT-4o erst zu 35 % multimodal. Da ist noch viel Luft nach oben zu den 100 % bei Menschen.

Bewerten

- +

Thread-Anzeige einblenden

- 
- Beitrag
- 
- 
- Threads
- 

Ansicht umschalten

Nutzungsbedingungen

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}

${intro} ${title}

Re: M + 1