Selbst die besten KI-Modelle scheitern an visuellen Aufgaben für Kleinkinder

Vier farbige Hände bearbeiten Spirograph-Kreise, ein Labyrinth, ein 3D-Puzzle und quadratische Formen.

Eine neue Studie zeigt eine fundamentale Schwäche aktueller KI-Systeme. Selbst die leistungsstärksten multimodalen Sprachmodelle versagen bei grundlegenden visuellen Aufgaben, die Kleinkinder mühelos bewältigen.

Der Artikel Selbst die besten KI-Modelle scheitern an visuellen Aufgaben für Kleinkinder erschien zuerst auf The Decoder.