Gemini 3 Pro und GPT-5 scheitern noch an komplexen Physik-Aufgaben

Ein neuer Benchmark namens „CritPt“ konfrontiert KI-Modelle mit physikalischer Forschung auf dem Niveau von Doktoranden. Die Ergebnisse zeigen, dass selbst führende KI-Modelle wie Gemini 3 Pro und GPT-5 weit davon entfernt sind, autonome Wissenschaftler zu sein.

Der Artikel Gemini 3 Pro und GPT-5 scheitern noch an komplexen Physik-Aufgaben erschien zuerst auf The Decoder.