
Große Reasoning-Modelle denken oft weit über die korrekte Lösung hinaus – mit Gegenproben, Umformulierungen und redundanten Bestätigungen. Eine neue Studie von Bytedance zeigt, dass die Modelle eigentlich wissen, wann sie fertig sind, die gängigen Sampling-Verfahren sie aber zum Weiterdenken zwingen.
Der Artikel Studie zeigt, warum Reasoning-Modelle oft weit über die Lösung hinausdenken erschien zuerst auf The Decoder.
