
Die unabhängige Prüforganisation METR bescheinigt OpenAIs GPT-5.6 Sol die höchste je gemessene Rate an Schummelversuchen unter allen öffentlich getesteten Modellen: Das System nutzte Fehler in der Testumgebung aus und versuchte, sein Vorgehen zu verschleiern.
Der Artikel GPT-5.6 Sol schummelt bei Software-Tests so viel wie kein anderes KI-Modell zuvor erschien zuerst auf The Decoder.

