Eine Studie des „ML Alignment & Theory Scholars“-Programms (MATS) und von Apollo Research zeigt, dass Sprachmodelle überraschend zuverlässig erkennen können, ob ein Gespräch oder eine Agenten-Interaktion Teil eines Tests ist oder im realen Einsatz stattfindet.
Der Artikel KI-Modelle durchschauen Testsituationen – und passen ihr Verhalten an erschien zuerst auf THE-DECODER.de.