
METR kann Claude Mythos Preview mit bestehenden Tests kaum noch zuverlässig messen. Nur fünf von 228 Aufgaben decken den relevanten Fähigkeitsbereich ab. Parallel berichtet Palo Alto Networks, dass Frontier-Modelle Schwachstellen autonom verketten und die Zeit bis zur Datenexfiltration auf 25 Minuten schrumpfe. Das Problem: Die Evaluierungsmethoden wachsen langsamer als die Modelle selbst.
Der Artikel METR kann Claude Mythos kaum noch messen, Palo Alto Networks warnt vor autonomen KI-Angreifern erschien zuerst auf The Decoder.