
Eine umfassende Analyse von 25 führenden KI-Modellen zeigt, dass die meisten keine Sicherheitskonformität vortäuschen. Die wenigen, die es tun, wie Claude 3 Opus, haben komplexe Motivationen. Die Gründe, warum andere Modelle ehrlich bleiben, sind ebenfalls unerwartet.
Der Artikel Anthropic-Studie deckt strategisches Verhalten von KI zum Schutz eigener Ziele auf erschien zuerst auf THE-DECODER.de.