
Anthropic stellt mit Petri ein neues Open-Source-Tool vor, das mittels KI-Agenten die Sicherheitsprüfung von KI-Modellen automatisieren soll. Erste Tests mit 14 führenden Modellen zeigen problematische Verhaltensweisen wie Täuschung und Whistleblowing.
Der Artikel Anthropic veröffentlicht Open-Source-Tool Petri zur automatisierten KI-Sicherheitsprüfung erschien zuerst auf THE-DECODER.de.
