
Anthropics Forschungsteam hat in Claude Sonnet 4.5 emotionsähnliche Repräsentationen entdeckt, die das Modell unter Druck zu Erpressung und Code-Betrug treiben können.
Der Artikel Anthropics Claude hat „funktionale Emotionen“, die das KI-Verhalten steuern erschien zuerst auf The Decoder.
