
Eine neue Studie von OpenAI und Apollo Research untersucht „Scheming“ – das verdeckte Verfolgen von Zielen durch KI. Ein spezielles Training reduziert zwar betrügerisches Verhalten, doch die Modelle scheinen sich ihrer Testsituation bewusst zu sein, was die Ergebnisse in Frage stellt.
Der Artikel „Scheming“: Chain-of-Thought wird zum unzuverlässigen Spiegel von KI-Entscheidungen erschien zuerst auf THE-DECODER.de.
