OpenAI entdeckt neue „Nerd Sniping“-Angriffsmethode auf Reasoning-Modelle

Vier weiße Quadrate vor einem gelb-grünen Hintergrund.

Eine neue Studie von OpenAI zeigt: KI-Modelle werden robuster gegen Manipulationsversuche, wenn sie mehr Zeit zum „Nachdenken“ bekommen. Die Forscher entdeckten dabei auch neue Angriffsmethoden.

Der Artikel OpenAI entdeckt neue „Nerd Sniping“-Angriffsmethode auf Reasoning-Modelle erschien zuerst auf THE-DECODER.de.