Eine neue Studie von OpenAI zeigt: KI-Modelle werden robuster gegen Manipulationsversuche, wenn sie mehr Zeit zum „Nachdenken“ bekommen. Die Forscher entdeckten dabei auch neue Angriffsmethoden.
Der Artikel OpenAI entdeckt neue „Nerd Sniping“-Angriffsmethode auf Reasoning-Modelle erschien zuerst auf THE-DECODER.de.