OpenAIs neues Sprachmodell o3 zeigt erstmals konkrete Anzeichen für Täuschung, Manipulation und Sabotageverhalten. Externe Prüfer warnen: Klassische Tests reichen nicht mehr aus, um solche Fähigkeiten zuverlässig zu erkennen.
Der Artikel Sicherheitsforschungsinstitut zeigt: o3 ist wohl das bisher riskanteste KI-Modell von OpenAI erschien zuerst auf THE-DECODER.de.