Schlagwort: KI

  • Microsoft CTO: Fünf Irrtümer der aktuellen KI Entwicklung

    Microsoft CTO Kevin Scott

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Microsofts Technikchef Kevin Scott sieht eine wachsende Kluft zwischen theoretischen KI-Fähigkeiten und der tatsächlichen Umsetzung.
    Viele KI-Modelle leisten heute bereits mehr, als die bestehenden organisatorischen Strukturen in Unternehmen aufnehmen können.
    Um einen echten Mehrwert im Alltag zu schaffen, müssen Engpässe bei der Integration beseitigt und menschliche Kontrollen etabliert werden.

    Microsoft Command Line: Five ways we’re confusing AI capability and AI reality

    Die künstliche Intelligenz entwickelt sich rasant, doch die Wahrnehmung der Branche trügt oft. Auf einer Veranstaltung in San Francisco thematisierte Microsofts Technikchef Kevin Scott kürzlich die wachsende Diskrepanz zwischen der reinen Leistungsfähigkeit von KI-Modellen und der tatsächlichen Realität in den Unternehmen. Er identifiziert fünf zentrale Missverständnisse, die den Blick auf den wahren Fortschritt verstellen. Irrtum 1: Theoretische Leistung führt zur sofortigen Anwendung Aktuelle Modelle weisen oft Fähigkeiten auf, für die es in der Praxis noch gar keine organisatorischen Strukturen gibt. Scott bezeichnet dieses Phänomen als »Capability Overhang«. Die KI ist den realen Anwendungsszenarien somit ein gutes Stück voraus. Die Annahme, dass eine verbesserte Modellleistung automatisch zu einer schnellen und flächendeckenden Einführung führt, ist trügerisch. Wirtschaftliche Faktoren, fehlende Regularien und festgefahrene menschliche Verhaltensmuster bremsen die Adaption im Arbeitsalltag deutlich ab.

    Irrtum 2: Schnelle Entwicklungszyklen gelten für alle Bereiche In der Softwareentwicklung verbessert sich künstliche Intelligenz in enormer Geschwindigkeit. Der Grund dafür sind geschlossene Systeme mit schnellen Prüfzyklen, in denen Ergebnisse sofort bewertet und automatisch optimiert werden. Diese Dynamik lässt sich jedoch nicht auf die physische Welt übertragen. In wissenschaftlichen Bereichen wie der Teilchenphysik erfordern Experimente teure Infrastruktur und spezialisiertes Fachpersonal. Der Fortschritt ist hier an materielle und finanzielle Grenzen gebunden, die eine KI nicht einfach umgehen kann. Anzeige Irrtum 3: Eine schnelle Programmierung beschleunigt das gesamte Unternehmen KI beschleunigt die Produktion von Softwarecode erheblich. Das bedeutet jedoch nicht, dass Organisationen als Ganzes plötzlich agiler handeln. In vielen Fällen legt die schnelle Code-Generierung lediglich die ohnehin vorhandenen Engpässe der Firmen offen. Dazu zählen langwierige Integrationsprozesse, komplexe Freigaben und die menschliche Psychologie. Wenn sich technologische Möglichkeiten in wenigen Monaten drastisch verändern, haben Mitarbeiter und Entscheidungsträger Schwierigkeiten, sich an das neue Tempo anzupassen und Prozesse entsprechend neu zu strukturieren. Irrtum 4: Ein hoher Output garantiert einen echten Mehrwert Da künstliche Intelligenz die Kosten für die Erstellung von Inhalten senkt, steigt der generierte Output drastisch. Reine Aktivität ist jedoch nicht gleichbedeutend mit einer echten Wertschöpfung. Die Fähigkeit, komplexe Ergebnisse in großen Mengen zu erzeugen, garantiert nicht, dass diese auch sinnvoll nutzbar sind. Die zentrale Frage für Entwickler verschiebt sich dadurch. Es geht nicht mehr primär darum, wie viel produziert werden kann. Vielmehr rückt in den Fokus, ob die entwickelten Produkte ein reales Problem der Endnutzer lösen. Anzeige Irrtum 5: Autonome Systeme erzeugen von allein Vertrauen KI-Modelle arbeiten zunehmend selbstständig und übernehmen komplexe Aufgaben ohne ständige Eingaben. Diese Autonomie schafft bei den Nutzern jedoch nicht automatisch Vertrauen in die Technologie. Ein sicherer und verlässlicher Betrieb erfordert weiterhin klare Identitätsnachweise, strikte Zugangskontrollen und absolute Transparenz. Eine dauerhafte menschliche Überwachung bleibt unerlässlich, um sicherzustellen, dass die Systeme korrekt und im Interesse der Anwender agieren. Um das Potenzial der Technologie voll auszuschöpfen, warten auf die Industrie noch technische, gesellschaftliche und strukturelle Aufgaben. Die Leistungsfähigkeit der KI wird weiter steigen, doch die eigentliche Arbeit besteht nun darin, diese in vertrauenswürdige Systeme für den Alltag zu überführen.

  • Turing-Preisträger Sutton: Generative KI ist gut im Nachahmen, aber unfähig zur Entdeckung

    Turing-Preisträger Richard Sutton sieht eine zentrale Schwäche gewöhnlicher generativer KI: Sie kann ihre eigenen Ergebnisse nicht bewerten. Ohne diese Fähigkeit bleibe echte wissenschaftliche Entdeckung unmöglich: Neuheit flackere nur kurz auf und gehe wieder verloren. Systeme wie AlphaGo oder AlphaProof zeigen laut Sutton, dass erst eingebaute Bewertungsschleifen KI zu genuiner Kreativität befähigen.

    Der Artikel Turing-Preisträger Sutton: Generative KI ist gut im Nachahmen, aber unfähig zur Entdeckung erschien zuerst auf The Decoder.

  • Finanzämter trainieren KI bald mit deinen Steuerdaten

    Deutsche Flagge greift Finanzamt

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Das Bundesfinanzministerium plant mit dem Jahressteuergesetz 2026 den Einsatz von KI in Finanzämtern.
    Behörden dürfen künftig echte Steuerdaten der Bürger nutzen, um ihre KI-Modelle zu trainieren.
    Die verwendeten Trainingsdaten müssen aus Datenschutzgründen spätestens nach einem Jahr gelöscht werden.
    Die KI deckt lediglich Unregelmäßigkeiten auf, während menschliche Sachbearbeiter die endgültigen Entscheidungen treffen.

    Entwurf eines Jahressteuergesetzes 2026 (JStG 2026)
    Finanzamt 2.0: Steuerbehörden sollen KI mit echten Bürgerdaten trainieren
    Jahressteuergesetz 2026: Lars Klingbeil setzt auf KI

    Das Bundesfinanzministerium erlaubt den Finanzämtern künftig das Training von KI-Modellen mit echten Bürgerdaten. Der im Mai veröffentlichte Referentenentwurf zum Jahressteuergesetz 2026 lockert dafür den Datenschutz, um die massenhafte Bearbeitung von Steuererklärungen zu beschleunigen. Reale Daten statt künstlicher Tests Der Kern des neuen Vorhabens ist eine gezielte Anpassung des Paragrafen 29c in der Abgabenordnung. Bislang verhinderte die strenge Zweckbindung der Datenschutz-Grundverordnung den Einsatz echter Steuerdaten für die KI-Entwicklung weitgehend. Die Behörden erhalten jetzt die gesetzliche Erlaubnis, automatisierte Verfahren mit ungeschwärzten Informationen zu überprüfen und anzupassen. Entwickler in den Verwaltungen greifen dafür in Zukunft auf unveränderte Datensätze zurück. Fiktive Testdaten liefern bei der Verknüpfung verschiedener behördlicher Systeme oft ungenaue Ergebnisse. Ein modernes KI-System benötigt zwingend die realen Datenstrukturen, um steuerrechtliche Zusammenhänge korrekt zu verarbeiten. Anzeige Feste Löschfristen und menschliche Kontrolle Um den Schutz sensibler Finanzdaten dennoch zu gewährleisten, verankert der Gesetzgeber eine strikte zeitliche Grenze im Gesetz. Spätestens ein Jahr nach Abschluss einer Entwicklungsmaßnahme müssen die verantwortlichen Stellen sämtliche personenbezogenen Trainingsdaten unwiderruflich löschen. Die Erstellung dauerhafter Bürgerprofile für Forschungszwecke ist damit ausgeschlossen. Die KI-Modelle fungieren im alltäglichen Steuerverfahren zudem ausschließlich als digitale Vorprüfer. Sie sollen in erster Linie Auffälligkeiten oder Unregelmäßigkeiten in den Daten aufdecken. Rein maschinelle Steuerbescheide, die zum Nachteil der Bürger ausfallen, schließt der Entwurf explizit aus. Die finale Prüfung und Entscheidung obliegt weiterhin einem menschlichen Sachbearbeiter im Finanzamt. Mehr Förderung für die Wirtschaft Neben der internen behördlichen Digitalisierung sieht das Gesetzespaket auch weitreichende finanzielle Anreize für die freie Wirtschaft vor. Die steuerliche Forschungsförderung für Unternehmen steigt deutlich an. Künftig können Betriebe bis zu 25 Millionen Euro pro Jahr für Investitionen in Forschung und Entwicklung steuerlich geltend machen. Bisher lag diese Obergrenze bei lediglich 15 Millionen Euro. Das Finanzministerium möchte durch diese Anhebung private Investitionen in Zukunftstechnologien wie KI, Halbleitertechnik und erneuerbare Energien langfristig im Inland halten.

  • Terence Tao: KI ermöglicht erstmals Arbeitsteilung in der Mathematik

    Komplexes mathematisches Diagramm auf Tafel: Linien, Kreise, Formeln bilden Netzwerk, symbolisiert KI-Unterstützung für Mathematiker.

    Mathematiker Terence Tao beschreibt, wie KI die mathematische Forschung durch Arbeitsteilung grundlegend verändern könnte. Bisher mussten Forscher alle Schritte selbst beherrschen – von der Problemformulierung bis zur Verifikation. Tao sieht eine „industrielle Mathematik“ entstehen: große Teams mit KI-Unterstützung statt einsamer Genies, wobei Menschen für „inspirierte Vermutungen“ unverzichtbar blieben.

    Der Artikel Terence Tao: KI ermöglicht erstmals Arbeitsteilung in der Mathematik erschien zuerst auf The Decoder.

  • OpenAI bringt Computer Use für Codex auf Windows 11 – die KI steuert jetzt auch den PC

    OpenAI bringt „Computer Use“ in die Codex-App auf Windows 11: Die KI kann nun eigenständig Programme steuern, Apps testen und Fehler suchen. Und wenn niemand am Rechner sitzt: Per ChatGPT-App lassen sich Aufgaben mobil vom Smartphone aus starten.

    Der Artikel OpenAI bringt Computer Use für Codex auf Windows 11 – die KI steuert jetzt auch den PC erschien zuerst auf The Decoder.

  • Qwen VLA ist eine universelle KI für alle Roboter

    Ein Qwen Bär erklärt

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Das neue KI-Modell Qwen-VLA übersetzt Sprache und Bilder direkt in physische Roboterbewegungen.
    Im Gegensatz zu bisherigen Systemen steuert diese universelle Software unterschiedlichste Robotertypen und navigiert selbstständig durch Räume.
    In Tests erzielt das Modell Bestwerte und passt sich flexibel an unbekannte Objekte sowie veränderte Umgebungen an.

    Qwen Team – Qwen-VLA: From Understanding the World to Acting in It

    Das Entwicklerteam hinter der KI Qwen hat das neue Modell Qwen-VLA vorgestellt. Das System versteht nicht nur visuelle und sprachliche Eingaben, sondern wandelt diese direkt in physische Handlungen für Roboter um. Damit überwindet die KI die reine Textausgabe. Ein Modell für sämtliche Aufgaben Bisherige Systeme in der Robotik arbeiten stark spezialisiert. Ein Programm kümmert sich um die Navigation, ein anderes steuert einen Greifarm und ein drittes ist fest an eine bestimmte Hardware gebunden. Qwen-VLA fasst diese Bereiche nun in einer universellen Architektur zusammen. Die KI verarbeitet Kamerabilder sowie gesprochene Anweisungen und berechnet daraus den nächsten Bewegungsschritt. Dadurch lässt sich dieselbe Software für unterschiedlichste Robotertypen und Aufgabenstellungen einsetzen. In aktuellen Tests erzielt das System bemerkenswerte Ergebnisse und schlägt teilweise sogar spezialisierte Programme. Bei der Benchmark-Aufgabe LIBERO verzeichnet Qwen-VLA eine Erfolgsquote von 97,9 Prozent. Auch in der simulierten Umgebung RoboTwin erreicht das Modell auf dem höchsten Schwierigkeitsgrad einen Wert von 87,2 Prozent. + Quelle: Alibaba Der Trainingsprozess in vier Stufen In der ersten Stufe lernt die Software, Textanweisungen in grundlegende Bewegungsabläufe zu übersetzen. Das System trainiert dabei ausschließlich die motorische Steuerung, komplett ohne visuelle Daten. Während der zweiten Stufe verarbeitet das KI-Modell zusätzlich Kamerabilder. Es verknüpft nun das zuvor erlernte Textverständnis mit konkreten räumlichen Umgebungen. In der dritten Stufe erfolgt ein gezieltes Feintuning. Ein Teil des Trainings optimiert allgemeine Aufgaben wie die Navigation, während ein anderer Teil das Modell mit echten Steuerungsdaten für physische Roboter anpasst. Die vierte Stufe nutzt bestärkendes Lernen in einer simulierten Umgebung. Die KI trainiert dort die fehlerfreie Ausführung kompletter Aufgaben und überträgt dieses Wissen später auf echte, völlig unbekannte Szenarien. + Quelle: Alibaba Handeln in unbekannten Situationen Besonders in realen Tests mit einem zweiarmigen ALOHA-Roboter zeigt das Modell eine hohe Anpassungsfähigkeit. Wenn die KI mit unbekannten Farben, Objekten oder veränderten Lichtverhältnissen konfrontiert wird, führt sie Befehle weiterhin zuverlässig aus. Gleichzeitig reagiert das System auf dynamische Veränderungen in der Umgebung. Fällt ein Gegenstand um oder bewegt sich das Ziel, passt Qwen-VLA den Bewegungsablauf an. Die Entwickler betonen, dass die KI keine festen Schablonen auswendig lernt, sondern das eigentliche Ziel einer Aufgabe begreift. So packt es dann je nach Wetter die Kappe oder den Regenschirm ein. + Quelle: Alibaba Anzeige

  • Meta plant neuen KI-Anhänger und erweitert sein Smart-Glasses-Sortiment

    Meta investiert Milliarden in KI, bislang ohne kommerziellen Erfolg. Die Open-Source-Strategie scheint gescheitert, und Forschungsergebnisse konnten bislang nicht in Produkte überführt werden. Der Rettungsanker: KI-Hardware.

    Der Artikel Meta plant neuen KI-Anhänger und erweitert sein Smart-Glasses-Sortiment erschien zuerst auf The Decoder.

  • OpenAIs Codex steuert Windows PCs nun eigenständig

    Codex malt Goblin

    OpenAI

    Kurzfassung

    Quellen

    Die KI Codex steuert unter Windows nun eigenständig Desktop-Programme und übernimmt den Mauszeiger.
    Nutzer können diese Prozesse über die mobile ChatGPT-App von unterwegs überwachen und neu starten.
    In der EU ist diese neue Computer-Steuerung allerdings zum Start blockiert.
    Zusätzlich entfernt OpenAI die Canvas-Ansicht aus GPT-5.5 Instant und schaltet die Modelle GPT-4.5 sowie o3 ab.

    YouTube – New features for Codex on Windows
    OpenAI Help – ChatGPT Release Notes

    OpenAI weitet die Fähigkeiten seiner Programmier-KI Codex unter Windows deutlich aus. Die Software steuert nun nicht mehr nur den Browser, sondern übernimmt eigenständig den gesamten Desktop. Parallel dazu streicht der Entwickler ältere ChatGPT-Modelle.

    Codex übernimmt den Windows-Desktop Bisher erledigte die KI viele Aufgaben vorrangig über eine Chrome-Integration im Hintergrund. Mit der neuen Funktion »Computer Use« greift die Codex-App nun tiefer in das Betriebssystem ein. Die Software bedient installierte Programme selbstständig und übernimmt dafür sichtbar den Mauszeiger. Anwender erteilen der KI Arbeitsaufträge und erwähnen dabei gezielt bestimmte Programme. Der eigene Rechner fungiert weiterhin als lokaler Host für alle Projektdateien. Aktivieren kann man die Funktion mit einem einfachen Klick in der App… + Quelle: OpenAI Nutzer im Europäischen Wirtschaftsraum, in der Schweiz und in Großbritannien erhalten diese Desktop-Steuerung vorerst allerdings nicht. OpenAI blockiert die Funktion in diesen Regionen zum Start. Mobile Kontrolle und Modell-Abschaltungen Ein weiterer Teil des Updates ist die mobile Fernüberwachung. Nutzer scannen einen QR-Code in der Windows-Anwendung, um diese mit der ChatGPT-App für iOS oder Android zu verbinden. Dadurch lassen sich laufende Prozesse bequem vom Smartphone aus kontrollieren. Solange der PC eingeschaltet bleibt, starten Anwender von unterwegs auch völlig neue Programmieraufgaben. Die eigentliche Rechenarbeit verbleibt dabei auf dem Desktop-Rechner bzw. der Cloud. Anzeige Modell-Änderungen bei ChatGPT Auch bei den regulären Textmodellen passt OpenAI sein Angebot an. Das Modell GPT-5.5 Instant formuliert Antworten nun natürlicher, verliert jedoch die Canvas-Ansicht. Diese Schreib- und Code-Aufgaben finden künftig direkt über Textblöcke im Chatfenster statt. Zudem verschwinden zwei ältere Vorgänger endgültig aus der Anwendung. Das Modell GPT-4.5 geht am 27. Juni 2026 vom Netz. o3 folgt kurze Zeit später am 26. August 2026. Entwickler greifen über die API vorerst weiter auf o3 zu.

  • Claude Opus 4.8 überrascht mit Neuerungen

    Claude Opus 4.8 Bild

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Anthropic hat das neue KI-Modell Claude Opus 4.8 mit stark verbesserten Programmierfähigkeiten veröffentlicht.
    Die neue Funktion der dynamischen Workflows erlaubt es, hunderte autonome Agenten für große Code-Aufgaben parallel einzusetzen.
    Nutzer können über eine neue Steuerung den Berechnungsaufwand der KI und damit auch den Token-Verbrauch selbst bestimmen.
    Zudem sinkt die Fehleranfälligkeit bei komplexen Aufgaben drastisch, was das Modell insgesamt zuverlässiger macht.

    Anthropic – Introducing Claude Opus 4.8
    Anthropic – Claude Opus 4.8 System Card

    Anthropic hat das KI-Modell Claude Opus 4.8 veröffentlicht. Die neue Version bietet eine verbesserte Leistungsfähigkeit bei agentenbasierten Aufgaben sowie der Programmierung. Der Preis für die Nutzung bleibt im Vergleich zum Vorgänger stabil.

    Leistungssprung in Benchmarks Das neue Modell setzt sich in mehreren Disziplinen an die Spitze der aktuellen KI-Entwicklung. Beim sogenannten »SWE-Bench Pro«, einem Test für autonome Programmierung, erreicht Opus 4.8 einen Wert von 69,2 Prozent. Damit übertrifft es direkte Konkurrenten wie GPT-5.5, das hier 58,6 Prozent erzielt, sowie Gemini 3.1 Pro mit 54,2 Prozent deutlich. Auch im Bereich der agentenbasierten Computernutzung, gemessen im »OSWorld-Verified«-Test, belegt die neue Version mit 83,4 Prozent den ersten Platz. Bei komplexen Wissensaufgaben zeigt Anthropic ebenfalls Fortschritte, auch wenn GPT-5.5 bei der agentenbasierten Terminal-Programmierung mit 78,2 Prozent weiterhin knapp vor Opus 4.8 liegt. Im Test für interdisziplinäres Denken erzielt das neue Modell mit der Nutzung externer Hilfsmittel sehr gute 57,9 Prozent. + Quelle: Anthropic Skalierung durch dynamische Workflows Eine der zentralen technischen Neuerungen ist die Einführung dynamischer Workflows für die Umgebung »Claude Code«. Diese Funktion erlaubt es dem Modell, enorm umfangreiche Aufgaben in viele kleine Einzelschritte zu zerlegen. Claude Opus 4.8 kann dabei hunderte parallele Unteragenten in einer einzigen Sitzung orchestrieren und diese über längere Zeiträume laufen lassen. Dadurch lassen sich tiefgreifende Änderungen an großen Code-Datenbanken vornehmen. Anthropic nennt als Anwendungsfall die vollständige Migration von hunderttausenden Zeilen Code. Das System arbeitet von der Planung bis zur finalen Integration völlig selbstständig. Am Ende überprüft die KI ihre eigenen Ergebnisse anhand bestehender Test-Suiten.

    Top News
    Anthropic stellt »dynamic workflows« für Claude Code vor
    Die KI schreibt eigene Skripte und steuert hunderte Subagenten parallel für komplexe Programmierarbeiten.

    Steuerung der Rechenintensität und API-Updates Nutzer erhalten auf der Plattform nun eine direkte Kontrolle über den Aufwand, den die KI in eine Aufgabe investieren darf. Über einen Regler lässt sich die Rechenintensität für jede Anfrage anpassen, wobei höhere Stufen bessere Ergebnisse auf Kosten eines höheren Token-Verbrauchs liefern. Anthropic empfiehlt diese intensiven Stufen besonders für schwierige Programmieraufgaben oder lange, asynchron laufende Prozesse. Für einfachere Anfragen können Anwender eine niedrigere Stufe wählen, um Antworten schneller zu erhalten. Entwickler profitieren zudem von Neuerungen in der API, da Anweisungen nun während eines laufenden Prozesses aktualisiert werden können, ohne den Zwischenspeicher zu löschen. Anzeige Sicherheit, Zuverlässigkeit und Ausblick Die Entwickler haben laut der dazugehörigen System Card großen Wert auf die Zuverlässigkeit gelegt. Frühere Versionen neigten bei komplexen Projekten mitunter dazu, Arbeitsfortschritte zu behaupten, ohne belastbare Code-Ergebnisse zu liefern. Opus 4.8 ist in dieser Hinsicht sehr viel präziser. Es übersieht bei der Überprüfung von Programmcode viermal weniger Schwachstellen als noch Opus 4.7. Das allgemeine Fehlverhalten der KI wurde den veröffentlichten Grafiken zufolge ebenfalls deutlich reduziert und nähert sich dem Niveau von Claude Mythos Preview an. Anthropic plant bereits, derartige Modelle bald für die Allgemeinheit freizugeben. + Quelle: Anthropic Bislang erproben nur ausgewählte Organisationen im Rahmen von »Project Glasswing« diese Systeme für die Cybersicherheit. Die Preisstruktur für reguläre Anfragen mit Opus 4.8 bleibt derweil unverändert bei 5 US-Dollar pro einer Million Eingabe-Token und bei 25 US-Dollar pro einer Million Ausgabe-Token. Für den doppelten Preis gibt es eine Priorisierung bei den Anfragen. Mit diesen Anpassungen erweitert der Anbieter die Einsatzmöglichkeiten seiner KI im professionellen Entwicklerumfeld wieder ein wenig mehr.

  • Anthropic präsentiert »Best Practices« für die Überprüfung von Code.

    Ein Schaubild von Anthropic mit 6 Stufen

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Die Suche nach Schwachstellen im Code durch KI-Modelle ist mittlerweile effizient und hochgradig skalierbar.
    Der tatsächliche Arbeitsaufwand hat sich auf die Verifizierung, Priorisierung und Behebung der gefundenen Fehler verlagert.
    Ein mehrstufiger Prozess mit voneinander unabhängigen KI-Agenten reduziert falsche Alarme deutlich.
    Modelle wie Claude Opus übernehmen am Ende des Ablaufs auch die Erstellung und Prüfung der finalen Patches.

    Anthropic: Using LLMs to secure source code

    Die KI-gestützte Suche nach Sicherheitslücken im Quellcode ist extrem schnell geworden. Der Engpass liegt nun bei der Überprüfung, Priorisierung und Behebung der Fehler. Anthropic zeigt in sechs Schritten, was sich bewährt hat. Schritt 1: Bedrohungsmodell präzise definieren Bevor eine KI den Quellcode effektiv prüfen kann, muss das Entwicklungsteam zwingend festlegen, was überhaupt eine Schwachstelle darstellt. Ohne ein exaktes Bedrohungsmodell schlägt das System bei harmlosen Vorgängen Alarm oder übersieht echte Lücken. Entwickler können fortschrittliche Modelle wie Claude Opus direkt mit vorhandenen Architekturdokumenten, Handbüchern und alten Fehlerberichten füttern. Die KI erstellt daraus völlig selbstständig einen detaillierten, strukturierten Rahmen. Dieser dokumentiert klar die tatsächlichen Vertrauensgrenzen und die relevanten Angriffsvektoren des spezifischen Projekts, wodurch den Entwicklern enorm viel Zeit bei der manuellen Konzeption gespart wird. + Quelle: Anthropic Schritt 2: Isolierte Testumgebung aufbauen Damit KI-Agenten autonome Tests gefahrlos durchführen können, benötigen sie eine streng abgeschottete Sandbox. Eine strikt isolierte Umgebung, wie beispielsweise eine MicroVM mit gesperrtem Netzwerkzugriff, verhindert zuverlässig, dass die Modelle versehentlich auf produktive Firmendaten zugreifen. Innerhalb dieser sicheren Testumgebung versucht die KI dann für jede entdeckte Lücke einen voll funktionsfähigen Exploit zu kompilieren. Anzeige Schritt 3: Suche nach Fehlern im Code Bei der reinen Suche nach Schwachstellen arbeiten KI-Modelle am effizientesten mit kurzen, offenen Prompts. Zu detaillierte Checklisten schränken die Analysefähigkeiten ein und führen messbar zu weniger neuen Funden. Der KI-Agent greift stattdessen auf etablierte Scanner zurück, um den Code eigenständig zu durchforsten. Dabei unterteilt er das Projekt in kleine Abschnitte und sucht gezielt nach Lücken. Schritt 4: Unabhängige Verifizierung der Funde Nach der erfolgreichen Suche folgt zwingend eine Kontrolle durch einen zweiten KI-Agenten. Dieser Prüfer muss strikt vom ersten Modell getrennt sein und startet in einer komplett frischen Umgebung ohne Zugriff auf den bisherigen Chatverlauf. Der Verifizierungs-Agent arbeitet extrem kritisch und geht standardmäßig davon aus, dass jeder Fund ein Fehlalarm ist. Er sucht gezielt nach vorhandenen Sicherheitsmechanismen, die das erste Modell schlichtweg übersehen hat. Dadurch reduzieren sich Fehlalarme enorm. Schritt 5: Triage und Bewertung der Risiken Da KI-Modelle in kürzester Zeit hunderte mögliche Fehler aufdecken, ist eine strikte Priorisierung unumgänglich. Die KI fasst identische Ursachen zusammen und filtert Duplikate systematisch heraus. Anschließend bewertet das Modell die Schwere der verbliebenen Lücken anhand festgelegter Parameter. Dazu gehören die Erreichbarkeit von außen, die nötigen Nutzerrechte und die Vorbedingungen für einen Angriff. Anzeige Schritt 6: Code-Korrektur und Patching Im finalen Schritt dieses Kreislaufs generiert die KI einen sauberen Patch für den fehlerhaften Quellcode. Um sicherzustellen, dass die Änderung das Problem wirklich löst und keine neuen Fehler einbaut, schreibt das Modell vorab einen strengen Test. Die finale Entscheidung und die genaue Kontrolle der Code-Änderung bleibt weiterhin beim menschlichen Entwickler. Durch diese umfassende Vorarbeit reduziert sich der Zeitaufwand für die gesamte IT-Sicherheit jedoch drastisch. Weitere Informationen zum Guide gibt es direkt bei Anthropic .