Schlagwort: Wochen

GPT-Image-2: OpenAIs neues Bildmodell steht in den Startlöchern

OpenAI stellt heute Abend ein neues Bildmodell vor, das unter dem Codenamen „gpt-image-2“ bereits seit Wochen in Social Media für Aufsehen sorgt. Erste Testbilder sind kaum noch von echten Fotos zu unterscheiden.

Der Artikel GPT-Image-2: OpenAIs neues Bildmodell steht in den Startlöchern erschien zuerst auf The Decoder.
Deepseek v4 läuft auf Huawei-Chips und soll Chinas Chip-Unabhängigkeit demonstrieren

Deepseek v4 soll in den kommenden Wochen erscheinen und erstmals auf Huawei-Chips laufen. Chinas große Techkonzerne haben bereits Hunderttausende Einheiten bestellt. Nvidia bleibt bei Vorabtests außen vor.

Der Artikel Deepseek v4 läuft auf Huawei-Chips und soll Chinas Chip-Unabhängigkeit demonstrieren erschien zuerst auf The Decoder.
OpenClaw-Härtetest: KI-Agenten geben bereitwillig Passwörter und Bankdaten preis

Was passiert, wenn KI-Agenten mit E-Mail-Zugang, Shell-Rechten und eigenem Gedächtnis zwei Wochen lang von zwanzig Forschern gezielt angegriffen werden? Eine internationale Studie katalogisiert die Ergebnisse.

Der Artikel OpenClaw-Härtetest: KI-Agenten geben bereitwillig Passwörter und Bankdaten preis erschien zuerst auf The Decoder.
Claude Opus 4.6: Agenten-Teams bauen C-Compiler

Nano Banana

Kurzfassung
▾

Quellen
▾

Anthropic ließ 16 Instanzen von Claude Opus 4.6 als „Agent Team“ kooperieren, um in zwei Wochen erfolgreich einen C-Compiler in Rust zu entwickeln. Die Analyse zeigt, dass sogenannte „Infrastructure Noise“ wie kleine Netzwerkfehler oder Latenzen die größte Hürde für langlaufende autonome Prozesse darstellt. Daten belegen, dass unlimitierte Ressourcen (Uncapped Headroom) die Fehlerquote der Infrastruktur auf unter ein Prozent senken und die Erfolgsrate der KI massiv steigern. Für Entwickler bedeutet dies, dass stabile Umgebungen und aggressive Fehlerbehandlung wichtiger werden als die reine Modell-Intelligenz.

Anthropic Engineering Blog: Building a C compiler

TechCrunch: Anthropic releases Opus 4.6

VentureBeat: Claude Opus 4.6 brings agent teams

The Verge: Anthropic debuts new model

X (Twitter): Anthropic Announcement

Anthropic lässt 16 KI-Agenten parallel arbeiten und erschafft in zwei Wochen einen C-Compiler. Das Experiment mit Claude Opus 4.6 beweist jedoch: Für autonome Systeme ist eine stabile Infrastruktur wichtiger als reine Modell-Leistung.

Autonomie im Härtetest Anthropic demonstriert mit „Agent Teams“ eine neue Dimension der Softwareentwicklung. Sechzehn Instanzen des neuen Modells Opus 4.6 entwickelten autonom einen funktionierenden C-Compiler in der Programmiersprache Rust. Das System benötigte dafür lediglich zwei Wochen und lieferte Code, der komplex genug ist, um den Linux-Kernel zu kompilieren. Dabei agierten die Agenten nicht isoliert. Sie arbeiteten in einem koordinierten Verbund, überprüften gegenseitig ihren Code und behoben Fehler in iterativen Schleifen. Das Ergebnis zeigt, dass moderne KI-Modelle komplexe Architekturaufgaben lösen können, wenn sie als Team orchestriert werden. Doch der Erfolg dieses Projekts hing nicht allein an der Intelligenz der Modelle, sondern an einem oft übersehenen Faktor: der Zuverlässigkeit der Umgebung. Anzeige Der unsichtbare Gegner Der begleitende Engineering-Bericht legt den Fokus auf das Problem des „Infrastructure Noise“. Wenn Agenten über tausende Schritte hinweg agieren, summieren sich winzige API-Fehler oder Latenz-Spikes zu fatalen Abbruchquoten. Ein Netzwerkfehler, der bei einem Chatbot kaum auffällt, bringt einen autonomen Agenten, der seit Stunden kompiliert, zum Scheitern. Die Datenanalyse belegt eine direkte Korrelation zwischen Ressourcen-Management und Erfolgsquote. In Testszenarien zeigte sich, dass eine strikte Begrenzung der Ressourcen (Headroom Constraint 1x) zu einer Infrastruktur-Fehlerquote von fast 6 Prozent führte. Sobald die Ressourcenbeschränkungen aufgehoben wurden („Uncapped“), sank die Fehlerrate auf unter 1 Prozent, während die Erfolgsrate (Mean Reward) sichtbar anstieg. Stabilität vor Intelligenz Für Entwickler bedeutet dies ein Umdenken in der Architektur von KI-Anwendungen. Wer autonome Workflows baut, muss die Fehlerbehandlung aggressiver gestalten als bisher üblich. Es reicht nicht, das klügste Modell zu verwenden. Die Infrastruktur muss so skaliert werden, dass sie Lastspitzen ohne „Noise“ abfedert. Anthropic empfiehlt, signifikante Ressourcen-Puffer einzuplanen und Retry-Mechanismen tief in die Agenten-Logik zu integrieren. Nur wenn die technische Basis absolut geräuschlos läuft, können Agenten-Teams ihre Problemlösungsfähigkeit über längere Zeiträume aufrechterhalten. Anzeige
OpenClaw hat OpenDoor: Sichereitsforscher entlarven gravierende Sicherheitslücke im Hype-Agenten „Clawdbot“

Der KI-Agent OpenClaw hat in wenigen Wochen über 100.000 GitHub-Stars gesammelt. Nun zeigen Sicherheitsforscher, wie sich der gehypte Assistent durch ein einziges manipuliertes Dokument in eine dauerhafte Hintertür verwandeln lässt.

Der Artikel OpenClaw hat OpenDoor: Sichereitsforscher entlarven gravierende Sicherheitslücke im Hype-Agenten „Clawdbot“ erschien zuerst auf The Decoder.
Software schreibt Software: Claude Code programmiert Claude Cowork in 1,5 Wochen

Anthropics neues KI-Tool Claude Cowork wurde fast vollständig von Claude Code selbst programmiert, und das in nur anderthalb Wochen.

Der Artikel Software schreibt Software: Claude Code programmiert Claude Cowork in 1,5 Wochen erschien zuerst auf The Decoder.
KI-Wettrennen mit Google: OpenAI veröffentlicht neue Modelle GPT-5.2

Vor rund vier Wochen veröffentlichte OpenAI die KI-Modelle 5.1 als Update für das im Sommer erschienene GPT-5. Jetzt erscheint bereits die nächste Version mit leichten bis deutlichen Verbesserungen in Benchmarks.

Der Artikel KI-Wettrennen mit Google: OpenAI veröffentlicht neue Modelle GPT-5.2 erschien zuerst auf The Decoder.
Nutzer hatten Recht: Anthropic bestätigt Qualitätsprobleme bei Claude

Seit Wochen häufen sich Beschwerden über die nachlassende Code-Qualität von Anthropics Claude. Auf unsere Nachfrage bestätigt das Unternehmen zwei Fehler und untersucht weitere Meldungen.

Der Artikel Nutzer hatten Recht: Anthropic bestätigt Qualitätsprobleme bei Claude erschien zuerst auf THE-DECODER.de.