Schlagwort: KIAgenten

  • Komplexe KI-Agenten sind laut Studie im Arbeitsalltag noch overhyped

    Eine umfassende Untersuchung von UC Berkeley und Partnern zeigt, wie Unternehmen KI-Agenten tatsächlich einsetzen. Statt autonomer Super-KI setzen erfolgreiche Teams auf einfache Workflows, manuelle Prompts und viel menschliche Kontrolle.

    Der Artikel Komplexe KI-Agenten sind laut Studie im Arbeitsalltag noch overhyped erschien zuerst auf The Decoder.

  • Neue Sicherheitslücke: KI-Agenten in GitHub und GitLab gefährden Unternehmens-Workflows

    Aikido Security warnt vor einer neuen Schwachstelle in GitHub‑ und GitLab‑Workflows, die mit KI‑Agenten wie Gemini CLI, Claude Code, OpenAI Codex oder GitHub AI Inference verbunden sind.

    Der Artikel Neue Sicherheitslücke: KI-Agenten in GitHub und GitLab gefährden Unternehmens-Workflows erschien zuerst auf The Decoder.

  • Neues KI-Gedächtnis GAM soll den „Context Rot“ bei langen Chats verhindern

    Glitch-Art-Illustration: Mehrere überlappende Chatfenster in Neonfarben, durch Risse fragmentiert.

    Ein chinesisches Forschungsteam hat eine neue Speicherarchitektur für KI-Agenten entwickelt. „GAM“ soll Informationsverlust bei langen Interaktionen minimieren, indem es Kompression mit Deep Research kombiniert.

    Der Artikel Neues KI-Gedächtnis GAM soll den „Context Rot“ bei langen Chats verhindern erschien zuerst auf The Decoder.

  • Das Ende des Kontext-Wahns

    Ein Dauerläufer mit hohem Kontextfenster

    Nano Banana

    Kurzfassung

    Quellen

    Anthropic veröffentlicht ein neues SDK, das den Gedächtnisverlust von KI-Agenten bei langlaufenden Aufgaben eliminiert. Das System trennt die Arbeit in einen vorbereitenden Initializer-Agenten und einen ausführenden Coding-Agenten auf. Durch persistentes State Management können komplexe Prozesse nun über mehrere Sitzungen hinweg ohne Informationsverlust fortgesetzt werden. Die Lösung ermöglicht erstmals zuverlässige Enterprise-Automatisierung jenseits von einfachen Chat-Interaktionen.

    Anthropic Engineering Blog – Effective harnesses for long-running agents

    VentureBeat – Anthropic says it solved the long-running AI agent problem

    DERA.AI – Anthropic Solves AI’s Memory Problem

    Industrial PC World – Anthropic’s new Claude SDK finally solves the AI agent memory problem

    Hacker News – Effective harnesses for long-running agents

    Langlaufende KI-Agenten scheiterten bisher oft an einem simplen Limit: Sie vergaßen schlichtweg ihren Auftrag oder den bisherigen Fortschritt, sobald die Session zu komplex wurde. Anthropic liefert nun die technische Antwort auf dieses Gedächtnis-Problem. Für Entwickler bedeutet das endlich zuverlässige Automatisierung komplexer Prozesse über mehrere Sitzungen hinweg. Schluss mit der Amnesie bei komplexen Aufgaben Bisher endeten ambitionierte Coding-Projekte oder umfangreiche Datenanalysen oft abrupt, sobald das Kontextfenster des Modells gefüllt war. Der Agent verlor den Überblick und halluzinierte oder brach ab. Anthropic begegnet diesem Hindernis mit einer neuen Architektur, die speziell für lang andauernde Aufgaben entwickelt wurde. Anstatt zu versuchen, den gesamten Verlauf in einen einzigen Chat zu pressen, setzt die Lösung auf eine strukturierte Aufteilung der Arbeitsschritte. Das neue SDK ermöglicht es Claude, über die Grenzen einer einzelnen Sitzung hinaus zu „denken“. Das System speichert den Status Quo extern und lädt bei Bedarf nur die relevanten Informationen neu. Das verhindert den klassischen „Overflow“, bei dem wichtige Anweisungen vom Anfang der Konversation hinten herunterfallen. Anzeige Der Initializer und der Coding-Agent Die technische Umsetzung basiert auf einem dualen Ansatz, den Anthropic als „Harness“ bezeichnet. Zuerst analysiert ein spezialisierter „Initializer-Agent“ die Umgebung. Er erstellt eine präzise Karte des Repositorys und definiert die Spielregeln. Er verschafft sich also den Überblick, den das eigentliche Arbeitsmodell benötigt, ohne bereits Ressourcen für die Problemlösung zu verschwenden. Anschließend übernimmt der „Coding-Agent“. Dieser arbeitet nicht endlos am Stück, sondern erledigt Aufgaben in diskreten Einheiten. Er zieht sich die nötigen Informationen vom Initializer, führt einen Schritt aus – etwa das Schreiben eines Tests oder das Refactoring einer Klasse – und speichert das Ergebnis. So bleibt der Kontext frisch und relevant, ohne das Modell mit unnötigen Altlasten aus vorherigen, bereits abgeschlossenen Schritten zu überfluten. Persistenz für echte Enterprise-Automatisierung Der entscheidende Vorteil für die Industrie liegt in der Zustandsverwaltung (State Management). Entwickler können den Status einer Aufgabe nun persistent speichern und den Agenten exakt dort weiterarbeiten lassen, wo er aufgehört hat – selbst wenn dazwischen Tage liegen oder der Server neu gestartet wurde. Das SDK bietet hierfür konkrete Werkzeuge: Pruning: Automatisches Entfernen irrelevanter Chat-Verläufe, um Token zu sparen. Summarization: Komprimierung vergangener Schritte, um das Gedächtnis effizient zu nutzen. Loop-Prevention: Mechanismen, die erkennen, wenn ein Agent sich im Kreis dreht, und eingreifen. Anthropic schließt damit eine kritische Lücke zwischen theoretischem Potenzial und praktischer Anwendbarkeit autonomer Systeme, die nun Aufgaben erledigen können, die weit über einen einfachen Chat-Dialog hinausgehen.

  • Neues Trainingsverfahren lässt KI-Agenten besser im Team arbeiten

    Forscher stellen ein neues Framework vor, das verschiedene KI-Agenten gemeinsam trainieren kann. Die Methode soll komplexe Aufgaben durch spezialisierte Rollen und Teamwork besser lösen.

    Der Artikel Neues Trainingsverfahren lässt KI-Agenten besser im Team arbeiten erschien zuerst auf The Decoder.

  • Forscher basteln an Webseiten für KI-Agenten

    Forscher der TU Darmstadt haben mit VOIX ein Framework entwickelt, das Websites um zwei neue HTML‑Elemente erweitert. Dadurch können KI‑Agenten direkt erkennen, welche Aktionen möglich sind, statt mühsam Benutzeroberflächen auswerten zu müssen. Das verspricht schnellere und sicherere Interaktionen, erfordert aber die Unterstützung von Web‑Entwicklern.

    Der Artikel Forscher basteln an Webseiten für KI-Agenten erschien zuerst auf The Decoder.

  • Agent 365: Microsoft startet Verwaltungsplattform für KI-Agenten

    Microsoft hat Agent 365 vorgestellt, eine Plattform zur Verwaltung von KI-Agenten in Unternehmen.

    Der Artikel Agent 365: Microsoft startet Verwaltungsplattform für KI-Agenten erschien zuerst auf The Decoder.

  • KI: Job-Killer oder Job-Helfer?

    Eine menschliche und eine künstliche Hand schreiben zusammen

    Nano Banana

    Kurzfassung

    Quellen

    Gartner hat 10 Prognosen veröffentlicht, die eine „Welt zerbrochener Normen“ durch KI beschreiben. Die Arbeitswelt steht vor einem Umbruch: KI-Tests werden Standard, gleichzeitig werden „KI-freie“ Tests eingeführt, um kritisches Denken zu prüfen. KI könnte bis 2026 die Hälfte des mittleren Managements überflüssig machen und wird Teil von Arbeitsverträgen (KI-Personas). Gartner warnt auch vor neuen Risiken, darunter Tausende „Tod durch KI“-Klagen, digitale Sucht und Sicherheitslücken durch KI-Agenten.

    Gartner Consumer Goods IT-Online CIO Dive InformationWeek

    Unternehmen können sich nicht mehr auf die Regeln von gestern verlassen. Das Marktforschungsunternehmen Gartner hat auf seinem IT Symposium/Xpo zehn strategische Prognosen vorgestellt, die eine „Welt zerbrochener Normen“ beschreiben. Die Analysen fokussieren sich auf drei Kernbereiche: den Wandel der Arbeitswelt, neue digitale Risiken und die Neudefinition von Geschäftsmodellen durch KI. Hier sind die zehn Prognosen im Detail. 1. KI-Tests im Einstellungsprozess Bis 2027 werden 75 Prozent der Einstellungsverfahren Tests zur KI-Kompetenz beinhalten. Der routinierte Umgang mit KI-Werkzeugen, etwa das Formulieren von Prompts, wird zur Grundvoraussetzung. Unternehmen wollen so sicherstellen, dass neue Mitarbeiter die Produktivitätsvorteile der Technologie voll ausschöpfen können. 2. Die Rückkehr der „KI-freien“ Tests Gleichzeitig entsteht ein gegenläufiger Trend. Weil die ständige Nutzung von KI das kritische Denken verkümmern lässt, werden bis 2026 die Hälfte aller Unternehmen „KI-freie“ Kompetenztests einführen. Diese Tests sollen sicherstellen, dass Bewerber komplexe Probleme noch selbstständig und ohne technologische Unterstützung lösen können. 3. KI flacht Hierarchien ab Künstliche Intelligenz wird die Unternehmensstruktur direkt verändern. Gartner erwartet, dass bis 2026 rund 20 Prozent der Organisationen KI nutzen, um ihre Hierarchien abzuflachen. Mehr als die Hälfte der aktuellen Middle-Management-Positionen könnten dadurch wegfallen, da KI deren Koordinations- und Reportingaufgaben übernimmt. 4. Die KI-Persona im Arbeitsvertrag Die Technologie greift in die Persönlichkeitsrechte ein. Bis 2027 dürften 70 Prozent aller neuen Arbeitsverträge Klauseln zur Lizenzierung von KI-Personas der Mitarbeiter enthalten. Unternehmen wollen digitale Abbilder ihrer Angestellten für Meetings oder den Kundenservice nutzen, was komplexe rechtliche Fragen zur Nutzung und Vergütung aufwirft. 5. Haftungsrisiko „Tod durch KI“ Die Analysten warnen vor einer Welle neuer, „heimtückischer“ KI-Risiken. Bis Ende 2026 rechnet Gartner mit weltweit über 2.000 Gerichtsverfahren wegen „Tod durch KI“. Dabei geht es um Haftungsfragen, wenn KI-Systeme in sicherheitskritischen Bereichen versagen, etwa bei autonomen Fahrzeugen oder in der Medizintechnik. 6. Emotionale KI im Gesundheitswesen Auch im Gesundheitssektor entstehen neue Haftungsrisiken. Bis 2027 werden 70 Prozent der Gesundheitsdienstleister in ihren Verträgen Bedingungen zu emotionaler KI aufnehmen. Sie wollen sich rechtlich dagegen absichern, verklagt zu werden, weil eine KI beispielsweise eine Depression nicht erkannt hat oder falsch auf emotionale Signale eines Patienten reagierte. 7. „Anti-Digital-Richtlinien“ gegen Sucht Ein weiteres Risiko ist die digitale Abhängigkeit. Gartner prognostiziert, dass bis 2028 die zunehmende Immersion in digitale Welten zu Isolation und Suchtverhalten führt. Als Reaktion darauf werden 70 Prozent der Unternehmen „Anti-Digital-Richtlinien“ einführen, etwa feste „Offline-Zeiten“ oder Meeting-freie Tage, um die mentale Gesundheit zu schützen. 8. Missbrauch von KI-Agenten Die Sicherheit von Unternehmen wird durch KI-Agenten fundamental bedroht. Bis 2028 wird schätzungsweise ein Viertel aller Sicherheitsverletzungen in Unternehmen auf den Missbrauch von KI-Agenten zurückzuführen sein. Dies gilt sowohl für externe Angreifer als auch für böswillige Insider, die automatisierte Systeme für Datendiebstahl oder Sabotage nutzen. 9. Angriff auf Office und Co. Die Dominanz alter Software-Giganten wackelt. Bis 2027 werden KI-Agenten und generative KI die etablierten Produktivitäts-Tools wie Office-Suiten herausfordern. Gartner erwartet eine Marktverschiebung im Wert von 58 Milliarden US-Dollar, da neue, effizientere Werkzeuge die alten, starren Arbeitsweisen ersetzen. 10. Programmierbares Geld Schließlich wird KI das Geld selbst verändern. Bis 2030 werden 20 Prozent aller globalen Geldtransaktionen programmierbare Bedingungen enthalten. KI-Agenten können dann autonom Verträge aushandeln und Zahlungen ausführen, sobald bestimmte Kriterien erfüllt sind, was den Handel und die Finanzwelt fundamental verändern könnte. Diese Prognosen zeichnen ein Bild einer Zukunft, in der KI kein reines Werkzeug mehr ist, sondern ein fundamentaler Akteur in Wirtschaft und Gesellschaft.

  • Claude Code jetzt viel einfacher zu nutzen

    anthropic grafik mit code

    Nano Banana

    Kurzfassung

    Quellen

    Anthropic hat sein KI-Programmier-Tool Claude Code als Web-App und für iOS veröffentlicht. Entwickler können nun KI-Agenten parallel in der Cloud statt nur im Terminal nutzen. Das Tool generiert bereits über 500 Millionen Dollar Jahresumsatz und konkurriert direkt mit GitHub Copilot und Google Jules. Der Zugang erfolgt über die Pro- und Max-Abos von Anthropic und läuft als Beta-Preview.

    Anthropic Official – Claude Code on the web Anthropic X/Twitter – Introducing Claude Code on the web announcement Anthropic YouTube – Claude Code on the web (Official Demo) TechCrunch – Anthropic brings Claude Code to the web Engadget – Anthropic brings Claude Code to iOS and the web

    Anthropic verlagert sein KI-Programmierwerkzeug Claude Code aus dem Terminal. Das Tool ist ab sofort als Web-Anwendung und für iOS verfügbar. Dieser Schritt macht die Technologie einem breiteren Publikum zugänglich und verschärft den Wettbewerb mit Microsoft und Google. KI-Agenten direkt in der Cloud Bisher war Claude Code ein Werkzeug für Entwickler, die sich auf der Kommandozeile zu Hause fühlen. Die neue Web-Oberfläche ändert das grundlegend. Nutzer können sich nun direkt im Browser mit ihren GitHub-Konten verbinden und Programmieraufgaben an die KI delegieren. Das System läuft als Beta-Forschungs-Preview für zahlende Pro- und Max-Abonnenten. Der eigentliche Clou ist die Arbeitsweise der KI. Statt nur Code Zeile für Zeile zu vervollständigen, können Entwickler mehrere KI-Agenten parallel in der Cloud starten. Diese Agenten arbeiten in einer isolierten, sicheren Sandbox-Umgebung an komplexen Aufgaben. Sie analysieren den Code, schlagen Änderungen vor und können am Ende sogar fertige Pull-Requests auf GitHub erstellen. Es ist ein Ansatz, der eher einem Team von Junior-Entwicklern ähnelt als einem reinen Autocomplete-Werkzeug.

    Ein 500-Millionen-Dollar-Wettlauf Der Start der Web-App ist ein strategisch wichtiger Zug für Anthropic. Das Unternehmen steht in einem harten Wettbewerb mit GitHub Copilot von Microsoft und Googles KI-Agenten „Jules“. Während Copilot tief in die Entwicklungsumgebung integriert ist und beim Tippen hilft, zielen Claude Code und Jules darauf ab, ganze Aufgabenpakete autonom abzuarbeiten. Der Schritt ins Web scheint sich für Anthropic bereits auszuzahlen. Berichten zufolge ist die Nutzung von Claude Code seit Mai um das Zehnfache gestiegen. Das Produkt allein generiert Schätzungen zufolge einen Jahresumsatz von über 500 Millionen US-Dollar. Diese Zahlen zeigen, dass der Markt für KI-gestützte Entwicklungswerkzeuge rasant wächst. Mit der neuen, leichter zugänglichen Browser-Version dürfte sich dieser Trend weiter beschleunigen.

  • OpenAI-Insider enthüllt: Darum scheitern KI-Agenten

    Das Schaubild wie sich KI-Agenten entwickeln

    Nano Banana

    Kurzfassung

    Quellen

    OpenAI-Mitgründer Andrej Karpathy dämpft im Dwarkesh Podcast den Hype um KI-Agenten. Er prognostiziert, dass echte, autonome KI-Agenten noch mindestens ein Jahrzehnt Entwicklungszeit benötigen. Als Hauptgründe nennt er fundamentale Defizite bei Intelligenz, Gedächtnis, Multimodalität und Selbstständigkeit. Karpathy sieht den Nutzen heutiger KI eher in spezialisierten Tools, etwa beim Coding, als in universellen Agenten.

    OpenAI – Blog X (vormals Twitter), Andrej Karpathy (offiziell) YouTube – Dwarkesh Podcast mit Andrej Karpathy t3n Heise Online

    Zehn Jahre. Diese Zahl dämpft den aktuellen Hype um künstliche Intelligenz. OpenAI-Mitgründer Andrej Karpathy äußerte in einem Podcast deutliche Zweifel am Entwicklungsstand heutiger KI-Agenten. Er sieht fundamentale Hürden, die einen echten Durchbruch noch lange verhindern werden. Der Realitätscheck für KI-Agenten Die Industrie erwartet KI-Agenten, die eigenständig komplexe, mehrstufige Aufgaben lösen. Andrej Karpathy widerspricht dieser kurzfristigen Erwartung deutlich. In einem aktuellen Podcast bezeichnete er die momentanen Fähigkeiten als „kognitiv enttäuschend“. Die Systeme seien noch weit von echter Autonomie entfernt. Der Hype suggeriert, KI-Agenten könnten bald menschliche Aufgaben komplett übernehmen. Karpathy warnt jedoch vor dieser Überschätzung. Die derzeitigen Modelle seien eher verbesserte Werkzeuge als echte, selbstständige Akteure. Für den Einsatz in kritischen Bereichen fehle ihnen die nötige Zuverlässigkeit und Planungsfähigkeit. Fehlende Intelligenz und Gedächtnis Karpathy benennt konkrete technische Defizite. Den Modellen fehle es an fundamentaler Intelligenz und echtem Verständnis. Sie könnten schlecht aus Erfahrungen lernen oder ein stabiles Gedächtnis aufbauen. Stattdessen würden sie oft in Schleifen scheitern oder einfache Fehler wiederholen. Auch die Multimodalität sei eine große Baustelle. Ein echter Agent müsse seine Umgebung wahrnehmen und Aktionen ableiten. Aktuelle Systeme seien meist auf Text beschränkt. Die Integration von Sehen, Hören und Handeln funktioniere noch nicht robust genug für autonome Einsätze. Spezialisierte Tools statt Universalagenten Der OpenAI-Experte unterscheidet klar zwischen universellen Agenten und spezialisierten Tools. Letztere sieht er positiv. Besonders beim Programmieren seien KI-Werkzeuge schon heute sehr nützlich. Sie agieren dort als fähige Assistenten, nicht als autonome Entwickler. Diese spezialisierten Helfer können repetitive Aufgaben im Code übernehmen. Sie sind aber auf einen engen, klar definierten Bereich beschränkt. Der Sprung zu einem universellen Agenten, der beliebige Ziele in einer komplexen Umgebung verfolgt, sei gewaltig. Karpathy rechnet deshalb erst im kommenden Jahrzehnt mit einem echten Durchbruch.