Schlagwort: Agenten

  • „Chat ist tot“: OpenAI will ChatGPT vom Chatbot zum persönlichen Agenten machen

    OpenAI plant den größten Umbau von ChatGPT seit dem Launch: Der Chatbot soll zur „Superapp“ mit Coding-Tools, KI-Agenten und Partner-Apps wie Canva und Booking.com werden. „Chat ist tot“, heißt es intern – die Zukunft liege bei Agenten, die eigenständig Aufgaben erledigen.

    Der Artikel „Chat ist tot“: OpenAI will ChatGPT vom Chatbot zum persönlichen Agenten machen erschien zuerst auf The Decoder.

  • Anthropic stellt »dynamic workflows« für Claude Code vor

    claude code orchestriert agenten

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Anthropic integriert dynamische Workflows in Claude Code, um komplexe Programmieraufgaben vollautomatisch End-to-End zu lösen.
    Die KI schreibt eigenständig JavaScript-Skripte zur Orchestrierung und koordiniert hunderte parallel agierende Subagenten in einer Sitzung.
    In einem Praxistest wurde die Laufzeitumgebung Bun mit 750.000 Zeilen Code innerhalb von elf Tagen erfolgreich von Zig nach Rust portiert.
    Die neue Funktion sorgt für einen deutlich erhöhten Token-Verbrauch und lässt sich von Firmen-Administratoren zentral einschränken oder deaktivieren.

    Anthropic Blog – Introducing dynamic workflows in Claude Code
    Claude Code Docs – Orchestrate subagents at scale with dynamic workflows

    Anthropic erweitert passend zur Claude Opus 4.8 Einführung die Entwicklerumgebung Claude Code um dynamische Workflows, die komplexe Programmieraufgaben autonom bewältigen. Die Neuerung ermöglicht es der KI, eigene Orchestrierungsskripte zu schreiben und hunderte Subagenten parallel in einer einzigen Sitzung zu steuern.

    Top News
    Claude Opus 4.8 überrascht mit Neuerungen
    Anthropic zeigt ein neues KI-Modell mit steuerbarer Rechenintensität und hunderten parallelen Agenten für riesige Code-Aufgaben.

    Skripte steuern parallele Subagenten Die Steuerung komplexer Aufgaben erfolgt über JavaScript-Skripte, welche die KI auf Basis von Prompts autonom generiert. Diese Skripte übernehmen logische Verzweigungen sowie die temporäre Speicherung von Zwischenergebnissen. Dadurch wird das begrenzte Kontextfenster des Hauptmodells entlastet, da nur das Endergebnis in der Konversation erscheint. Über die neue Konfiguration »ultracode« lässt sich zudem die höchste Stufe der Denkleistung aktivieren. In diesem Modus entscheidet Claude eigenständig, wann ein solcher Workflow für eine anstehende Aufgabe gestartet werden muss. Unabhängige Agenten können dabei Code-Ergebnisse gegenseitig prüfen und fehlerhafte Ansätze autonom korrigieren. Anzeige Von Zig zu Rust in elf Tagen Die Leistungsfähigkeit dieser parallelen Architektur demonstriert ein internes Projekt zur vollständigen Portierung der bekannten Laufzeitumgebung Bun. Innerhalb von elf Tagen übersetzten die autonomen Agenten rund 750.000 Zeilen Code von der Programmiersprache Zig in Rust. Am Ende des Prozesses bestanden 99,8 Prozent der ursprünglichen Testsuite die Qualitätskontrolle. Hunderte von Agenten arbeiteten hierbei simultan an der Code-Basis, während separate Reviewer-Instanzen jede modifizierte Datei kontrollierten. Da das System den Fortschritt kontinuierlich abspeichert, können unterbrochene Durchläufe exakt an der letzten Position wieder aufgenommen werden. + Quelle: Anthropic Hoher Verbrauch und Administration Da die simultane Nutzung von bis zu 16 parallelen Agenten erhebliche Rechenressourcen beansprucht, steigt der Token-Verbrauch bei diesen Prozessen stark an. Anthropic empfiehlt Entwicklern daher, die Technologie zunächst an kleineren Projekten zu testen, um ein Gefühl für die Auslastung zu bekommen. Für Programmierer in den Tarifen Max und Team ist die Funktion in der Befehlszeile sowie den IDE-Erweiterungen bereits freigeschaltet. Administratoren in Unternehmen können die Workflows über die zentralen Einstellungen komplett sperren. Dies gilt gleichermaßen für die Integrationen in Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry.

  • Neobroker Robinhood lässt KI-Agenten für Kunden Aktien handeln und mit Kreditkarte einkaufen

    Robinhood lässt Kunden KI-Agenten wie Anthropics Claude per MCP-Protokoll mit einem separaten Anlagekonto verknüpfen. Die Agenten können eigenständig Aktien handeln. Die US-Brokeraufsicht FINRA stuft solche Agenten bereits als neues Risikofeld ein und warnt vor unkontrollierten Entscheidungen. Auch Robinhood selbst räumt ein: Das Produkt sei nicht für alle Anleger geeignet.

    Der Artikel Neobroker Robinhood lässt KI-Agenten für Kunden Aktien handeln und mit Kreditkarte einkaufen erschien zuerst auf The Decoder.

  • Warum KI-Agenten noch miserable Verhandlungspartner sind

    Ein Roboter kauft ein

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Ein neuer Benchmark testet die Fähigkeiten von KI-Agenten in sozialen Verhandlungssituationen.
    Aktuelle Sprachmodelle erledigen Aufträge zwar verlässlich, stimmen aber oft sehr schlechten Konditionen zu.
    Besonders bei Preisverhandlungen auf Marktplätzen verschenken die digitalen Helfer fast den kompletten Spielraum.
    Zudem zeigen sich die Modelle bei manipulativen Gegenübern anfällig und lehnen bösartige Anfragen selten ab.

    Microsoft Research – SocialReasoning-Bench: Measuring whether AI agents act in users’ best interests

    Künstliche Intelligenz übernimmt zunehmend eigenständige Aufgaben wie Terminplanungen oder Preisverhandlungen. Ein neuer Benchmark von Microsoft Research offenbart dabei eine gravierende Schwäche aktueller Modelle. Die Agenten schließen ihre Aufträge zwar zuverlässig ab, lassen sich dabei aber oft drastisch übervorteilen. Der SocialReasoning-Bench misst Verhandlungsgeschick Forscher überprüfen das soziale Denkvermögen von KI-Agenten in zwei praxisnahen Szenarien. Im Kalender-Management verhandeln die Modelle Termine mit anderen Agenten. Beim Marktplatz-Test feilschen sie um den besten Kaufpreis für ein Produkt. Dabei reicht es für eine gute Bewertung nicht mehr aus, die Aufgabe lediglich erfolgreich zu beenden. Zwei völlig neue Metriken bewerten stattdessen die tatsächliche Qualität der Arbeit. Die »Outcome Optimality« misst, wie viel Wert der Agent für seinen Auftraggeber am Ende herausholt. Die »Due Diligence« analysiert parallel den Entscheidungsprozess. Ein gutes Ergebnis zählt folglich nur, wenn die KI vorher Optionen sorgfältig geprüft und clevere Gegenangebote gemacht hat. + Quelle: Microsoft Modelle knicken bei Preisverhandlungen ein Aktuelle KI-Modelle wie GPT-5.4, Claude Sonnet 4.6 oder Gemini 3 Flash zeigen bei den Tests ein eindeutiges Verhaltensmuster. Sie erledigen fast alle Aufträge zuverlässig. Der Termin steht am Ende fest im Kalender und das Produkt wechselt erfolgreich den Besitzer. Allerdings akzeptieren die digitalen Helfer dabei fast immer extrem unvorteilhafte Konditionen. Im Marktplatz-Szenario unterschreiben nahezu alle getesteten Modelle Verträge exakt an der Schmerzgrenze des Nutzers. Sie verschenken dadurch den kompletten Verhandlungsspielraum. GPT-4.1 verhält sich in 95 Prozent dieser Fälle schlichtweg nachlässig und wägt keinerlei Alternativen ab. Im Kalender-Szenario schneiden die Agenten etwas besser ab. Gemini 3 Flash agiert hier in 90 Prozent der Fälle robust und sichert gute Zeiten für den Nutzer. Dennoch landen die vereinbarten Termine über alle Modelle hinweg im Durchschnitt unterhalb des optimalen Mittelwerts. + + Quelle: Microsoft Schutzmaßnahmen greifen zu kurz Spezielle Anweisungen im Vorfeld sollen die KI zu härteren Verhandlungen zwingen. Dieses defensive Prompting verbessert die Resultate in beiden Kategorien auch spürbar. GPT-5.4 profitiert am stärksten von diesen Vorgaben. Die Lücke zu einem wirklich makellosen Ergebnis schließt dieser Kniff jedoch nicht. Kritisch wird die Situation bei gezielten Manipulationen. Konfrontieren die Tester die Agenten mit aggressiven Gegenspielern, bricht die Qualität der Ergebnisse dramatisch ein. Die KI-Assistenten lehnen schädliche Kalenderanfragen fast nie ab. Einzig Claude Sonnet 4.6 verweigert bei 47 Prozent der bösartigen Termin-Anfragen die Kooperation. Andere Sprachmodelle weisen hier lediglich Abwehrraten zwischen fünf und 15 Prozent auf. Zukünftig müssen Entwickler den Modellen genauer beibringen, wann ein harter Verhandlungsstil nötig ist und wann ein Kompromiss ausreicht. Die aktuelle Generation agiert in sozialen Konfliktsituationen oft noch zu nachgiebig. Anzeige

  • KI-Agenten industrialisieren den Identitätsdiebstahl

    Ein Bloomberg-Bericht zeichnet nach, wie generative KI und autonome Agenten Identitätsdiebstahl in den USA beschleunigen, von der Sozialversicherungsnummer-Suche im Darknet bis zum Deepfake-Führerschein.

    Der Artikel KI-Agenten industrialisieren den Identitätsdiebstahl erschien zuerst auf The Decoder.

  • Google DeepMinds größte Studie zu »AI Agent Traps«

    Ein harmloses Landschaftsbild wird mit einer Lupe untersucht

    Nano Banana

    Kurzfassung

    Quellen

    Google DeepMind deckt in einer neuen Studie auf, dass Webseiten autonome KI-Agenten gezielt durch versteckte Befehle in HTML-Code und Bilddateien manipulieren.
    Webserver identifizieren KI-Modelle anhand von Verhaltensmustern und liefern diesen modifizierte Inhalte aus, welche für menschliche Augen gänzlich unsichtbar bleiben.
    Diese injizierten Befehle zwingen die Agenten zu fremdgesteuerten Aktionen, die sich in verknüpften Multi-Agenten-Systemen wie ein Lauffeuer ausbreiten.
    Die Untersuchung an aktuellen Modellen zeigt abschließend, dass herkömmliche Sicherheitsvorkehrungen gegen diese Angriffsvektoren nahezu wirkungslos sind.

    Google DeepMind – AI Agent Traps

    Google DeepMind hat die bisher größte empirische Studie zur Manipulation von KI-Modellen veröffentlicht. Webseiten identifizieren autonome Agenten mittlerweile fehlerfrei und spielen diesen zielgerichtet versteckte Befehle aus. Dadurch findet eine weitreichende Fremdsteuerung statt, die für Nutzer völlig unsichtbar bleibt. Unsichtbare Fallen im Quelltext Anhand von 502 Teilnehmern aus acht Ländern beleuchtet die umfassende Untersuchung insgesamt 23 verschiedene Angriffsarten. Analysiert wurden bei diesem Testabgleich unter anderem KI-Modelle von OpenAI, Anthropic und Google. Das zentrale Resultat belegt dabei keine bloße theoretische Schwachstelle, sondern eine bereits im großen Stil stattfindende Unterwanderung der Agenten. Dafür verbergen Angreifer böswillige Anweisungen strategisch klug in HTML-Kommentaren oder nutzen spezielle Formatierungen, um Textpassagen für das menschliche Auge komplett auszublenden. Die eingesetzten KI-Modelle lesen diese unsichtbaren Abschnitte jedoch systematisch aus und befolgen die darin eingebetteten Befehle. Sogar scheinbar harmlose PDF-Dokumente zwingen die Assistenzsysteme durch integrierte Steuerungsbefehle zu unerwünschten Handlungen. + Multimodale Angriffe und visuelle Täuschung Einen weiteren essenziellen Angriffsvektor stellt die Verarbeitung von visuellen Medien dar. Mittels Steganografie verankern Täter schädliche Kommandos tief in den einzelnen Pixelstrukturen von Bildern. Betrachtet ein Mensch das entsprechende Foto auf seinem Monitor, fallen keinerlei optische Veränderungen auf. Multimodale Modelle werten die Pixel jedoch analytisch aus und extrahieren die versteckten Instruktionen exakt. Solche Injektionen hebeln etablierte Sicherheitsrichtlinien völlig unbemerkt aus. Erhält ein System einen derartigen versteckten Auftrag, überschreibt es seine ursprünglichen Ziele drastisch und leitet sensible Daten heimlich ab. Entsprechend läuft dieser gesamte Vorgang vollständig im Hintergrund ab. + Die Asymmetrie der Datenbeschaffung Serverbetreiber erkennen externe KI-Modelle zunehmend durch die Auswertung spezifischer Verhaltensmuster, Zeitstempel und sogenannter User-Agent-Strings. Registriert die Infrastruktur einen automatisierten Besucher, liefert sie umgehend eine speziell manipulierte Version der Webseite aus. Menschliche Nutzer erhalten exakt im selben Moment den völlig regulären, sauberen Inhalt geliefert. Beauftragt eine Person ihren Assistenten anschließend mit der Zusammenfassung einer solchen Internetpräsenz, differiert die Antwort folglich stark vom eigentlich sichtbaren Text. Das Modell verarbeitet strikt die verdeckt zugestellten Datenpakete. Es besitzt keine sensorische Möglichkeit zu erkennen, dass es getäuscht wurde und kann den Nutzer dementsprechend nicht über den Vorfall aufklären. + Kaskadeneffekte in vernetzten Systemen Besonders kritisch wirken sich diese identifizierten Schwachstellen in Konstrukten aus mehreren zusammenarbeitenden Agenten aus. Extrahiert der erste Agent verseuchte Daten aus dem Netz, reicht er diese als vertrauenswürdige Arbeitsgrundlage direkt an das nächste System weiter. Folglich wandert der eingeschleuste Befehl ungeprüft durch die komplette Verarbeitungskette. Jeder nachfolgende Agent besitzt keinerlei Anlass, den erhaltenen Informationen seiner Kollegen zu misstrauen. Das Angriffsmanöver erfordert somit keine direkte, aufwendige Kompromittierung des Basismodells. Vielmehr genügt es völlig, die konsumierten externen Datenpunkte präzise zu vergiften, um den Ablauf zu stören. + Grenzen der aktuellen Verteidigungslinien Letztendlich stellt die Studie von Google DeepMind den derzeitigen Abwehrmaßnahmen ein verheerendes Zeugnis aus. Jegliche Filterung der Eingabedaten scheitert schlicht an der enormen Größe und Variabilität der modernen Angriffsfläche. Beispielsweise lassen sich manipulierte Bildpixel zum Zeitpunkt der Inferenz nicht verlässlich blockieren. Zusätzlich greifen Sicherheitsanweisungen, die dem Agenten das Ignorieren verdächtiger Inhalte befehlen, hier zu kurz, da die injizierten Daten zumeist legitim wirken. Reine menschliche Kontrolle bietet bei der schieren Arbeitsgeschwindigkeit autonomer Prozesse ohnehin keinen praktikablen Ausweg mehr. Die Infrastruktur für derartige Angriffe existiert bereits, effektive Schutzmechanismen fehlen den Systemen hingegen noch immer. Anzeige

  • ChatGPTs neue Workspace-Agents arbeiten auch weiter, wenn der Nutzer offline ist

    OpenAI bringt sogenannte Workspace-Agents in ChatGPT. Die von Codex angetriebenen Agenten sollen komplexe Team-Workflows automatisieren und auch dann weiterarbeiten, wenn niemand zuschaut. Die bisherigen Custom-GPTs bleiben vorerst bestehen, sollen aber perspektivisch überführt werden.

    Der Artikel ChatGPTs neue Workspace-Agents arbeiten auch weiter, wenn der Nutzer offline ist erschien zuerst auf The Decoder.

  • MiniMax Skills: Neue Open-Source-Fähigkeiten für KI-Agenten

    MiniMax Github Oberflaeche

    Nano Banana

    Kurzfassung

    Quellen

    MiniMax-AI stellt ein neues Open-Source-Repository mit kuratierten Skills für KI-Agenten zur Verfügung.
    Die Sammlung liefert Programmier-Assistenten strukturierte Vorlagen für die App-Entwicklung und die Dokumentenverarbeitung.
    Entwickler binden die Funktionen lokal ein und erweitern so die Fähigkeiten von Modellen wie Claude oder Cursor.
    Besonders das OpenClaw-Netzwerk profitiert von der nahtlosen Integration, was die Leistung lokaler autonomer Agenten direkt verbessert.

    GitHub – MiniMax-AI/skills

    X – aki1770: MiniMax skills repo release

    Das Entwicklerstudio MiniMax-AI veröffentlicht eine neue Open-Source-Sammlung für KI-Modelle. Das sogenannte Skills-Repository rüstet bekannte Programmier-Assistenten wie Claude oder Cursor mit spezialisierten Fähigkeiten aus. Dies erleichtert komplexe Entwicklungsaufgaben und die professionelle Dokumentenverarbeitung. Strukturierte Workflows für KI-Modelle Die bereitgestellten Plugins fungieren wie kuratierte Handbücher für autonome Agenten. Sie enthalten strukturierte Vorlagen und etablierte Vorgehensweisen für die Softwareentwicklung. Bisher scheitern viele Assistenten an umfangreichen Projekten, da ihnen der übergeordnete Kontext für die jeweilige Aufgabe fehlt. Die neuen Module beheben dieses Problem effektiv. Entwickler binden das Repository unkompliziert über Konfigurationspfade in ihre bestehenden Umgebungen ein. Die Assistenten rufen die benötigten Informationen dann während des Arbeitsprozesses selbstständig ab. Dadurch sinkt die Fehlerquote bei aufwendigen Code-Strukturen merklich. Zu den direkt unterstützten Bereichen gehört die native App-Entwicklung für iOS und Android. Auch anspruchsvolle visuelle Effekte wie komplexe GLSL-Shader oder Partikelsysteme generieren die Agenten mit den Vorgaben deutlich präziser. Anzeige Dokumentenverarbeitung und freier Quellcode Neben der reinen Softwareentwicklung deckt das Repository alltägliche Büroaufgaben ab. Die KI-Modelle erhalten durch die Plugins exakte Anweisungen für die professionelle Erstellung und Bearbeitung von PDF-Dateien, PowerPoint-Präsentationen und Excel-Tabellen. Der gesamte Code steht unter der freien MIT-Lizenz öffentlich zur Verfügung. Dies erlaubt der Entwicklergemeinde, die Module frei zu nutzen und an eigene Bedürfnisse anzupassen. So ergänzen Programmierer das System schnell um gänzlich eigene Fähigkeiten. + Quelle: github minimax Vorteile für das OpenClaw-Netzwerk Besonders das OpenClaw-Netzwerk zieht einen direkten Nutzen aus dieser Veröffentlichung. Die neuen Fähigkeiten passen sich problemlos an das erweiterbare Format von OpenClaw an, welches Modelle von MiniMax nativ unterstützt. Diese Kompatibilität stärkt die Leistung lokaler, autonomer Agenten spürbar. Entwickler erhalten eine robuste Grundlage, um verschiedene Systeme besser miteinander kommunizieren zu lassen und Arbeitsabläufe weiter zu automatisieren.

  • Nvidia NemoClaw sichert OpenClaw-Agenten ab

    Jensen Huang versucht OpenClaw Bots einzufangen

    Nano Banana

    Kurzfassung

    Quellen

    Nvidia präsentiert mit NemoClaw einen neuen Open-Source-Stack, der die Ausführung autonomer OpenClaw-Agenten in Firmennetzwerken sicher steuert. Die integrierte OpenShell-Laufzeitumgebung überwacht dabei genau, auf welche Daten und Schnittstellen die Künstliche Intelligenz zugreifen darf. Für das lokale Training dieser Agenten bringt das Unternehmen den Desktop-Supercomputer DGX Station mit dem GB300-Chip sowie das skalierbare System DGX Spark auf den Markt. Fertig entwickelte KI-Anwendungen lassen sich anschließend ohne Code-Anpassungen vom Bürorechner auf die großen Rechenzentren übertragen.

    Nvidia Blog: GTC 2026 News – DGX Spark and DGX Station Paired With NVIDIA NemoClaw

    Autonome KI-Systeme planen und handeln künftig völlig selbstständig. Nvidia bringt mit dem neuen Software-Stack NemoClaw nun eine sichere Basis für das OpenClaw-Ökosystem und flankiert diese Architektur mit zwei extrem leistungsstarken Desktop-Rechnern für lokale KI-Entwickler. Kontrolle für eigenständige Code-Arbeiter KI-Anwendungen verändern sich aktuell grundlegend. Moderne Systeme warten nicht mehr nur auf einen simplen Prompt, sondern agieren als autonome Agenten. Sie schreiben Software-Code, rufen externe APIs ab, werten Daten aus und optimieren ihre eigenen Ergebnisse kontinuierlich. Um diese dauerhaft aktiven OpenClaw-Assistenten technisch abzusichern, veröffentlicht Nvidia den neuen Open-Source-Stack NemoClaw. Dieser bündelt verschiedene Anwendungen und installiert eine sichere Laufzeitumgebung namens OpenShell. Hier bestimmen Programmierer exakt, welche Rechte die Agenten im System besitzen. Die Software legt klare und strikte Grenzen fest, auf welche sensiblen Unternehmensdaten die Künstliche Intelligenz zugreift. Dadurch verhindern Firmen effektiv, dass ein autonomer Agent unkontrollierte Aktionen in einem proprietären Firmennetzwerk ausführt. Anzeige Lokale Rechenpower am Schreibtisch Solche selbstlernenden Agenten beanspruchen beim Training enorm viel Rechenleistung. Genau für diesen Zweck liefert Nvidia nun die neue DGX Station aus. Der Hersteller platziert das System als Hochleistungsrechner direkt am physischen Arbeitsplatz der Programmierer. Das Herzstück bildet der neue GB300 Grace Blackwell Ultra Desktop Superchip. Über die schnelle NVLink-C2C-Verbindung koppelt Nvidia eine Recheneinheit mit 72 Kernen direkt an den Grafikchip. Entwickler greifen so auf 748 Gigabyte zusammenhängenden Arbeitsspeicher und eine Rechenleistung von bis zu 20 Petaflops zu. Mit dieser Hardware-Basis führen Ingenieure riesige Open-Source-Modelle mit bis zu einer Billion Parametern lokal aus. Das System unterstützt zudem vollständig isolierte Umgebungen ohne jegliche Internetanbindung. Firmen aus stark regulierten Branchen wie dem Finanzsektor oder dem Gesundheitswesen schützen auf diese Weise ihre vertraulichen Daten während der Programmierung. Hardware-Partner wie Asus, Dell und Gigabyte nehmen bereits die ersten Bestellungen für die Geräte entgegen. + Quelle: Nvidia Nahtloser Wechsel auf die großen Server Für kleinere Entwicklerteams bietet der Konzern zusätzlich das Modell DGX Spark an. Dieses kompakte System integriert sich flexibel in normale Büroumgebungen und liefert ausreichend Leistung für das Prototyping. Bei stark steigendem Leistungsbedarf schalten Techniker bis zu vier Spark-Rechner direkt zusammen. Sie erstellen dadurch ein kleines Rechenzentrum im Großraumbüro. Nvidia stattet die Rechner ab Werk mit der kompletten KI-Softwareumgebung aus. Nutzer starten etablierte Open-Source-Modelle wie Google Gemma 3, Mistral Large oder Nvidias eigenes Nemotron direkt nach der Inbetriebnahme. Wenn ein lokaler Agent schließlich fehlerfrei funktioniert, verschieben die Programmierer den fertigen Code einfach auf die großen Serverfarmen im Rechenzentrum. Eine aufwendige Umschreibung der Software entfällt komplett, da die zugrundeliegende Architektur vom Schreibtisch bis zum Großrechner absolut identisch bleibt. Entwickler bringen ihre Anwendungen dadurch deutlich schneller in den produktiven Betrieb. Anzeige

  • Vom Face-Plant zu Parkour: Virtuelle Agenten lernen Akrobatik, wenn Forscher immer mehr Netzwerkschichten stapeln

    Während gängige Reinforcement-Learning-Algorithmen mit zwei bis fünf Netzwerkschichten arbeiten, steigert ein Forscherteam die Leistung eines selbstüberwachten Agenten um das 2- bis 50-Fache, indem es die Netzwerktiefe auf bis zu 1024 Schichten erhöht. Dabei entstehen völlig neue Verhaltensweisen.

    Der Artikel Vom Face-Plant zu Parkour: Virtuelle Agenten lernen Akrobatik, wenn Forscher immer mehr Netzwerkschichten stapeln erschien zuerst auf The Decoder.