Schlagwort: Agent

  • Anthropic rudert bei Claude-Abrechnung zurück und lässt Drittanbieter-Nutzung vorerst im Abo

    Anthropic stoppt die geplante Abrechnungsumstellung für das Claude Agent SDK kurz vor dem Start. Statt separater Guthaben ziehen SDK und Drittanbieter-Apps weiterhin aus den regulären Abo-Limits. Der Rückzieher fällt in eine heikle Phase: Ein Preiskampf mit OpenAI zeichnet sich ab, und der Börsengang steht bevor.

    Der Artikel Anthropic rudert bei Claude-Abrechnung zurück und lässt Drittanbieter-Nutzung vorerst im Abo erschien zuerst auf The Decoder.

  • Alibabas Qwen3.7-Plus soll als multimodaler Agent Bildschirme bedienen und Apps autonom bauen

    Alibabas Qwen-Team stellt mit Qwen3.7-Plus ein multimodales Agentenmodell vor, das visuelle Wahrnehmung, GUI-Bedienung und Programmierung in einer einzigen Agentenschleife vereint. In einer Demo entwickelte ein darauf basierender Agent autonom über elf Stunden eine Vokabel-Lern-App mit mehr als 10.000 Zeilen Code und 1.000 Agentenaufrufen. Bei Bildschirmverständnis setzt sich das Modell laut eigenen Benchmarks an die Spitze, insgesamt bleibt das Leistungsbild aber gemischt. Als proprietäres Angebot ohne offene Gewichte ist Qwen3.7-Plus preislich deutlich unter westlichen Frontier-Modellen positioniert.

    Der Artikel Alibabas Qwen3.7-Plus soll als multimodaler Agent Bildschirme bedienen und Apps autonom bauen erschien zuerst auf The Decoder.

  • ElevenLabs startet den »Flows-Agent«

    Der Flows Agent baut

    GPT-Images-2.0

    Kurzfassung

    Quellen

    ElevenLabs führt den Flows Agent als Chat-Assistenten in der Kreativumgebung ElevenCreative ein.
    Der Assistent verknüpft selbstständig über 50 Bild-, Video- und Audiomodelle auf Basis einfacher Textanweisungen.
    Ein integrierter Assist-Modus schützt vor ungewolltem Guthabenverbrauch bei teuren Berechnungen.
    Prozesse laufen im Hintergrund ab und ermöglichen eine synchrone Zusammenarbeit im Team.

    ElevenLabs – Introducing Flows Agent in ElevenCreative

    ElevenLabs integriert einen neuen KI-gestützten Chat-Assistenten in seine Design-Plattform ElevenCreative. Der sogenannte Flows Agent erstellt und steuert komplexe Abläufe für Bilder, Videos und Soundeffekte nun eigenständig auf Basis einfacher Textbefehle.

    Automatisierte Abläufe durch Chat-Befehle Anwender beschreiben künftig im seitlichen Fenster des Editors ihr gewünschtes Endergebnis, wie etwa ein Podcast-Intro mit maßgeschneiderter Musik. Die Software wählt daraufhin selbstständig passende KI-Modelle aus und verknüpft die einzelnen Elemente. Im Anschluss startet das System die Generierung der Medieninhalte. Bislang mussten Kreative diese visuellen Verbindungen manuell über ein knotenbasiertes System vornehmen. Der neue Assistent übernimmt diese Aufgaben und reagiert flexibel auf Änderungswünsche. Nutzer können per Chat den Hintergrund austauschen oder ein Videomodell wie Kling durch Googles Veo ersetzen. Die Plattform vereint für solche Anpassungen mehr als 50 verschiedene Bild- und Videomodelle. Diese werden direkt mit den hauseigenen Audiolösungen von ElevenLabs kombiniert. Anzeige Kostenkontrolle und Teamarbeit Rechenintensive Prozesse verbrauchen bei der KI-gestützten Medienproduktion schnell große Mengen an Guthaben. Um hohe Ausgaben zu verhindern, verfügt die Anwendung über einen zuschaltbaren Assist-Modus. Vor der Ausführung besonders aufwendiger Generierungen stoppt der digitale Helfer den Vorgang und bittet den Nutzer um eine ausdrückliche Freigabe. Zudem stellt die Software vorab gezielte Fragen zu Details wie der Videolänge oder der passenden Tonalität. Das minimiert teure Fehlproduktionen. Die einmal gestarteten Berechnungen laufen stabil im Hintergrund ab. Anwender können das Browser-Tab schließen und später zum fertigen Projekt zurückkehren. Die Arbeitsumgebung unterstützt zudem die synchrone Zusammenarbeit mit anderen Personen. Eingeladene Teammitglieder sehen die vom Assistenten erzeugten Verknüpfungen und Ergebnisse direkt in Echtzeit. Die neue Funktion steht registrierten Nutzern in der bestehenden Medienumgebung zur Verfügung.

  • Wer ist der beste autonome KI-Agent?

    Ein KI-Agent wird getestet

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Die Plattform Arena.ai startet einen neuen Benchmark zur Messung der Leistungsfähigkeit von autonomen KI-Agenten.
    Die Bewertung basiert nicht auf künstlichen Labortests, sondern auf über 300.000 realen Nutzersitzungen und Verhaltenssignalen.
    Die Auswertungen zeigen, dass Anwender die Agenten am häufigsten bei Programmieraufgaben oder komplexen Web-Recherchen testen.
    Im aktuellen Leaderboard dominieren die Modelle von OpenAI und Anthropic, während Google deutlich zurückliegt.

    Arena.ai – Empowering Users to Get More Done With Agent Mode
    Arena.ai – Agent Arena Leaderboard

    Die Bewertungsplattform Arena.ai veröffentlicht mit der »Agent Arena« einen neuen Benchmark für autonome Sprachmodelle. Die Rangliste misst anhand von realen Verhaltenssignalen der Nutzer, wie gut KI-Systeme komplexe Aufgaben selbstständig lösen. Reine Labortests mit künstlichen Eingaben weichen von der praktischen Leistungsfähigkeit ab.

    Praxisdaten statt Laborbedingungen Bisherige Auswertungen evaluierten die Modelle vorwiegend in einfachen Chat-Interaktionen. Die Agent Arena misst hingegen die Leistung bei der Orchestrierung von echten, mehrstufigen Aufgaben. Dabei prüfen die Betreiber, wie gut die Modelle verschiedene Hilfsmittel für einen reibungslosen Arbeitsablauf koordinieren. Die Methodik verzichtet bewusst auf vorgefertigte Eingaben oder bezahlte Evaluatoren. Stattdessen nutzt die Plattform direkte Rückmeldungen und Verhaltenssignale aus dem Arbeitsalltag der Anwender. Zu diesen Messwerten zählen die erfolgreiche Aufgabenerledigung, die Steuerbarkeit der Systeme sowie Downloads von erstellten Dateien. Bis zum 30. Mai 2026 erfasste das Leaderboard bereits 330.749 einzelne Sitzungen für diese dynamische Rangliste. Anzeige Programmieraufgaben dominieren den Testbetrieb Ein Blick auf die Aufgabenverteilung offenbart die aktuellen Präferenzen der Nutzer. KI-Agenten werden besonders intensiv für die Softwareentwicklung eingesetzt. Die Auswertung von gut 160.000 erfassten Aufgaben zeigt klare Tendenzen. Das reine Schreiben von Code führt die Liste mit einem Anteil von 17,5 Prozent an. Das Beheben von Programmfehlern ergänzt diesen Bereich mit zusätzlichen 8,9 Prozent. Allgemeine Recherchen und die Planung von Projekten landen mit 10,8 sowie 10,6 Prozent auf den nachfolgenden Plätzen. Kreatives Schreiben und die Automatisierung von Workflows spielen mit rund fünf beziehungsweise knapp vier Prozent aktuell nur eine untergeordnete Rolle. + Quelle: arena.ai OpenAI und Anthropic führen das Feld an Das Leaderboard listet derzeit 18 verschiedene Sprachmodelle und zeigt deutliche Leistungsunterschiede. OpenAI sichert sich mit GPT 5.5 in der High-Konfiguration den ersten Platz. Auf dem zweiten Rang folgt Anthropic mit Claude Opus 4.7 im speziellen Thinking-Modus. Die direkten Verfolgerplätze belegen vornehmlich andere Varianten dieser beiden Unternehmen. Google erreicht mit seinem Modell Gemini 3.1 Pro Preview aktuell nur den neunten Platz in der Rangliste. Knapp dahinter positioniert sich Gemini 3.5 Flash auf dem zehnten Rang. Die offene Konkurrenz um das Modell DeepSeek V4 Pro schließt sich auf dem zwölften Platz an. Mit der Agent Arena etabliert sich somit ein wichtiges Instrument zur Bewertung der tatsächlichen Zuverlässigkeit von Künstlicher Intelligenz im Arbeitsalltag. + Quelle: arena.ai

  • Microsofts »Agent Optimizer« verbessert und repariert KI Agenten

    Microsoft KI Agenten

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Microsoft hat den Agent Optimizer für die Foundry-Plattform als Public Preview veröffentlicht.
    Das System automatisiert die Fehlerbehebung bei KI-Agenten und ersetzt das manuelle Testen von Befehlen.
    Ein spezielles Diagnosemodell analysiert Protokolle, findet Fehlerursachen und schlägt funktionierende Anpassungen vor.
    Am Ende prüft ein Entwickler die generierten Vorschläge und gibt die beste Version frei.

    Microsoft Command Line: The agent optimization loop and how we built it in Foundry

    Microsoft veröffentlicht mit dem Agent Optimizer eine neue Automatisierungslösung für komplexe KI-Systeme in der Foundry-Umgebung. Die Software analysiert fehlerhafte KI-Agenten selbstständig und schlägt optimierte Systemkonfigurationen vor, ohne bestehende Funktionen zu beschädigen. Entwickler erhalten damit eine Umgebung, die klassische Testverfahren aus der traditionellen Softwareentwicklung auf künstliche Intelligenz überträgt. Das Ende der manuellen Fehlersuche Bisher glich die Anpassung von produktiven KI-Agenten einem riskanten Balanceakt nach dem Prinzip »Repariere eine Sache, mache zwei andere kaputt«. Entwickler passten Anweisungen an, um ein spezifisches Problem zu lösen, verursachten dadurch aber häufig neue Fehler in völlig anderen Teilbereichen. Die manuelle Fehlersuche anhand von Protokolldaten kostete enorm viel Zeit und skalierte bei einer wachsenden Anzahl an KI-Assistenten schlichtweg nicht mehr. Microsoft ändert diesen Ablauf nun grundlegend. Der neue Ansatz behandelt die Qualitätskontrolle nicht länger als mühsames Durchtesten, sondern als Suchproblem innerhalb eines großen Konfigurationsraums. Das System generiert automatisch verschiedene Lösungskandidaten, indem es Systemanweisungen, ausgewählte Modelle und Tool-Definitionen variiert. Anschließend werden diese Kandidaten streng gegen vorher festgelegte Qualitätsstandards bewertet und in einer Rangliste sortiert. + Quelle: Microsoft Ein Diagnosemodell steuert den Prozess Das Herzstück des Optimierers bildet der sogenannte Reflector. Dieses separate Sprachmodell übernimmt ausschließlich die Aufgabe, fehlerhafte Durchläufe zu lesen und den Grund für das Versagen des Agenten zu ermitteln. Darauf basierend schlägt das System zielgerichtete Änderungen vor, die exakt auf die identifizierten Schwachstellen abgestimmt sind. Die Ingenieure von Microsoft machten dabei eine entscheidende Entdeckung. Die Qualität dieses Diagnosemodells hat weitaus größere Auswirkungen auf das Endergebnis als das eigentlich ausführende Modell des Agenten. Ein präziser Reflector, der Fehler logisch herleiten kann, bringt mehr Leistungsgewinn als der einfache Wechsel auf ein größeres Sprachmodell wie GPT-5.5. Das System nimmt dem Menschen die Arbeit jedoch nicht komplett ab. Eine Automatisierung ohne menschliche Kontrolle würde Fehler langfristig nur vergrößern. Daher präsentiert die Software lediglich die besten Lösungswege, während ein Entwickler die Ergebnisse abschließend prüft und die neue Version für den produktiven Einsatz freigibt. + Quelle: Microsoft Integration und zukünftige Entwicklung Der Agent Optimizer ist derzeit als Public Preview im Foundry Agent Service verfügbar. Die Steuerung erfolgt direkt über die Kommandozeile mit lediglich fünf simplen Befehlen. Für Projekte, die noch keine eigenen Evaluierungsdaten besitzen, bietet das System zudem eine KI-gestützte Generierung von passenden Testdatensätzen auf Basis von Beschreibungen an. Microsoft plant bereits die nächsten Erweiterungen für das System. Künftig soll das Tool auch Einstellungen für die Informationsbeschaffung oder Wissensdatenbanken in die Optimierung einbeziehen. Zudem arbeiten die Entwickler an sicheren Bereitstellungsmethoden, bei denen eine neue Version zunächst nur einen kleinen Teil des echten Datenverkehrs verarbeitet und sich beweisen muss. Damit etabliert sich eine systematische und verlässliche Qualitätskontrolle für KI-Agenten im produktiven Einsatz. Anzeige

  • Claude Code stellt die »Agent View« vor

    Terminalfenster in Claude Code

    Anthropic

    Kurzfassung

    Quellen

    Entwickler erhalten eine neue Steuerungszentrale für laufende Sitzungen in Claude Code.
    Die sogenannte Agent View bündelt alle aktiven Prozesse direkt in der Kommandozeile und blendet deren aktuellen Status ein.
    Aufgaben lassen sich mühelos in den Hintergrund verschieben und bei Bedarf über eine Vorschaufunktion schnell beantworten.

    Anthropic: Agent view in Claude Code

    Entwickler erhalten eine neue Möglichkeit, mehrere KI-Agenten in Claude Code parallel zu steuern. Die sogenannte Agent View bündelt sämtliche Sitzungen in einer zentralen Übersicht innerhalb der Kommandozeile und beendet das bisherige Chaos aus zahllosen Terminal-Fenstern. Zentrale Steuerung für Code-Projekte Bisher erforderte der zeitgleiche Einsatz von KI-Modellen bei der Entwicklung oft unübersichtliche Setups. Programmierer hantierten meist mit diversen separaten Tabs oder komplexen Terminal-Multiplexern, um den Überblick zu wahren. Genau diese Hürde beseitigt die frisch integrierte Ansicht. Über einen schlichten Druck auf die linke Pfeiltaste oder den Befehl „claude agents“ gleitet ein klar strukturiertes Dashboard direkt in den Vordergrund. Innerhalb dieser Oberfläche reihen sich alle aktiven und pausierten Prozesse fein säuberlich auf. Anwender erfassen sofort visuell, welche Agenten ungestört arbeiten, welche Code-Bausteine fertiggestellt sind und wo das System zwingend auf menschliche Entscheidungen wartet.

    Nahtlose Aufgabenverlagerung Deutliche Vorteile bietet das System bei langwierigen Berechnungen oder Prüfroutinen. Komplett neue Aufgaben lassen sich durch den angehängten Parameter „–bg“ direkt im Hintergrund starten. Laufende Konversationen verschwinden gleichermaßen über den kurzen Befehl „/bg“ aus dem Sichtfeld, wodurch der eigentliche Arbeitsbereich sofort wieder für andere Dinge bereitsteht. Meldet ein Modell in der Zwischenzeit Klärungsbedarf an, markiert die Übersicht diesen Zustand unmissverständlich. Eine clevere Vorschaufunktion erlaubt es dann, die letzte Frage der KI einzusehen und direkt im selben Fenster zu beantworten. Das Verlassen der aktuellen Hauptsitzung entfällt dadurch vollständig. Reicht die kurze Vorschau nicht aus, springt man per Eingabetaste tief in den kompletten Verlauf der jeweiligen Sitzung. Anzeige Einsatzgebiete und Tarife Frühe Tester setzen diese Methodik bereits ein, um diverse Teilaufgaben in großen Code-Basen gleichzeitig anzustoßen. Entsprechend generiert das Modell aus verschiedenen unabhängigen Prompts zeitgleich mehrere fertige Pull Requests, während kleine Routinejobs unsichtbar weiterlaufen. Bereitgestellt wird die neue Funktionalität vorerst als Research Preview. Den Zugriff schaltet Anthropic gezielt für Inhaber der kostenpflichtigen Tarife Pro, Max, Team und Enterprise sowie für Nutzer der regulären API frei. Übliche Limitierungen der Anfrageraten gelten bei der parallelen Nutzung weiterhin.

  • Agent Smith zwingt die Google Server in die Knie

    Der Agent Smith lastet alle Google Server komplett aus

    Nano Banana

    Kurzfassung

    Quellen

    Google testet intern das KI-Modell »Agent Smith«, das komplexe Programmieraufgaben völlig autonom abarbeitet.
    Aufgrund des extremen Andrangs der Belegschaft musste der Konzern den Zugriff auf das Tool vorübergehend limitieren.
    Entwickler steuern und überwachen das Modell direkt über ihr Smartphone, während die Ausführung auf den Unternehmensservern stattfindet.
    Die Geschäftsführung macht die Nutzung der KI-Modelle zur Pflicht und lässt diese in die Leistungsbewertung der Mitarbeiter einfließen.

    Business Insider: Google employees are playing with Agent Smith

    Google testet derzeit ein neues KI-Modell namens »Agent Smith«, das Aufgaben wie die Softwareentwicklung autonom übernimmt. Der Andrang auf das interne Projekt ist laut Informationen von Business Insider derart hoch, dass der Konzern den Zugriff vorübergehend einschränken musste. Autonome Ausführung im Hintergrund Das KI-Modell hebt sich von bisherigen Assistenten ab, da es direkt auf die interne Infrastruktur von Google zugreift. »Agent Smith« liest interne Repositories aus und verarbeitet den Kontext konkreter Projekte. Dadurch bewältigt das Modell komplexe Aufgaben wie modulübergreifendes Refactoring oder die selbstständige Behebung von Build-Fehlern ohne menschliches Eingreifen. Entwickler weisen dem Modell Aufgaben zu, die es anschließend autonom auf den Unternehmensservern abarbeitet. Die Mitarbeiter benötigen für die Steuerung keinen permanent geöffneten Laptop. Sie überwachen die Prozesse und erteilen neue Prompts bequem über das Smartphone. Nach Abschluss der Berechnungen informiert das Modell den Auftraggeber eigenständig über den aktuellen Status. Anzeige KI-Nutzung wird zur Pflicht Der interne Andrang auf den Namensvetter des bekannten Matrix-Bösewichts kommt nicht zufällig. Die Führungsebene um CEO Sundar Pichai und Mitgründer Sergey Brin forciert die tägliche Nutzung von KI-Modellen. Google empfiehlt den Einsatz der künstlichen Intelligenz nicht mehr nur, sondern setzt diesen als feste Vorgabe voraus. Diese Erwartungshaltung des Managements fließt mittlerweile direkt in die Leistungsbewertungen der Belegschaft ein. Da die KI-Modelle direkt am produktionsnahen Code arbeiten, verlangt dies parallel nach strengen Kontrollen. Google muss Zugriffsrechte exakt verwalten und Änderungen genau nachvollziehen, wenn ein Modell derart selbstständig den Code bearbeitet. Zu den genauen technischen Spezifikationen äußert sich das Unternehmen offiziell noch nicht.

  • KI-Agent soll sich in nur einer Stunde in Recruiting-Plattform gehackt haben

    Kollage aus Leiterplatten, bunten Kabeln, entsperrtem Schloss, binärem Code und einer KI-Figur am Computer mit Schriftzug “Jack & Jill”

    Ein KI-Agent hackt eine KI-Recruiting-Plattform: Codewalls autonomer Agent verkettet vier Schwachstellen bei Jack & Jill zur vollständigen Kontoübernahme – und gibt sich dabei eigenständig als Donald Trump aus. Dieselbe Firma knackte kurz zuvor McKinseys KI-Plattform Lilli. KI-Agenten und Cybersecurity: Da wartet noch viel Arbeit.

    Der Artikel KI-Agent soll sich in nur einer Stunde in Recruiting-Plattform gehackt haben erschien zuerst auf The Decoder.

  • Prompt Injections: So werden KI-Agenten laut OpenAI sicher

    Ein OpenAI KI-Agent ist sicher

    Nano Banana

    Kurzfassung

    Quellen

    Autonome KI-Agenten sind durch ihre Anbindung an externe Schnittstellen stark durch Prompt Injections gefährdet.
    Versteckte Befehle in Texten oder Webseiten können die Modelle dazu zwingen, unautorisierte Aktionen auszuführen.
    Ein einzelnes Sprachmodell bietet keinen ausreichenden Schutz gegen diese Art der Manipulation.
    Entwickler müssen stattdessen eine Systemarchitektur mit strikten Zugriffsrechten und kontinuierlicher Überwachung aufbauen.

    OpenAI: Designing agents to resist prompt injection

    OpenAI: Prompt injections

    Autonome KI-Agenten übernehmen zunehmend komplexe Aufgaben und greifen dabei auf echte Anwendungen zu. Das macht sie anfällig für Prompt Injections, bei denen Angreifer über versteckte Textbefehle die Kontrolle übernehmen. Ein mehrschichtiges Sicherheitskonzept schließt diese Schwachstelle. Angriffsziel Schnittstelle Der klassische Chatbot beantwortet in erster Linie Fragen auf einem Bildschirm. Ein KI-Agent hingegen agiert selbstständig und nutzt dafür verschiedene APIs. Genau dieser direkte Zugriff auf E-Mail-Programme, Kalender oder Unternehmensdatenbanken schafft eine völlig neue Angriffsfläche. Wenn ein solcher Agent externe Informationen ausliest und verarbeitet, können sich in diesen Texten bösartige Anweisungen verbergen. Angreifer verstecken diese Befehle in harmlos wirkenden Webseiten oder Dokumenten. Diese sogenannten Prompt Injections zielen darauf ab, die ursprünglichen Systemvorgaben der Entwickler zu überschreiben. Sobald die KI die manipulierten Zeilen verarbeitet, ändert sie ihr Verhalten. Der Agent ignoriert seine eigentliche Aufgabe und führt stattdessen unautorisierte Befehle aus. Das reicht vom unbemerkten Weiterleiten vertraulicher E-Mails bis hin zur Manipulation von ganzen Datenbanken. Anzeige Mehrschichtige Verteidigung als Lösung Ein KI-Modell allein ist nach aktuellem Stand der Technik niemals vollständig gegen solche manipulierten Eingaben immun. Entwickler müssen die Sicherheit der Agenten stattdessen direkt in der Systemarchitektur verankern. Ein effektives Konzept setzt daher auf ein umfassendes, mehrschichtiges Verteidigungsnetz. Die Basis bildet ein gezieltes Fine-Tuning der Modelle. Die KI lernt durch dieses Training, den internen System-Prompts immer die absolute Priorität einzuräumen. Von außen zugeführte Textelemente dürfen diese Grundregeln unter keinen Umständen überstimmen. Flankiert wird diese Maßnahme durch das Prinzip der minimalen Rechte. Ein Agent erhält von der Software immer nur exakt die Zugriffsrechte, die er für den aktuellen Arbeitsschritt benötigt. Ein System, das nur Daten lesen soll, bekommt demnach keine Schreibrechte. Strikte Trennung von Inhalten Ein weiterer entscheidender Baustein ist die strikte Isolierung von externen Informationen. Der Agent behandelt eingelesene Texte aus dem Internet konsequent als reine Daten und niemals als ausführbaren Code. Zusätzlich zwingen strukturierte Ausgaben die KI dazu, Ergebnisse nur in fest definierten Formaten zurückzugeben. Den Abschluss bildet eine kontinuierliche Überwachung der laufenden Prozesse. Algorithmen analysieren die Ein- und Ausgaben in Echtzeit und schlagen bei Abweichungen sofort Alarm. Entwickler müssen diese architektonischen Schutzmechanismen von der ersten Zeile Code an mitdenken. Eine nachgelagerte Absicherung reicht bei der Komplexität moderner Agenten nicht mehr aus. Das System bleibt auf diese Weise auch bei anspruchsvollen Aufgaben stabil und wehrt Angriffsversuche frühzeitig ab.

  • Perplexity Agent API: Ein Zugang für alle KI-Modelle

    Ein Perplexity Bild über eine API

    Nano Banana

    Kurzfassung

    Quellen

    Perplexity hat die neue Agent API veröffentlicht, eine einheitliche Schnittstelle für die KI-Entwicklung.
    Entwickler erhalten darüber zentralen Zugriff auf führende Modelle von OpenAI, Google, Anthropic und xAI.
    Die Sprachmodelle werden direkt mit der Perplexity-Websuche und Funktionen zum URL-Abruf verknüpft.
    Vorgefertigte Presets erleichtern die Konfiguration und beschleunigen den Bau autonomer Software-Agenten.

    Perplexity Blog – Agent API: A managed runtime for agentic workflows

    Perplexity Docs – Agent API Quickstart

    Perplexity bietet Entwicklern mit der neuen Agent API einen zentralen Zugang zu den führenden Sprachmodellen des Marktes. Die Schnittstelle verknüpft Systeme von OpenAI, Anthropic und Google nativ mit der hauseigenen Echtzeit-Internetsuche. Eine API für alle großen Modelle Für die Entwicklung von KI-Anwendungen war bisher oft die Verwaltung diverser Schnittstellen und Accounts notwendig. Die Agent API löst dieses Problem. Sie bündelt den Zugriff auf Modelle wie z.B. GPT-5.4, Claude 4.6 und Gemini 3.1 Pro. Entwickler steuern all diese Systeme ab sofort über eine einzige Infrastruktur. Der Wechsel zwischen einem Google-Modell und einem OpenAI-Modell erfordert im Code nur noch die Anpassung weniger Zeichen. Zudem reicht das Unternehmen die originalen Token-Kosten der externen Anbieter ohne eigenen Aufschlag weiter. Nutzer zahlen somit denselben Preis, als würden sie die Modelle direkt beim jeweiligen Entwicklerstudio abrufen. Anzeige Verwaltete Laufzeitumgebung für Agenten Der technische Fokus der Neuerung liegt auf der Erstellung autonomer Arbeitsabläufe. Perplexity fungiert hierbei als verwaltete Laufzeitumgebung, also als eine Managed Runtime. Das System übernimmt im Hintergrund die komplexe Orchestrierung zwischen dem jeweiligen Sprachmodell und externen Datenquellen. Die API integriert die bekannte Perplexity-Websuche und einen URL-Abruf nativ als vordefinierte Tools in den Prozess. Externe Sprachmodelle erhalten durch diese Architektur einen reibungslosen Zugang zu aktuellen Echtzeitdaten aus dem Internet. Dadurch sinkt die Fehlerquote der Antworten spürbar. Zudem bietet die API erweiterte Kontrollmöglichkeiten für das sogenannte Reasoning. Entwickler legen genaue Token-Budgets für die Rechenzeit fest, die ein Modell für das logische Schlussfolgern aufwenden darf. Vorkonfigurierte Profile für schnelle Ergebnisse Um Entwicklungsprozesse zu beschleunigen, integriert das System sogenannte Presets. Diese vorgefertigten Profile kombinieren spezifische KI-Modelle automatisch mit den idealen Suchparametern und System-Prompts. Ein Preset wie „deep-research“ nutzt beispielsweise rechenintensive Modelle in Verbindung mit einer tiefgehenden Websuche. Für einfache Anfragen steht hingegen das Profil „fast-search“ bereit. Entwickler umgehen durch diese Voreinstellungen die aufwendige manuelle Feinabstimmung. Das Format der API orientiert sich dabei stark an bestehenden Industriestandards, wodurch sich die Endpunkte nahtlos in vorhandene Architekturen einfügen lassen. Die neue Schnittstelle vereinfacht somit die technische Grundlage für den Bau vernetzter KI-Anwendungen.