Schlagwort: Architektur

Perplexity lässt KI-Agenten ihre eigene Websuche programmieren, um Tokens zu sparen und Präzision zu erhöhen

Perplexity stellt mit „Search as Code“ eine neue Architektur vor, bei der KI-Modelle ihre Suchabläufe als Python-Code schreiben, statt eine fertige Such-API aufzurufen. Das Modell orchestriert Filterung, Deduplizierung und Reranking selbst über ein SDK in einer Sandbox. In eigenen Benchmarks liegt der Ansatz in vier von fünf Tests vor OpenAI und Anthropic, bei bis zu 85 Prozent weniger Tokenverbrauch.

Der Artikel Perplexity lässt KI-Agenten ihre eigene Websuche programmieren, um Tokens zu sparen und Präzision zu erhöhen erschien zuerst auf The Decoder.
Warum Grok 4.20 Heavy plötzlich menschliche Namen verwendet

Nano Banana

Kurzfassung
▾

Quellen
▾

xAI hat das neue Sprachmodell Grok 4.20 Heavy mit einer fortschrittlichen Multi-Agenten-Architektur veröffentlicht.
Das System verteilt komplexe Anfragen in Echtzeit auf bis zu 16 spezialisierte Sub-Agenten für Fachbereiche wie Code, Finanzen oder Psychologie.
Ein Hauptmodell koordiniert die Ergebnisse und formuliert die finale Antwort, wodurch inhaltliche Fehler deutlich reduziert werden.
Die neue Funktion erfordert enorme Rechenleistung und bleibt daher exklusiv den Abonnenten des 300 US-Dollar teuren Premium-Tarifs vorbehalten.

Elon Musk: “Try the new Grok 4.20 Heavy. It’s a major upgrade.”

Sherveen: “Grok 4.20 Heavy … runs even more subagents (16 …)”

NextBigFuture: “HOW THE XAI GROK 4.20 AGENTS WORK”

xAI schaltet für zahlende Abonnenten das Sprachmodell Grok 4.20 Heavy frei. Die neue Version nutzt eine Architektur aus 16 spezialisierten Sub-Agenten, die Nutzeranfragen in Echtzeit arbeitsteilig analysieren und beantworten. Arbeitsteilung im Rechenzentrum Anstatt sämtliche Themengebiete über ein einziges neuronales Netz abzuwickeln, zerlegt das System komplexe Prompts in Teilaufgaben. Diese leitet die Software an spezifisch trainierte Agenten weiter. Das Hauptmodell übernimmt dabei als namensgebender Agent „Grok“ die Rolle des Koordinators. Es delegiert die Anfragen, fasst die Zwischenergebnisse der spezialisierten Instanzen zusammen und formuliert die finale Ausgabe. Ein solcher Multi-Agenten-Ansatz erfordert deutlich mehr Rechenkapazität pro Anfrage, erhöht aber die Präzision. Da die jeweiligen Sub-Modelle auf engere Datensätze fokussiert sind, sinkt die Wahrscheinlichkeit für inhaltliche Halluzinationen bei fachspezifischen Fragen spürbar. Die Instanzen kommunizieren während der Bearbeitung miteinander und tauschen Daten aus, bevor der Nutzer die fertige Antwort auf dem Bildschirm sieht.

Twitter Beitrag – Cookies links unten aktivieren.

Try the new Grok 4.20 Heavy. It’s a major upgrade. https://t.co/sABp5NgpXk — Elon Musk (@elonmusk) February 18, 2026 Experten für Code, Finanzen und Biologie Die Architektur umfasst insgesamt 16 benannte Agenten, die dedizierte Wissensbereiche abdecken. Für Programmieraufgaben ist beispielsweise die Instanz „Lucas“ zuständig, während „Charlotte“ ausschließlich mathematische Berechnungen und Logikprobleme bearbeitet. Sobald ein Nutzer ein interdisziplinäres Projekt anfordert, arbeiten mehrere Agenten zusammen. Ein Skript für eine Finanzanalyse aktiviert somit „Lucas“ für den Code und „Benjamin“ für die Wirtschaftsdaten. Neben technischen Disziplinen bindet xAI auch geisteswissenschaftliche und ethische Rollen ein. „Jack“ analysiert menschliches Verhalten und Psychologie, während „Elizabeth“ kritische Denkprozesse und Richtlinien überwacht. Weitere Einheiten wie „Owen“ für globale Umweltsysteme und „Noah“ für Langzeitinnovationen ergänzen das Portfolio für strategische Planungen. Das übergeordnete Grok-Modell behält während der Orchestrierung den bekannten trockenen Humor bei und prüft die finale Faktenlage. Anzeige Zugang bleibt auf Premium-Abonnenten beschränkt Der simultane Betrieb von bis zu 16 KI-Instanzen verlangt massive Serverkapazitäten. xAI beschränkt den Zugang zu Grok 4.20 Heavy daher auf professionelle Anwender mit entsprechendem Budget. Die neue Architektur steht ausschließlich Nutzern des Heavy-Abonnements zur Verfügung, das weiterhin mit 300 US-Dollar pro Monat zu Buche schlägt.
NanoClaw schützt lokale Systeme vor unsicheren OpenClaw-Agenten

Nano Banana

Kurzfassung
▾

Quellen
▾

Das Open-Source-Projekt NanoClaw bietet eine sichere Architektur für autonome KI-Agenten.
Durch konsequentes Sandboxing und Container-Isolation wird den Modellen der direkte Zugriff auf das Host-System entzogen.
Dieser Ansatz schützt Anwender effektiv vor Schadcode, der bei OpenClaw über manipulierte Erweiterungen eingeschleust wurde.
Die Software richtet sich an Selbsthoster und verzichtet aus Sicherheitsgründen auf die Anbindung an unregulierte Marktplätze.

GitHub – gavrielc/nanoclaw (Projekt-Repo)

Reddit r/selfhosted – I built NanoClaw – a lightweight self-hosted AI assistant with …

Das Open-Source-Projekt NanoClaw liefert eine Architektur, die autonome KI-Agenten in isolierten Umgebungen ausführt und die bekannten Sicherheitslücken von OpenClaw adressiert. Der neue Ansatz zwingt Erweiterungen in Container, um den unkontrollierten Systemzugriff der Assistenz-Software konsequent zu unterbinden. Architektur gegen Schadcode Die ursprüngliche OpenClaw-Plattform gewährt KI-Modellen weitreichende Berechtigungen auf dem Host-System. Angreifer nutzten diesen Umstand in den vergangenen Wochen intensiv aus, um über manipulierte Erweiterungen Schadcode einzuschleusen und lokale Nutzerdaten abzugreifen. Das Projekt NanoClaw setzt genau an dieser Schwachstelle an und kapselt jeden Agenten in einem separaten Container ab. Das zugrundeliegende Betriebssystem bleibt dadurch vor direkten Zugriffen geschützt, da die KI-Prozesse lediglich in einer streng limitierten Laufzeitumgebung agieren. Anzeige Ressourcenverbrauch und Rechtemanagement Laut der GitHub-Dokumentation fokussiert sich die Software auf eine ressourcenschonende Implementierung für das Selbsthosting. Anwender installieren das System auf eigener Hardware und behalten die vollständige Kontrolle über die angebundenen Sprachmodelle. Die strikte Containerisierung erfordert naturgemäß einen minimalen Overhead bei der Speicherverwaltung. Dafür limitiert diese Architektur die Ausbreitung potenzieller Trojaner auf das jeweilige Modul. Zugriffe auf das Netzwerk oder lokale Dateien geben Administratoren vorab über ein detailliertes Rechtemanagement explizit frei. Trennung der Prozesse Die konsequente Isolation der Ausführungsumgebung stellt eine etablierte IT-Sicherheitsmethode dar, die bei der Ursprungsversion von OpenClaw völlig fehlte. Fachexperten stuften das System mehrfach als enormes Risiko ein, da die Modelle generierte Systembefehle ohne Validierung direkt auf dem Host ausführten. NanoClaw implementiert nun strikte Systemgrenzen für jeden Prozess. In der Praxis muss sich jedoch zeigen, ob diese Sandboxing-Mechanismen auch komplexen Ausbruchsversuchen durch gezielte Prompt-Injection-Angriffe dauerhaft standhalten. Fokus auf lokale Ausführung Der Entwickler verzichtet bei NanoClaw bewusst auf die Anbindung an den unregulierten Marketplace, der sich bei OpenClaw als primäres Einfallstor für Malware erwies. Nutzer binden externe Funktionen stattdessen nach eigener Überprüfung manuell in die lokale Instanz ein. Die fehlende Cloud-Anbindung verhindert zudem den ungewollten Abfluss von Telemetriedaten an Drittanbieter. Der Quellcode der Software steht zur unabhängigen Inspektion auf GitHub bereit.
GLM-Image startet als ernstzunehmender Open-Source-Herausforderer

Nano Banana

Kurzfassung
▾

Quellen
▾

Zhipu AI und Huawei veröffentlichen mit GLM-Image ein leistungsstarkes Open-Source-Bildmodell, das vollständig auf chinesischen Ascend-Chips trainiert wurde. Das Modell nutzt eine innovative autoregressive Hybrid-Architektur, die besonders beim Rendering von Text und komplexen Szenenkompositionen Vorteile bietet. Der Launch demonstriert die technologische Unabhängigkeit von US-Hardware wie Nvidia-Chips und umgeht damit effektiv westliche Sanktionen.

Z.AI – GLM-Image Blog

Bloomberg – China’s Zhipu Unveils New AI Model

Hugging Face – zai-org/GLM-Image

GitHub – zai-org/GLM-Image

ZImage.run – GLM-Image: The First Open-Source Industrial-Grade Model

Chinas KI-Ambitionen erreichen eine neue Stufe der Autarkie. Mit GLM-Image erscheint erstmals ein leistungsfähiges Open-Source-Bildmodell, das vollständig auf Huawei-Hardware trainiert wurde und westliche Technologie-Sanktionen praktisch umgeht. Der Bruch mit der westlichen Hardware-Dominanz Lange Zeit galt es als ungeschriebenes Gesetz, dass Spitzenmodelle im Bereich der generativen KI zwingend auf Nvidias CUDA-Ökosystem und H100-Clustern trainiert werden müssen. Zhipu AI, eines der führenden chinesischen KI-Startups, widerlegt diese These nun eindrucksvoll. In einer strategischen Partnerschaft mit Huawei wurde das neue Modell „GLM-Image“ ausschließlich auf Huaweis Ascend-Chips trainiert. Dieser Schritt demonstriert eine funktionierende technologische Unabhängigkeit. Während US-Sanktionen den Zugang zu westlichen High-End-Chips beschränken, beweist die Veröffentlichung, dass die heimische Hardware-Infrastruktur mittlerweile leistungsfähig genug ist, um industrielle „Large Scale“-Modelle zu berechnen. Für den europäischen Markt bedeutet dies, dass ein neuer, ernstzunehmender Player das Spielfeld betritt, der nicht den Restriktionen des Silicon Valley unterliegt. + + Quelle: z.ai Hybride Architektur für präzisere Ergebnisse Technisch wagt Zhipu AI einen interessanten Vorstoß, der sich von den derzeit dominierenden Diffusionsmodellen (wie Stable Diffusion oder Flux) unterscheidet. GLM-Image setzt auf eine autoregressive hybride Architektur. Vereinfacht ausgedrückt: Das Modell „versteht“ und generiert Bilder ähnlich wie ein Sprachmodell und kombiniert das mit modernen bildgebenden Verfahren. Benchmark-Analyse: Mittelmaß bei Ästhetik, Weltklasse bei Text Ein Blick auf die nackten Zahlen bestätigt die architektonische Ausrichtung des Modells. In allgemeinen Benchmarks (OnelG_EN), die Kriterien wie Ästhetik und Bildqualität messen, positioniert sich GLM-Image im soliden Mittelfeld. Mit einem Overall-Score von 0,528 übertrifft es zwar populäre Open-Source-Modelle wie FLUX.1 [Dev] (0,434) und SD3.5 Large (0,462) deutlich, muss sich aber spezialisierten, teils geschlossenen Systemen wie „Nano Banana 2.0“ (0,578) geschlagen geben. Für ein Modell, das nicht auf Nvidia-Hardware trainiert wurde, ist diese Leistung jedoch beachtlich und absolut konkurrenzfähig. Die wahre Stärke zeigt sich jedoch beim „Text-Rendering Benchmark“ (CVTG-2k). Hier deklassiert GLM-Image die Konkurrenz. Mit einer Wort-Genauigkeit von 91,16 % belegt das Modell den ersten Platz und schlägt sogar kommerzielle Schwergewichte und Closed-Source-Modelle wie Seedream 4.5 oder GPT Image 1. Der Vorsprung zur direkten Konkurrenz ist dabei massiv: Während GLM-Image Texte fast fehlerfrei rendert, erreichen weit verbreitete Modelle wie FLUX.1 nur 49,65 % und SD3.5 Large lediglich 65,48 % Genauigkeit. Diese Daten untermauern die These, dass die autoregressive Architektur für Aufgaben, die logisches Textverständnis und präzise Darstellung erfordern, den reinen Diffusionsmodellen weit überlegen ist. + Quelle: z.ai Anzeige Open Source als Industriestandard Zhipu AI positioniert GLM-Image nicht als geschlossene Blackbox, sondern stellt es der Entwicklergemeinde als Open Source zur Verfügung. Das Modell ist ab sofort auf Plattformen wie Hugging Face und GitHub verfügbar. Damit greift das Unternehmen direkt die Marktanteile etablierter westlicher Open-Source-Alternativen an. Die Veröffentlichung richtet sich primär an industrielle Anwender. Durch die offene Lizenzierung und die Optimierung auf alternative Hardware-Stacks bietet sich das Modell für Unternehmen an, die unabhängige On-Premise-Lösungen suchen und sich nicht an die API-Kosten oder Datenschutzrichtlinien amerikanischer Anbieter binden wollen. Die kommenden Wochen werden zeigen, ob die Community die Huawei-basierte Architektur auch auf westlicher Consumer-Hardware effizient zum Laufen bekommt.
Forscher entwickeln KI-Architektur nach Vorbild des menschlichen Gehirns

Ein Start-up hat eine neue Architektur für Sprachmodelle entwickelt, die sich mehr am Aufbau des biologischen Gehirns inspiriert. Das System erreicht die Leistung älterer GPT-Modelle, arbeitet aber mit Neuronen und Synapsen.

Der Artikel Forscher entwickeln KI-Architektur nach Vorbild des menschlichen Gehirns erschien zuerst auf THE-DECODER.de.
98 % günstiger als der Vorgänger

98 % günstiger als der Vorgänger xAI stellt Grok 4 Fast vor und will damit die hohen Kosten für Spitzen-KI radikal senken – bei fast identischer Leistung. Kurzfassung | Andreas Becker, 21.09.25
gpt-image-1 | All-AI.de EINLEITUNG Das KI-Wettrüsten geht in die nächste Runde, doch diesmal stehen nicht nur reine Leistungsdaten im Fokus. Mit Grok 4 Fast schickt xAI, das Unternehmen von Elon Musk, ein neues Sprachmodell ins Rennen, das bei nahezu gleicher Performance wie das bisherige Spitzenmodell Grok 4 eine drastisch höhere Effizienz verspricht. Dieser Schritt zielt direkt auf die hohen Betriebskosten ab, die eines der größten Hemmnisse für den breiten Einsatz von Spitzen-KI darstellen. NEWS Gleiche Leistung, deutlich geringere Kosten Der Kern der Neuerung liegt in einer optimierten Architektur. Grok 4 Fast benötigt für vergleichbare Ergebnisse im Schnitt 40 Prozent weniger sogenannte „Thinking Tokens“ als sein Vorgänger. Diese Reduzierung des Rechenaufwands schlägt sich direkt in den Kosten nieder, die laut xAI um bis zu 98 Prozent sinken können. Möglich wird dies durch ein hybrides Design, das einfache Anfragen und komplexe Denkprozesse in einem einzigen Modell vereint, anstatt wie bisher zwischen unterschiedlichen Modellen zu wechseln. In etablierten Benchmarks wie GPQA Diamond oder AIME 2025 muss sich das neue Modell nicht verstecken und liegt auf einem ähnlichen Niveau wie Grok 4. Besonders hervorzuheben ist jedoch die Fähigkeit des Modells, eigenständig auf externe Werkzeuge wie einen Webbrowser oder eine Code-Ausführungsumgebung zuzugreifen. Diese „Agenten-Fähigkeiten“ wurden gezielt trainiert und führen dazu, dass Grok 4 Fast in spezialisierten Benchmarks, die solche Aufgaben bewerten, sogar besser abschneidet als sein Vorgänger und Konkurrenten wie OpenAIs Websuche-Modell. + Quelle: xAI Neue Architektur und Fokus auf praktische Anwendung Im Gegensatz zu früheren Versionen, die auf getrennte Modelle für einfache und komplexe Aufgaben setzten, integriert Grok 4 Fast beide Fähigkeiten in einer einzigen Architektur. Das Verhalten des Modells wird dabei über den System-Prompt gesteuert, was die Latenz und die Kosten für Entwickler reduziert. xAI stellt das Modell über seine API in zwei Varianten bereit, die beide auf ein beeindruckendes Kontextfenster von zwei Millionen Token zugreifen können. Die aggressive Preisgestaltung, die je nach Nutzung bei nur 0,20 US-Dollar pro einer Million Input-Token startet, unterstreicht die Strategie von xAI. Das Unternehmen will nicht nur in den Leistungs-Benchmarks an der Spitze mitspielen, sondern KI auch für anspruchsvolle, hochfrequente Aufgaben wie Websuchen und interaktive Agenten wirtschaftlich attraktiv machen. Mit der Veröffentlichung auf Plattformen wie OpenRouter und Vercel wird zudem die Zugänglichkeit für Entwickler weiter erhöht. MITMACHEN Hat Dir der Beitrag gefallen oder geholfen? Dann hilf uns mit einem Klick weiter – dauert nur Sekunden. Teile diesen Beitrag Folge uns auf Social Media Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt KI-Tools sind teuer – unser Wissen bleibt kostenlos. Spende einmalig via PayPal oder werde YouTube-Mitglied (ab 0,99 €). Dafür liefern wir täglich News, ehrliche Tests und praxisnahe Anleitungen. Danke dir! PayPal – Spende Youtube – ABO KURZFASSUNG
xAI hat Grok 4 Fast vorgestellt, ein neues KI-Modell, das die Leistung von Grok 4 bei deutlich geringeren Kosten bietet.
Durch eine optimierte Architektur sinkt der Rechenaufwand um 40%, was die Kosten pro Aufgabe um bis zu 98% reduzieren kann.
Das Modell wurde speziell für die Nutzung von Tools wie der Websuche trainiert und übertrifft hier sogar Konkurrenten.
Grok 4 Fast verfügt über ein Kontextfenster von 2 Millionen Token und eine neue hybride Architektur, die es effizienter macht.
QUELLEN
Times of India
MarkTechPost
Yahoo News
Artificial Analysis
Alibaba stellt Qwen3-Next vor: Neues Sprachmodell setzt auf schnellere MoE-Architektur

Alibaba hat mit Qwen3-Next ein neues Sprachmodell veröffentlicht, das auf eine angepasste Architektur setzt. Das Modell soll damit deutlich schneller rechnen als frühere Varianten – bei vergleichbarer Leistung.

Der Artikel Alibaba stellt Qwen3-Next vor: Neues Sprachmodell setzt auf schnellere MoE-Architektur erschien zuerst auf THE-DECODER.de.
OpenAI startet GPT-5 – mit besserem Verständnis, Personalisierung und Entwickler-Tools

Das neue KI-Modell soll durch eine adaptive Architektur intelligenter, schneller und nützlicher sein. OpenAI verspricht deutliche Fortschritte bei Benchmarks, weniger Halluzinationen und führt mit „Safe Completions“ einen neuen Ansatz für KI-Sicherheit ein.

Der Artikel OpenAI startet GPT-5 – mit besserem Verständnis, Personalisierung und Entwickler-Tools erschien zuerst auf THE-DECODER.de.
Neue KI-Architektur verspricht besseres „System 2-Denken“

Eine neue Architektur namens Energy-Based Transformer soll KI-Modellen beibringen, Probleme analytisch und schrittweise zu lösen.

Der Artikel Neue KI-Architektur verspricht besseres „System 2-Denken“ erschien zuerst auf THE-DECODER.de.