Schlagwort: Sekunden

  • OpenAI bringt neue KI-Modelle für reaktionsschnelle Subagenten

    Ein kleiner schneller Programmierer programmiert mit gpt 5.4 mini

    Nano Banana

    Kurzfassung

    Quellen

    OpenAI positioniert GPT-5.4 mini und nano gezielt als extrem schnelle Subagenten für komplexe Entwickler-Workflows.
    Die Modelle arbeiten doppelt so schnell wie ihre Vorgänger, fassen bis zu 400.000 Token und glänzen bei der automatisierten Programmierung sowie der visuellen Steuerung von Oberflächen.
    Dank der optimierten Architektur sinken Latenzzeiten und API-Kosten drastisch, sodass komplexe Aufgaben in unter 100 Sekunden für wenige Cent gelöst werden.

    OpenAI: Introducing GPT 5.4 mini und nano

    OpenAI hat die Sprachmodelle GPT-5.4 mini und GPT-5.4 nano offiziell veröffentlicht. Das Unternehmen richtet die neuen Versionen ganz gezielt auf einen speziellen Einsatzzweck aus: Sie sollen als reaktionsschnelle „Subagenten“ in automatisierten Arbeitsabläufen dienen. Fokus auf agentische Systeme Schon der Vorgänger verarbeitete Bilder, Text und Code nativ. Nun ändert sich jedoch die Philosophie in der praktischen Anwendung. In modernen Umgebungen plant ein großes Hauptmodell komplexe Aufgaben und delegiert die reine Ausführung an kleine, schnelle Worker-Modelle. Genau für diese ausführende Rolle hat OpenAI GPT-5.4 mini und nano optimiert. Sie richten sich an Entwickler, bei denen die Latenz das direkte Nutzererlebnis bestimmt. Dazu zählen flüssige Coding-Assistenten oder Systeme, die Bildschirminhalte in Echtzeit auslesen. Beide Modelle arbeiten dabei mehr als doppelt so schnell wie die vorherige Generation. OpenAI hat zudem das Kontextfenster auf 400.000 Token erweitert, damit die KI auch große Code-Datenbanken problemlos am Stück überblickt. Anzeige Starke Werte bei Programmierung und Vision Die aktuellen Benchmarks stützen diese neue Ausrichtung. Bei der Softwareentwicklung (SWE-bench Pro) erreicht GPT-5.4 mini 54,4 %. Das kompaktere nano-Modell kommt auf 52,4 %. + Quelle: OpenAI Auch bei der visuellen Steuerung von Computern punktet das Update. Im OSWorld-Verified Benchmark erzielt das mini-Modell 72,1 %. Es liegt damit fast gleichauf mit dem großen Flaggschiff GPT-5.4, das 75,0 % erreicht. Bei dieser rein visuellen Aufgabe zeigt das kleine nano-Modell mit 39,0 % allerdings noch Schwächen. Das logische Denken, das sogenannte Reasoning, wurde ebenfalls in die kleinen Modelle integriert. Im anspruchsvollen GPQA Diamond Benchmark liefert das mini-Modell starke 88,0 % korrekte Antworten. Auch der Zugriff auf externe Programme (Tool-Calling) gelingt deutlich besser. Im Toolathlon-Test steigert sich GPT-5.4 mini auf 42,9 %. Kosten und Latenz im Praxis-Check Der eigentliche Sprung zeigt sich in der reinen operativen Effizienz. Messdaten zum SWE-bench Pro verdeutlichen die Vorteile. Eine komplexe Programmier-Aufgabe dauert mit dem großen GPT-5.4 Modell oft über 1.000 Sekunden und kostet den Entwickler rund 0,85 US-Dollar. GPT-5.4 mini erledigt den gleichen Auftrag in etwa 200 bis 400 Sekunden. Der Preis fällt dabei auf extrem günstige 0,10 bis 0,30 US-Dollar. Wer auf absolute Geschwindigkeit setzt, nutzt GPT-5.4 nano, welches die Ergebnisse in knapp 100 Sekunden liefert. + + Quelle: OpenAI Die finalen Preise für die API-Schnittstelle unterstreichen den Sparkurs. GPT-5.4 mini kostet 0,75 US-Dollar pro Million Input-Token und 4.50 US-Dollar pro Million Output Token. Das nano-Modell wird für lediglich 0,20/1,25 US-Dollar angeboten. Weitere Benchmarks: + + Quelle: OpenAI

  • Cursor erfasst neue Codebasen in 21 Sekunden statt vier Stunden

    App-Icon mit geometrischem 3D-Würfel in Schwarz-Weiß auf buntem Hintergrund, darunter Schriftzug "CURSOR"

    Der KI-Coding-Assistent Cursor soll die Indexierungszeit großer Codebasen von über vier Stunden auf 21 Sekunden verkürzen.

    Der Artikel Cursor erfasst neue Codebasen in 21 Sekunden statt vier Stunden erschien zuerst auf The Decoder.

  • Snaps SnapGen++ generiert hochauflösende KI-Bilder in unter zwei Sekunden direkt auf dem iPhone

    Mehrfach überlagerte Snapchat-Geister-Logos mit buntem RGB-Glitch-Effekt vor weißem Hintergrund.

    Diffusion Transformer galten als zu groß fürs Handy. Snap widerlegt das: SnapGen++ generiert 1024-Pixel-Bilder in 1,8 Sekunden auf dem iPhone und schlägt dabei angeblich deutlich größere Servermodelle.

    Der Artikel Snaps SnapGen++ generiert hochauflösende KI-Bilder in unter zwei Sekunden direkt auf dem iPhone erschien zuerst auf The Decoder.

  • Leaks zu Veo 3.1 fordern Sora 2 heraus

    Veo 3.1 auf dem Thron

    Nano Banana

    Kurzfassung

    Quellen

    Google hat Veo 3.1 veröffentlicht, eine neue Version seines KI-Video-Generators, die als direkter Konkurrent zu OpenAIs Sora 2 positioniert ist.
    Das Modell erzeugt Videos von bis zu 30 Sekunden Länge in 1080p-Qualität und bietet eine deutlich verbesserte Audio-Engine.
    Nutzer erhalten erweiterte kreative Kontrolle durch Multi-Szenen-Generierung, die Verwendung von Referenzbildern und kinematographische Voreinstellungen.
    Erste Vergleiche deuten auf eine Überlegenheit bei Bildkonsistenz und Physik-Simulation gegenüber der Konkurrenz hin, was einen neuen Branchenstandard setzt.

    Threads
    YouTube (AI Luke)
    Freejobalert.com
    YouTube (Pania Thong)
    Higgsfield

    In der Tech-Branche kursieren brisante Gerüchte. Während Konkurrent OpenAI mit Sora 2 die öffentliche Aufmerksamkeit genießt, scheint Google im Stillen seinen Gegenschlag vorzubereiten. Erste Leaks zu einem neuen Modell namens Veo 3.1 deuten auf ein massives Upgrade hin, das die Machtverhältnisse neu ordnen könnte. Der 30-Sekunden-Konter Die spektakulärste Information aus den Leaks ist eine massive Verlängerung der Videolänge. Während aktuelle Modelle oft an kurze Clips gebunden sind, soll Veo 3.1 Videos von 30 Sekunden und möglicherweise sogar bis zu einer Minute Länge erzeugen können. Diese angebliche Fähigkeit wäre ein direkter Angriff auf die Konkurrenz. Sie würde Kreativen erlauben, komplexere Geschichten zu erzählen, ohne einzelne Szenen mühsam aneinanderreihen zu müssen. Dieser Sprung verändert die Spielregeln fundamental. Die Beschränkung auf wenige Sekunden war bisher eine der größten Hürden für den professionellen Einsatz von KI-Videogeneratoren. Sollten sich die Gerüchte bewahrheiten, hätte Google hier einen entscheidenden Vorteil errungen. + Quelle: Twitter – Alex Patrascu Gerüchte um Qualität und Kontrolle Neben der Länge soll auch die Qualität einen erheblichen Sprung machen. Die durchgesickerten Informationen sprechen von einer nativen Auflösung von 1080p, was gestochen scharfe Ergebnisse verspricht. Damit zieht Google nicht nur mit der Konkurrenz gleich, sondern etabliert HD-Qualität als neuen Standard für längere KI-Clips. Gleichzeitig verdichten sich die Hinweise auf eine verbesserte Charakterkonsistenz. Das war bisher eine Schwachstelle vieler Modelle. Veo 3.1 soll in der Lage sein, das Aussehen von Personen und Objekten über mehrere Szenen hinweg stabil zu halten. Berichte über neue Multi-Prompt-Funktionen deuten zudem darauf hin, dass Nutzer bald ganze Sequenzen aus einer einzigen Anweisung heraus erstellen können. Mehr werden wir sicherlich in den nächsten Tagen, vielleicht schon heute Abend erfahren…

  • Schon wieder Signal: Unbekannte imitieren mit KI-Stimme US-Außenminister Rubio in Chats

    „Du brauchst nur 15 bis 20 Sekunden Audio – und plötzlich spricht Marco Rubio genau das, was du willst.“

    Der Artikel Schon wieder Signal: Unbekannte imitieren mit KI-Stimme US-Außenminister Rubio in Chats erschien zuerst auf THE-DECODER.de.