Schlagwort: Bilder

  • ChatGPT Images 2.0 ist ein riesiger Erfolg

    openai podcast 19

    GPT-Images-2.0

    Kurzfassung

    Quellen

    OpenAI verzeichnet mit dem KI-Modell Images 2.0 ein enormes Wachstum und generiert wöchentlich 1,5 Milliarden Bilder.
    Das System bietet signifikante Verbesserungen beim Textrendering, bei der Mehrsprachigkeit und beim Fotorealismus.
    Durch die Integration mit Codex nutzen Anwender die Software zunehmend für die Erstellung von Apps und Spielen.
    Zukünftige Funktionen zielen auf autonome kreative Agenten ab, die komplexe Designaufgaben übernehmen.

    YouTube – Einblick in die Renaissance der Bildgenerierung – der OpenAI-Podcast Folge 19

    OpenAIs neues KI-Modell Images 2.0 generiert wöchentlich über 1,5 Milliarden Bilder und verzeichnet einen starken Nutzungsanstieg. Ein detaillierter Einblick in die Renaissance der Bildgenerierung liefert der OpenAI-Podcast Folge 19.

    Präzision trifft auf neue Formate Der neue Bildgenerator Images-2.0 bewältigt komplexe Textdarstellungen innerhalb von Bildern fehlerfrei. Entwickler haben die Fähigkeit implementiert, Typografie in verschiedenen Sprachen akkurat zu rendern, was die Erstellung von detaillierten Infografiken vereinfacht. Gleichzeitig erzeugt die Software auf Befehl beliebige Seitenverhältnisse. Nutzer erstellen auf dieser Basis weitläufige Landschaftsaufnahmen oder stark hochkante Grafiken. Eine weitere neue Funktion erlaubt die Generierung von nahtlosen 360-Grad-Panoramen. Betrachter können sich anschließend in einer entsprechenden Softwarelösung virtuell in diesen Umgebungen umsehen. Auch beim generellen Objektverständnis zeigt das KI-Modell deutliche Fortschritte. Während frühere Versionen bei einer Anfrage nach vielen zufälligen Gegenständen schnell an ihre visuellen Grenzen stießen, positioniert Images 2.0 mittlerweile über 100 Objekte präzise in einem Raster.

    Passendes Tutorial
    ChatGPT Images 2.0 Tutorial: Prompts und Tipps 2026
    Nutze den Thinking Mode und clevere Tricks, um fotorealistische Ergebnisse ohne störende Zensur-Abbrüche zu generieren.

    Vom einfachen Bild zur Softwareentwicklung Neben der reinen Optik rückt die Kombination verschiedener KI-Systeme in den Fokus. Anwender verknüpfen Images 2.0 zunehmend direkt mit dem Programmier-Modell Codex. Die Bildgenerierung liefert dabei die grafischen Assets, während Codex den dazugehörigen Programmcode für Webseiten oder kleine Applikationen schreibt. Besonders in der Spieleentwicklung erweist sich diese Methode als nützlich. Das System erstellt konsistente Sprite-Sheets für Charaktere und behält deren Aussehen über verschiedene Posen hinweg bei. Selbst mehrseitige Comic-Konzepte lassen sich durch diese neu gewonnene visuelle Konstanz stringenter umsetzen. Der sogenannte Thinking-Modus erweitert die Einsatzmöglichkeiten zusätzlich. Die Software greift dabei selbstständig auf Web-Suchen zurück und analysiert bereitgestellte Dateien, um eine passgenauere Komposition zu berechnen. Entwickler planen langfristig den Übergang zu autonomen kreativen Agenten, die spezifische Aufgaben wie Architekturplanung oder Interface-Design anhand persönlicher Präferenzen übernehmen.

    Passendes Tutorial
    50 Bilder Styles für ChatGPT und Nano Banana
    50 Style Beispiele speziell für ChatGPT-Images-2.0 und Nano Banana 2. Mehr Inspiration findest du nirgends!

  • Alibabas Qwen-Team trainiert KI-Bildverständnis mit automatisch erzeugten Denkaufgaben

    Wenn KI-Modelle über Bilder nachdenken, schaukeln sich kleine Wahrnehmungsfehler über mehrere Denkschritte zu falschen Ergebnissen auf. Das Framework HopChain erzeugt mehrstufige Bildfragen, die dieses Problem gezielt adressieren und 20 von 24 Benchmarks verbessern. Dafür zerlegt es komplexe Fragen in verkettete Einzelschritte und zwingt das Modell, jedes Bildobjekt einzeln zu prüfen, bevor es eine Schlussfolgerung zieht.

    Der Artikel Alibabas Qwen-Team trainiert KI-Bildverständnis mit automatisch erzeugten Denkaufgaben erschien zuerst auf The Decoder.

  • EU verbietet vollständig KI-generierte Bilder

    EU, echte Bilder und KI Bilder

    Nano Banana

    Kurzfassung

    Quellen

    Die wichtigsten EU-Institutionen verbieten ihren Presseteams die Nutzung vollständig KI-generierter Bilder und Videos.
    KI-Modelle dürfen in Brüssel nur noch zur qualitativen Aufwertung von echtem Bildmaterial zum Einsatz kommen.
    Experten kritisieren den Schritt und fordern stattdessen einen transparenten Umgang gemäß dem europäischen AI Act.

    EU staff banned from using AI-generated content in official communications

    THE DECODER – EU-Institutionen verbieten laut Bericht KI-generierte Bilder und Videos in offizieller Kommunikation

    Techmeme auf X – The European Union’s main institutions have banned staff from using fully AI-generated videos and images in official communications

    Die Europäische Union schiebt synthetischen Medien in der Öffentlichkeitsarbeit einen Riegel vor. Kommission, Parlament und Rat untersagen ihren Teams ab sofort den Einsatz vollständig KI-generierter Bilder und Videos. Politico machte diese neue Direktive öffentlich. Fokus auf echte Aufnahmen Die Verantwortlichen in Brüssel setzen auf authentisches Bildmaterial, um das Vertrauen der Bürger zu erhalten. KI-Modelle dürfen lediglich bestehende Fotos oder Clips aufwerten. Mitarbeiter können die Technologie weiterhin nutzen, um die Auflösung von Bildern zu verbessern oder unerwünschtes Bildrauschen zu entfernen. Ein kompletter Ersatz der Realität durch Bildgeneratoren bleibt jedoch untersagt. Das Europäische Parlament mahnt seine Angestellten explizit zu besonderer Wachsamkeit gegenüber den Risiken generativer KI-Modelle. Anzeige Fachwelt übt Kritik Branchenkenner bewerten diesen strikten Kurs negativ. Walter Pasquarelli, Forscher an der Universität Cambridge, fordert einen transparenten Umgang anstelle eines Verbots. »Verantwortungsvolle Nutzung schlägt Abstinenz«, ordnet der Experte die Entscheidung ein. Analysten betonen den Widerspruch zur aktuellen Gesetzgebung. Die EU vergibt laut den Fachleuten die Möglichkeit, die Vorgaben ihres eigenen AI Acts in der Praxis zu demonstrieren. Mit sichtbaren Wasserzeichen und klaren Kennzeichnungen könnten die Behörden der Öffentlichkeit vorleben, wie ein sicherer Umgang mit synthetischen Inhalten aussehen sollte. Politiker experimentieren mit Modellen Außerhalb der EU-Behörden binden Spitzenpolitiker synthetische Bilder längst in ihre Strategien ein. In den USA veröffentlicht Donald Trump regelmäßig KI-generierte Inhalte auf seiner Plattform Truth Social. Auch europäische Staatsoberhäupter testen die Technologie aktiv. Bundeskanzler Friedrich Merz publizierte ein KI-generiertes Tanzvideo auf Instagram, um auf diese Weise über mögliche Gefahren aufzuklären. Ungarns Ministerpräsident nutzt Deepfakes hingegen gezielt für politische Attacken. Die EU-Institutionen grenzen sich von dieser Praxis ab und verzichten in der offiziellen Kommunikation weiterhin konsequent auf generierte Medien.

  • Metas KI-Modell sagt Gehirnaktivität genauer vorher als ein einzelner Hirnscan

    Zwei schwarze Kopfprofile mit farbcodierten KI-Vorhersagen der Gehirnaktivierung, rot-orangene Wärmebereiche auf grauem Modell.

    Ein neues KI-Modell von Meta sagt voraus, wie das menschliche Gehirn auf Bilder, Töne und Sprache reagiert. In Tests traf es die typische Hirnreaktion oft besser als die Messung einer einzelnen Person.

    Der Artikel Metas KI-Modell sagt Gehirnaktivität genauer vorher als ein einzelner Hirnscan erschien zuerst auf The Decoder.

  • KI-Fakes, gesperrte Satellitenbilder, gefälschte OSINT-Accounts: Der Iran-Krieg im Informationsnebel

    Über 110 KI-generierte Fake-Videos und -Bilder zum Krieg im Nahen Osten hat die New York Times in nur zwei Wochen identifiziert. Der Iran setzt die Fälschungen offenbar gezielt als Informationswaffe ein. Gleichzeitig wird es für unabhängige Beobachter immer schwerer, Fakten von Fiktion zu unterscheiden.

    Der Artikel KI-Fakes, gesperrte Satellitenbilder, gefälschte OSINT-Accounts: Der Iran-Krieg im Informationsnebel erschien zuerst auf The Decoder.

  • KI-Fälschungen aus Iran gelangen über Agenturnetzwerk in deutsche Medien

    Der Spiegel hat mehrere Bilder aus seiner Iran-Berichterstattung entfernt, weil sie mit hoher Wahrscheinlichkeit per KI erzeugt oder verändert wurden.

    Der Artikel KI-Fälschungen aus Iran gelangen über Agenturnetzwerk in deutsche Medien erschien zuerst auf The Decoder.

  • Google relaunched sein KI-Kreativstudio Flow mit neuen Funktionen und Integrationen

    Google baut sein KI-Kreativstudio Flow zum Rundum-Werkzeug für Bilder und Videos aus – mit kostenlosen Bildgeneratoren und neuen Bearbeitungsfunktionen.

    Der Artikel Google relaunched sein KI-Kreativstudio Flow mit neuen Funktionen und Integrationen erschien zuerst auf The Decoder.

  • Adobe Firefly bietet Abonnenten ab sofort unbegrenzte Bild- und Videogenerierung

    Adobe Firefly hebt alle Limits auf: Abonnenten können ab sofort unbegrenzt Bilder und Videos generieren.

    Der Artikel Adobe Firefly bietet Abonnenten ab sofort unbegrenzte Bild- und Videogenerierung erschien zuerst auf The Decoder.

  • Agentic Vision: Gemini schreibt sich jetzt eigenen Code, um Bilder besser zu verstehen

    Google Deepmind stattet sein Gemini-3-Flash-Modell mit einer neuen Fähigkeit namens „Agentic Vision“ aus. Das Modell soll Bilder nicht mehr nur passiv betrachten, sondern aktiv untersuchen können – allerdings funktioniert das noch nicht in allen Fällen automatisch.

    Der Artikel Agentic Vision: Gemini schreibt sich jetzt eigenen Code, um Bilder besser zu verstehen erschien zuerst auf The Decoder.

  • Baidus neues Modell Ernie 5.0 hat 2,4 Billionen Parameter und ist chinesisches Top-Modell in LMArena

    Der chinesische Such- und Internetkonzern Baidu stellt die neueste Version seines Chatbots Ernie vor, der deutlich bessere Ergebnisse liefern soll als bisher. Außerdem erhält er Unterstützung für Plugins.

    Baidus KI-Modell Ernie 5.0, das Text, Bilder, Audio und Video in einer einheitlichen Architektur verarbeitet, ist jetzt offiziell verfügbar.

    Der Artikel Baidus neues Modell Ernie 5.0 hat 2,4 Billionen Parameter und ist chinesisches Top-Modell in LMArena erschien zuerst auf The Decoder.