Schlagwort: Flash

  • Google stellt günstigeres und schnelleres Gemini-3-Flash-Modell vor

    Der Preiskampf bei KI-Modellen verschärft sich: Google bringt mit Gemini 3 Flash ein Modell auf den Markt, das die Konkurrenz von OpenAI und Anthropic bei Kosten und Geschwindigkeit deutlich unterbieten soll. Die Botschaft ist klar: Spitzenleistung muss nicht mehr teuer sein.

    Der Artikel Google stellt günstigeres und schnelleres Gemini-3-Flash-Modell vor erschien zuerst auf The Decoder.

  • Google verbessert Gemini-Audiomodelle für realistischere KI-Stimmen

    Google hat ein Update für Gemini 2.5 Flash Native Audio veröffentlicht, das Sprachassistenten verbessern soll.

    Der Artikel Google verbessert Gemini-Audiomodelle für realistischere KI-Stimmen erschien zuerst auf The Decoder.

  • Google aktualisiert Gemini 2.5 Flash Image aka Nano Banana mit neuen Funktionen

    Das Bildmodell Gemini 2.5 Flash Image ist jetzt allgemein verfügbar. Es erlaubt unter anderem gezielte Bildbearbeitung per Spracheingabe, konsistente Charakterdarstellungen und die Auswahl aus zehn Seitenverhältnissen.

    Der Artikel Google aktualisiert Gemini 2.5 Flash Image aka Nano Banana mit neuen Funktionen erschien zuerst auf THE-DECODER.de.

  • Nano Banana Vollversion erschienen mit 11 Bildformaten

    Eine Banana in vielen Formaten

    Nano Banana Vollversion erschienen mit 11 Bildformaten Beim Gemini Flash 2.5 Image Model sind jetzt 21:9, 16:9, 5:4, 4:3, 3:2, 1:1 sowie deren Umkehrungen auswählbar. Kurzfassung | Andreas Becker, 03.10.25
    Nano Banana | All-AI.de EINLEITUNG Wer mit KI-Bildgeneratoren arbeitet, kannte das Problem: Man wünschte sich ein Bild im Breitbildformat und erhielt trotzdem nur ein Quadrat. Google behebt dieses Ärgernis nun mit einem wichtigen Update. Das unter dem Spitznamen „Nano Banana“ bekannt gewordene Modell Gemini 2.5 Flash Image ist jetzt für den breiten Einsatz verfügbar und bringt elf verschiedene Seitenverhältnisse mit. Damit reagiert das Unternehmen direkt auf eine der meistgenannten Forderungen seiner Nutzer und macht einen entscheidenden Schritt in Richtung professioneller Anwendung. NEWS Vom Quadrat zur Kinoleinwand Die wohl wichtigste Neuerung ist die Implementierung von elf verschiedenen Seitenverhältnissen, die Nutzern deutlich mehr kreative Freiheiten geben. Das Spektrum reicht von filmischen Formaten wie 21:9 und 16:9 über klassische Fotoformate bis hin zu Hochkant-Optionen wie 9:16, die für Social-Media-Anwendungen unerlässlich sind. Damit wird ein kritischer Fehler behoben, der zuvor trotz präziser Anweisungen oft nur quadratische Bilder mit 1024×1024 Pixeln lieferte. Diese erweiterte Vielfalt ermöglicht es Entwicklern und Kreativen, Inhalte gezielt für verschiedene Plattformen und Zwecke zu erstellen, ohne umständliche Nachbearbeitung. Ob für eine Präsentation, einen Blogartikel oder eine Instagram-Story – das gewünschte Format lässt sich nun direkt bei der Generierung festlegen. Google stellt das Modell über seine Programmierschnittstellen, das AI Studio und die Unternehmensplattform Vertex AI zur Verfügung. + Quelle: Google – Im Gemini Studio bereits auswählbar Intelligente Bildbearbeitung setzt neue Maßstäbe Neben den neuen Formaten überzeugt Gemini 2.5 Flash Image mit fortschrittlichen Bearbeitungsfunktionen. Das System kann mehrere Bilder nahtlos miteinander verschmelzen und passt dabei Beleuchtung und Texturen intelligent an. Besonders hervorzuheben ist die Fähigkeit, die Konsistenz von Charakteren über mehrere Bilder hinweg beizubehalten – ein Merkmal, das für erzählerische Projekte entscheidend ist. Änderungen lassen sich zudem durch einfache Textbefehle steuern, ohne dass unbeabsichtigte Bildbereiche verändert werden. Erste Unternehmen nutzen diese Fähigkeiten bereits. Die Firma Cartwheel etwa kombiniert das Modell mit einem 3D-Werkzeug, um Künstlern präzise Kontrolle über die Darstellung von Figuren aus jedem Kamerawinkel zu geben. Der Spieleentwickler Volley setzt die KI für die Bildgenerierung in Echtzeit während des Spiels ein und profitiert von der hohen Geschwindigkeit des Modells, das Ergebnisse in unter zehn Sekunden liefert. + Quelle: Google – jetzt als Vollversion Preisdruck und verbleibende Grenzen Im direkten Wettbewerb positioniert sich Google auch preislich attraktiv. Mit rund vier Cent pro Bild ist die Generierung etwa 40 Prozent günstiger als bei OpenAIs Konkurrenzmodell. Eine kostenlose Variante im Google AI Studio erlaubt bis zu 500 Anfragen pro Tag für Testzwecke. Trotz der Fortschritte bleiben jedoch technische Hürden bestehen. Die maximale Auflösung von 1024 Pixeln limitiert die Nutzung für hochauflösende Druckanwendungen. Zudem hat das Modell noch Schwierigkeiten mit der korrekten Darstellung kleinerer Textdetails. Alle erstellten Bilder werden mit einem digitalen Wasserzeichen versehen, um sie klar als KI-generiert zu kennzeichnen. MITMACHEN Hat Dir der Beitrag gefallen oder geholfen? Dann hilf uns mit einem Klick weiter – dauert nur Sekunden. Teile diesen Beitrag Folge uns auf Social Media Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt KI-Tools sind teuer – unser Wissen bleibt kostenlos. Spende einmalig via PayPal oder werde YouTube-Mitglied (ab 0,99 €). Dafür liefern wir täglich News, ehrliche Tests und praxisnahe Anleitungen. Danke dir! PayPal – Spende Youtube – ABO KURZFASSUNG Google hat Gemini 2.5 Flash Image für den Produktionseinsatz freigegeben und unterstützt nun zehn verschiedene Seitenverhältnisse für flexible Bildgenerierung. Das System ermöglicht fortschrittliche Bildbearbeitung mit Charakterkonsistenz, Multi-Bild-Fusion und natürlichsprachlichen Befehlen bei Latenzzeiten unter zehn Sekunden. Unternehmen wie Cartwheel und Volley nutzen bereits erfolgreich die neuen Funktionen für kreative Anwendungen und Echtzeit-Spielerlebnisse. Mit einem Preis von 0,039 US-Dollar pro Bild positioniert sich Google kostengünstiger als Konkurrenten, wobei 500 kostenlose tägliche Anfragen für Entwickler verfügbar sind. QUELLEN Testing Catalog Google Developers Blog The Decoder BundB Blog Seeking Alpha

  • Google rollt verbesserte Gemini 2.5 Flash und Flash-Lite KI-Modelle aus

    Google veröffentlicht neue Vorschauversionen von Gemini 2.5 Flash und Flash-Lite. Die Modelle sollen effizienter arbeiten, besser mit Multimedia umgehen und übersetzen und komplexere Aufgaben erledigen.

    Der Artikel Google rollt verbesserte Gemini 2.5 Flash und Flash-Lite KI-Modelle aus erschien zuerst auf THE-DECODER.de.

  • Billiger, schneller, smarter: Das neue Google Gemini

    Gemini Flash wird richtig stark

    Billiger, schneller, smarter: Das neue Google Gemini Google veröffentlicht Updates für Gemini 2.5 Flash und Flash-Lite, mit denen Entwickler bis zu 50% der KI-Kosten einsparen. Kurzfassung | Andreas Becker, 27.09.25
    gpt-image-1 | All-AI.de EINLEITUNG Google hat neue Versionen seiner KI-Modelle Gemini 2.5 Flash und Flash-Lite veröffentlicht. Das Update verspricht nicht nur mehr Leistung, sondern vor allem massive Kosteneinsparungen für Entwickler. Besonders kleinere Unternehmen könnten davon profitieren, denn leistungsstarke künstliche Intelligenz wird dadurch deutlich zugänglicher. Die neuen Modelle sind als Vorschauversionen ab sofort verfügbar. NEWS Mehr Effizienz und Präzision für die breite Masse Im Zentrum des Updates steht das Modell Gemini 2.5 Flash-Lite. Google hat es gezielt in mehreren Bereichen verbessert. Es folgt komplexen Anweisungen nun zuverlässiger und liefert deutlich knappere Antworten. Das ist besonders für Anwendungen entscheidend, die in kurzer Zeit sehr viele Anfragen bearbeiten müssen. Auch bei multimodalen Aufgaben, wie der Transkription von Audiodateien oder der Bilderkennung, zeigt das Modell spürbare Fortschritte. Die entscheidende Neuerung ist jedoch die Kostenreduktion. Durch die prägnanteren Antworten sinkt die Anzahl der benötigten Ausgabe-Token bei Flash-Lite um bis zu 50 Prozent. Das halbiert in vielen Fällen die direkten Kosten für Entwickler und Unternehmen. Diese massive Effizienzsteigerung macht es vor allem für Start-ups und Firmen mit kleineren Budgets attraktiver, anspruchsvolle KI-Lösungen zu entwickeln und zu betreiben. + Quelle: Google Neue Agenten-Fähigkeiten für komplexe Aufgaben Auch das leistungsstärkere Modell, Gemini 2.5 Flash, erhält wichtige Verbesserungen. Hier liegt der Fokus auf erweiterten agentenbasierten Fähigkeiten. Das Modell kann nun besser mit externen Werkzeugen interagieren, was für komplexe, mehrstufige Prozesse notwendig ist. In einem wichtigen Benchmark für Softwareentwicklungsaufgaben (SWE-Bench Verified) konnte das Modell seine Leistung um fünf Prozent steigern. Frühe Tester berichten von deutlichen Verbesserungen bei anspruchsvollen Langzeit-Aufgaben. Um Entwicklern den Zugang zu den neuesten Versionen zu erleichtern, führt Google zudem eine Alias-Funktion ein. Mit der Endung „-latest“ im Code greifen Anwendungen automatisch auf das aktuellste Modell zu, ohne dass eine manuelle Anpassung nötig wird. Mit diesen Updates positioniert Google seine Modelle als flexible Werkzeuge im KI-Wettbewerb und bindet Entwickler frühzeitig in den Verbesserungsprozess ein. + Quelle: Google MITMACHEN Hat Dir der Beitrag gefallen oder geholfen? Dann hilf uns mit einem Klick weiter – dauert nur Sekunden. Teile diesen Beitrag Folge uns auf Social Media Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt KI-Tools sind teuer – unser Wissen bleibt kostenlos. Spende einmalig via PayPal oder werde YouTube-Mitglied (ab 0,99 €). Dafür liefern wir täglich News, ehrliche Tests und praxisnahe Anleitungen. Danke dir! PayPal – Spende Youtube – ABO KURZFASSUNG Google hat neue Versionen der KI-Modelle Gemini 2.5 Flash und Flash-Lite mit deutlich reduzierten Token-Kosten und verbesserter Effizienz vorgestellt. Flash-Lite bietet 50% weniger Ausgabe-Token, bessere Anweisungsfolge und verbesserte multimodale Fähigkeiten für kostensensitive Anwendungen. Flash erhielt optimierte agentenbasierte Tool-Nutzung und zeigt 5% bessere Leistung bei Software-Entwicklungsaufgaben im SWE-Bench Verified. Neue „-latest“-Aliases ermöglichen automatische Updates auf die neueste Modellversion ohne Code-Anpassungen für Entwickler. QUELLEN 9to5Google Google Developers Blog Schmidt Is Blog IT Boltwise Google AI for Developers

  • Die beste Bilder KI kommt jetzt von Google!

    AI Caramba wird im Dschungel mit Bananen beworfen

    Die beste Bilder KI kommt jetzt von Google! ChatGPT? Photoshop? Der neue Spitzenreiter macht einiges deutlich besser! Kurzfassung | Andreas Becker, 26.08.25
    Gemini Flash | All-AI.de EINLEITUNG Google hat ein neues KI-Modell vorgestellt, das Bilder auf ein ganz neues Niveau bringt. Mit „Gemini 2.5 Flash Image“ lassen sich Fotos und Grafiken direkt in der Gemini-App bearbeiten – einfach per Texteingabe. Die Technik sorgt dafür, dass Personen, Tiere oder Produkte trotz Veränderungen wiedererkennbar bleiben. Auch komplexe Bildkombinationen sind jetzt möglich. Das Modell steht ab sofort für Nutzer und Entwickler zur Verfügung und erreicht in den meisten Kategorien Bestwerte! + Quelle: Google Gemini NEWS Einfach Texte eingeben, Bild ändern lassen Das Herzstück des neuen Modells ist die direkte Bearbeitung von Bildern durch Textbefehle. Nutzer können zum Beispiel den Hintergrund eines Fotos unscharf machen, Farben ändern oder störende Objekte entfernen – ganz ohne Bildbearbeitungsprogramm. Die KI versteht, was gemeint ist, und setzt die Anweisung direkt um. Das funktioniert selbst bei mehreren Änderungen hintereinander, ohne dass die Bildqualität darunter leidet. In der Praxis bedeutet das: Man lädt ein Bild hoch, schreibt zum Beispiel „Hintergrund weichzeichnen und Licht wärmer machen“, und die KI erledigt den Rest. Laut Google nutzt das Modell dabei sein allgemeines Weltwissen, um realistische Ergebnisse zu liefern. Besonders bei Alltagsgegenständen, Kleidung oder Lichtstimmungen wirkt das Ergebnis natürlicher als bei früheren Versionen. + Quelle: Google Gemini Wiedererkennbare Gesichter und Motive Eine große Schwäche vieler KI-Bildgeneratoren war bisher die fehlende Konsistenz: Eine Person sah auf jedem Bild anders aus. Mit Gemini 2.5 Flash hat Google dieses Problem gezielt gelöst. Das Modell kann eine Figur, ein Tier oder ein Objekt über mehrere Bilder hinweg gleich aussehen lassen – selbst bei unterschiedlichen Blickwinkeln, Posen oder Hintergründen. Das ist zum Beispiel praktisch für Unternehmen, die Serienbilder für Kataloge, Kampagnen oder Webseiten erstellen. Auch Privatnutzer können so aus einem Fotoalbum einheitliche Motive machen, ohne jedes Bild einzeln zu bearbeiten. Die KI erkennt Details und hält diese stabil – ohne, dass man es ihr extra beibringen muss. + Quelle: Google Gemini Mehrere Bilder verschmelzen zu einer neuen Szene Gemini 2.5 Flash kann auch verschiedene Fotos zu einem einzigen neuen Bild kombinieren. Wer zum Beispiel ein Produktfoto und ein Wohnzimmerbild hochlädt, bekommt eine realistische Szene mit dem Produkt im Raum. Die KI erkennt Perspektive, Licht und Farben und passt alles automatisch an. Ein weiteres Feature ist der sogenannte Stiltransfer. Dabei kann man etwa das Muster eines Kleides auf ein anderes Objekt übertragen – zum Beispiel auf einen Stiefel. Form und Proportionen bleiben erhalten, nur das Design ändert sich. Damit lassen sich kreative Varianten für Mode, Deko oder Werbung erzeugen – ganz ohne Grafikkenntnisse. + Quelle: Google Gemini Verfügbarkeit, Preis und Zugang Die neue Funktion ist direkt in der Gemini-App nutzbar. Wichtig ist: Man muss das Bildmodell „Flash“ auswählen, nicht das bisherige „Imagen“. Das ist etwas versteckt, aber sinnvoll – denn „Flash“ ist ein echtes Sprachmodell mit Bildfunktionen, kein reiner Bildgenerator. Alle Bilder, die über Gemini 2.5 Flash erstellt oder verändert werden, erhalten ein sichtbares Wasserzeichen und zusätzlich ein digitales Wasserzeichen, das unsichtbar im Bild gespeichert ist. So lässt sich jederzeit erkennen, dass es sich um KI-Bilder handelt. Für Entwickler gibt es das Modell auch in der Vorschauversion über die Gemini API, Google AI Studio und Vertex AI. Die Nutzung kostet etwa 0,040 US-Dollar pro Bild. Technisch entspricht das rund 1.290 sogenannten Token pro Bild – eine rechnerische Einheit für den Datenverbrauch. Einordnung und Ausblick Google geht mit Gemini 2.5 Flash einen wichtigen Schritt in Richtung praxisnahe Bildbearbeitung per KI. Während andere Anbieter sich vor allem auf reine Bildgenerierung konzentrieren, verbindet Google Spracheingabe, Bearbeitung und visuelles Verständnis in einem Modell. Das spart Wechsel zwischen Tools und macht die Anwendung alltagstauglicher. Für Nutzer bedeutet das: Bilder bearbeiten funktioniert jetzt einfacher, genauer und konsistenter – und zwar direkt mit der Spracheingabe, die man von Chatbots kennt. Ob das in Zukunft den Umgang mit klassischer Bildbearbeitung dauerhaft verändert, hängt auch davon ab, wie intuitiv die Bedienung bleibt. Aber der erste Eindruck: vielversprechend. DEIN VORTEIL – DEINE HILFE Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung. Teile diesen Beitrag Folge uns auf Social Media Keine KI-News mehr verpassen und direkt kommentieren! Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support! Youtube – Kanal PayPal – Kaffee KURZFASSUNG
    Google hat mit Gemini 2.5 Flash ein neues KI-Modell veröffentlicht, das Bilder per Spracheingabe bearbeiten kann.
    Die KI sorgt für konsistente Gesichter und Objekte über mehrere Bilder hinweg und kann verschiedene Fotos zu einer neuen Szene verschmelzen.
    Das Tool ist direkt in der Gemini-App nutzbar und für Entwickler über mehrere Google-Plattformen zugänglich.
    Mit Funktionen wie Stiltransfer und realistischer Lichtanpassung verändert Google den Standard der KI-Bildbearbeitung deutlich.
    QUELLEN
    Google Developers Blog
    DeepMind Modelseite
    TechCrunch
    Axios

  • Google stellt neues Gemini-2.5-Modell vor und erweitert Zugang

    Google hat mit Firebase Studio eine umfassende, Cloud-basierte Entwicklungsumgebung mit KI im Kern vorgestellt.

    Google veröffentlicht die stabilen Versionen von Gemini 2.5 Flash und Pro. Außerdem startet das Unternehmen die Vorschau auf ein neues Modell mit besonders hoher Effizienz und Geschwindigkeit.

    Der Artikel Google stellt neues Gemini-2.5-Modell vor und erweitert Zugang erschien zuerst auf THE-DECODER.de.