Bildgenerator MAI-Image-2: Microsoft fordert Google heraus

Mehrere Bilder von MAI-Image-2

Nano Banana

Kurzfassung

Quellen

Microsoft hat den neuen KI-Bildgenerator MAI-Image-2 veröffentlicht.
Das System erreicht im weltweiten Benchmark den fünften Platz und schließt zur Konkurrenz auf.
Besondere Stärken liegen im Fotorealismus und der zuverlässigen Darstellung von Texten in Bildern.
Nutzer testen das Modell ab sofort im MAI Playground, bevor die Integration in Copilot folgt.

Microsoft AI: Introducing MAI-Image-2

Microsoft veröffentlicht mit MAI-Image-2 einen neuen KI-Bildgenerator. Das hauseigene Superintelligenz-Team entwickelte das System. Es schließt im weltweiten Vergleich überraschend zu den aktuellen Marktführern Google und OpenAI auf. Platzierung im weltweiten Benchmark Im bekannten „Text-to-Image Arena“ Benchmark erreicht MAI-Image-2 aus dem Stand den fünften Platz. Das neue KI-Modell von Microsoft erzielt dabei eine Gesamtpunktzahl von 1189. Damit positioniert sich das System direkt hinter der aktuellen Spitze. Ein genauer Blick auf die Grafik zeigt jedoch die tatsächliche Marktsituation. Lediglich zwei Unternehmen besetzen die vorderen Ränge. OpenAI belegt mit dem System GPT-Image-1.5 den zweiten Rang und erreicht 1244 Punkte. Google dominiert den restlichen Spitzenbereich, da das Modell „Nano Banana“ gleich drei Positionen einnimmt. Die Version „Nano Banana 2“ führt das Feld an, während die Pro-Version die Plätze drei und vier belegt. Zieht man diese Mehrfachplatzierungen der Modellfamilien ab, steht Microsoft faktisch auf dem dritten Platz der besten Anbieter. + Quelle: Microsoft

Foto realistisch

Copy

A glacier wall towering like a cathedral interior, deep blue ice with light refracting through layers, tiny human figure at base for scale, cinematic, cold mist in air, hyper-real detail

Prompt vollständig anzeigen

Fotorealismus und präzise Typografie Technisch legt Microsoft den Fokus bei der neuen Version auf eine hohe Detailtreue. Nutzer steuern die Ausgabe der Bilder dabei wie gewohnt über einen kurzen Text-Prompt. + Quelle: Microsoft Das System erzeugt laut den Entwicklern besonders realistische Fotos. Das Modell berechnet natürliche Lichtverhältnisse und stellt Hauttöne bei Porträts akkurat dar. Viele generative Modelle haben Probleme mit der fehlerfreien Darstellung von Schriftzeichen in Bildern. MAI-Image-2 adressiert diese Schwachstelle und integriert Texte zuverlässig in die generierten Motive. Das erleichtert die Erstellung von Postern, Infografiken oder Diagrammen. Aufwändige Korrekturen in externen Programmen entfallen dadurch. Testphase für erste Anwender Interessierte Anwender probieren MAI-Image-2 ab sofort im MAI Playground aus. Dort sammelt Microsoft direktes Feedback für das weitere Fine-Tuning des Modells. In naher Zukunft integriert der Konzern das Modell fest in etablierte Dienste wie Copilot oder den Bing Image Creator. Entwickler erhalten über die Plattform Microsoft Foundry zudem einen direkten Zugriff auf die API. So binden externe Firmen den Bildgenerator nahtlos in eigene Anwendungen ein. Über die genauen technischen Details der zugrundeliegenden Architektur schweigt Microsoft bislang. Der Konzern dokumentiert mit diesem Update sachlich den aktuellen technischen Stand der eigenen Systeme auf dem Markt. Anzeige