
Google veröffentlicht DiffusionGemma, ein 26-Milliarden-Parameter-Modell, das Text nicht Token für Token, sondern per Diffusion erzeugt, ähnlich wie Bild-KI aus Rauschen ein Bild zieht. Auf einer einzelnen H100-GPU erreicht es laut Nvidia rund 1.000 Tokens pro Sekunde, etwa viermal schneller als vergleichbare autoregressive Modelle. Den Geschwindigkeitsgewinn bezahlt das Modell allerdings mit niedrigerer Ausgabequalität, weshalb Google es vorerst als Experimentierwerkzeug für Entwickler positioniert.
Der Artikel DiffusionGemma: Googles offenes Sprachmodell generiert Text in Blöcken erschien zuerst auf The Decoder.

