
Eine neue Benchmark namens WorldReasonBench prüft Videogeneratoren nicht an Bildqualität, sondern an physikalischer und logischer Plausibilität. ByteDances Seedance 2.0 führt das Feld vor Veo 3.1 und Sora 2, kommerzielle Modelle scoren dabei rund doppelt so hoch wie Open-Source-Alternativen. Logisches Schlussfolgern bleibt für alle Modelle die mit Abstand schwerste Disziplin. Der Sprung vom Pixelgenerator zum echten Weltmodell bleibt aus.
Der Artikel Neuer Benchmark prüft KI-Videogeneratoren wie Physiklehrer – und gibt schlechte Noten erschien zuerst auf The Decoder.

