
Mirage, ein von Microsoft Research und mehreren Universitäten entwickeltes Video-Weltmodell, speichert Szeneninformationen direkt im latenten Raum statt in pixelbasierten Punktwolken. Das spart massiv Rechenzeit und Grafikspeicher, während die räumliche Konsistenz auch bei langen Kamerafahrten stabil bleibt. Bewegte Objekte kann das System allerdings noch nicht zuverlässig erinnern.
Der Artikel Mirage zeigt, wie Video-KI ein räumliches Langzeitgedächtnis bekommt erschien zuerst auf The Decoder.

