
World Action Models beschreiben ein neues Forschungsparadigma, das eine Schwäche heutiger Roboter-KI adressieren soll. Die Modelle sollen passende Bewegungen zu Kamerabildern lernen und zusätzlich vorhersagen, wie sich eine Szene durch eine Handlung verändern könnte. Ein neues Übersichtspapier ordnet rund hundert Arbeiten in zwei Architekturlinien. Es zeigt einen zentralen Vorteil dieses Ansatzes: Er kann Alltagsvideos ohne Roboter-Aktionslabels für das Training nutzbar machen. Solche Daten konnte klassische Robotik-KI bislang kaum verwerten.
Der Artikel World Action Models: Forscher kartieren das nächste Paradigma der Robotik-KI erschien zuerst auf The Decoder.

