Ein Forschungsteam aus Singapur und China zeigt mit LongWriter-Zero, dass KI-Modelle durch Reinforcement Learning lernen können, über 10.000 Wörter lange Texte zu verfassen – ganz ohne synthetische Trainingsdaten.
Der Artikel LongWriter-Zero lernt nur durch Reinforcement Learning lange Texte zu schreiben erschien zuerst auf THE-DECODER.de.