
Mit SciArena steht erstmals eine offene Plattform zur Verfügung, die Foundation Models anhand menschlicher Präferenzen bei wissenschaftlichen Literaturaufgaben bewertet. Erste Ergebnisse zeigen deutliche Unterschiede zwischen den Modellen.
Der Artikel SciArena: o3 dominiert neue KI-Plattform zur Bewertung wissenschaftlicher Antworten erschien zuerst auf THE-DECODER.de.
