SciArena: o3 dominiert neue KI-Plattform zur Bewertung wissenschaftlicher Antworten

Mit SciArena steht erstmals eine offene Plattform zur Verfügung, die Foundation Models anhand menschlicher Präferenzen bei wissenschaftlichen Literaturaufgaben bewertet. Erste Ergebnisse zeigen deutliche Unterschiede zwischen den Modellen.

Der Artikel SciArena: o3 dominiert neue KI-Plattform zur Bewertung wissenschaftlicher Antworten erschien zuerst auf THE-DECODER.de.