OpenAI testet KI-Modelle erstmals systematisch an realer Wissensarbeit

Mit GDPval führt OpenAI einen Benchmark für reale Wissensarbeit ein: 1320 Aufgaben aus 44 Berufen, bewertet von Branchenprofis.

Beitrags-Benachrichtigung