OpenAI testet KI-Modelle erstmals systematisch an realer Wissensarbeit

Mit GDPval führt OpenAI einen Benchmark für reale Wissensarbeit ein: 1320 Aufgaben aus 44 Berufen, bewertet von Branchenprofis.

Der Artikel OpenAI testet KI-Modelle erstmals systematisch an realer Wissensarbeit erschien zuerst auf THE-DECODER.de.