
Anthropics Claude Fable 5 erreicht 88 % Genauigkeit auf der schwierigsten Stufe des FrontierMath-Benchmarks, ein massiver Sprung gegenüber dem Vorgänger Opus 4.5, der Anfang 2026 noch unter 10 % lag. OpenAIs GPT-5.5 kommt auf derselben Stufe auf rund 75 %. Das Tempo, mit dem sich die mathematischen Fähigkeiten der Modelle verbessern, bleibt bemerkenswert.
Der Artikel Anthropic setzt mit Fable 5 neue Bestmarke im Mathematik-Benchmark FrontierMath erschien zuerst auf The Decoder.

