
Führende KI-Suchagenten wie GPT-5.4 oder Kimi K2.6 recherchieren auf etablierten Benchmarks offenbar kaum wirklich, sondern nutzen das Web vor allem, um bereits im Training gelerntes Wissen zu bestätigen. Forschende des Harbin Institute of Technology belegen das mit einem neuen zeitgebundenen Benchmark namens LiveBrowseComp, der nur Fragen zu Ereignissen der letzten 90 Tage stellt. Sobald die Modelle sich nicht mehr auf ihr Gedächtnis stützen können, bricht die Leistung ein und die bisherigen Ranglisten verschieben sich deutlich.
Der Artikel KI-Suchagenten „googeln“ oft nur, was sie ohnehin schon wissen erschien zuerst auf The Decoder.

