
Der Benchmark SWE-Explore eines internationalen Forschungsteams prüft erstmals isoliert, wie gut KI-Coding-Agenten relevanten Code finden, getrennt von der eigentlichen Reparatur. Agenten wie Claude Code oder Codex lokalisieren zwar die richtige Datei, übersehen auf Zeilenebene aber die meisten entscheidenden Stellen. Ohne ausreichenden Kontext scheitert auch die beste Reparatur.
Der Artikel KI-Coding-Agenten finden die richtige Datei, aber nicht die richtige Zeile erschien zuerst auf The Decoder.

