
Rund die Hälfte der KI-Code-Lösungen, die den bekannten SWE-bench-Benchmark bestehen, würde von echten Projektverantwortlichen abgelehnt. Das zeigt eine neue Untersuchung der Forschungsorganisation METR.
Der Artikel KI-Code-Qualität wird laut Studie überschätzt: Profis lehnen jeden zweiten Vorschlag ab erschien zuerst auf The Decoder.


