Salesforce-Benchmark zeigt: KI-Agenten scheitern an komplexen Geschäftsdialogen

Salesforce hat mit CRMArena-Pro einen neuen Benchmark für KI-Agenten vorgestellt. Selbst Top-Modelle wie Gemini 2.5 Pro erreichen in einfachen Aufgaben nur 58 Prozent Erfolgsquote. Bei längeren Dialogen fällt die Leistung auf 35 Prozent.

Der Artikel Salesforce-Benchmark zeigt: KI-Agenten scheitern an komplexen Geschäftsdialogen erschien zuerst auf THE-DECODER.de.