
Alibabas Qwen-Team stellt mit Qwen3.7-Plus ein multimodales Agentenmodell vor, das visuelle Wahrnehmung, GUI-Bedienung und Programmierung in einer einzigen Agentenschleife vereint. In einer Demo entwickelte ein darauf basierender Agent autonom über elf Stunden eine Vokabel-Lern-App mit mehr als 10.000 Zeilen Code und 1.000 Agentenaufrufen. Bei Bildschirmverständnis setzt sich das Modell laut eigenen Benchmarks an die Spitze, insgesamt bleibt das Leistungsbild aber gemischt. Als proprietäres Angebot ohne offene Gewichte ist Qwen3.7-Plus preislich deutlich unter westlichen Frontier-Modellen positioniert.
Der Artikel Alibabas Qwen3.7-Plus soll als multimodaler Agent Bildschirme bedienen und Apps autonom bauen erschien zuerst auf The Decoder.

