
Alibaba veröffentlicht Qwen3.5-Omni, ein omnimodales KI-Modell mit Text-, Bild-, Audio- und Videoverständnis. Es soll Gemini 3.1 Pro bei Audio-Aufgaben übertreffen und beherrscht eine neue Fähigkeit: Programmieren per gesprochener Anweisung und Videoinput.
Der Artikel Sehen, hören, coden: Alibabas Qwen3.5-Omni macht alles gleichzeitig erschien zuerst auf The Decoder.
