Sehen, hören, coden: Alibabas Qwen3.5-Omni macht alles gleichzeitig

Alibaba veröffentlicht Qwen3.5-Omni, ein omnimodales KI-Modell mit Text-, Bild-, Audio- und Videoverständnis. Es soll Gemini 3.1 Pro bei Audio-Aufgaben übertreffen und beherrscht eine neue Fähigkeit: Programmieren per gesprochener Anweisung und Videoinput.

Der Artikel Sehen, hören, coden: Alibabas Qwen3.5-Omni macht alles gleichzeitig erschien zuerst auf The Decoder.

Sehen, hören, coden: Alibabas Qwen3.5-Omni macht alles gleichzeitig

Beitrags-Benachrichtigung

Ihr E-Mail Konto:

Häufigkeit der E-Mail Zusammenfassung:

Beitrags-
Benachrichtigung