
Nvidia veröffentlicht mit Nemotron 3 Nano Omni ein offenes multimodales Modell für Text, Bild, Video und Audio. Spannend ist nicht nur die Leistung, sondern auch der Blick in die Trainingsdaten: Sie stammen unter anderem aus Qwen, GPT-OSS, Kimi und DeepSeek-OCR.
Der Artikel Nvidia veröffentlicht Nemotron-3 Nano Omni samt tiefem Einblick in das Training multimodaler KI erschien zuerst auf The Decoder.