
MiniMax stellt mit M3 ein Open-Weight-Modell vor, das Coding auf dem Niveau proprietärer Spitzenmodelle, ein Kontextfenster von einer Million Tokens und native Multimodalität in einer Architektur vereint. Eine neue Sparse-Attention-Technik senkt den Rechenaufwand pro Token auf ein Zwanzigstel des Vorgängers. Die Modellgewichte sollen innerhalb von zehn Tagen auf Hugging Face erscheinen.
Der Artikel MiniMax M3 bündelt Coding, 1M-Kontext und Multimodalität in einem offenen Modell erschien zuerst auf The Decoder.

