Alibaba hat ein KI-Modell entwickelt, das die Effizienz von Reinforcement Learning demonstriert. Das Modell könnte den Wettbewerb im Bereich Reasoning-Modelle beeinflussen und die Entwicklung ressourcenschonender KI-Systeme vorantreiben.
Der Artikel Alibaba packt leistungsstarkes Reasoning in kompaktes KI-Modell QwQ-32B erschien zuerst auf THE-DECODER.de.