
Sina Weibos VibeThinker-3B erreicht mit nur drei Milliarden Parametern bei Mathematik- und Coding-Benchmarks das Niveau von Modellen wie DeepSeek V3.2 oder Kimi K2.5, die bis zu 333-mal größer sind. Der Schlüssel liegt im mehrstufigen Post-Training statt in der reinen Modellgröße. Die Forscher leiten daraus eine These ab: Logisches Schlussfolgern lässt sich kompakt komprimieren, breites Weltwissen hingegen nicht.
Der Artikel Kleines Mathe-Modell soll zeigen, dass sich Reasoning auf wenige Parameter verdichten lässt erschien zuerst auf The Decoder.

