Schlagwort: Alibaba

  • Chinas neuer eiserner Vorhang für KI-Experten

    Ein Wal will aus China raus

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Chinesische Behörden weiten Reisebeschränkungen nun auf private KI-Firmen aus.
    Wichtige KI-Fachkräfte von Alibaba und DeepSeek benötigen für Auslandsreisen eine staatliche Genehmigung.
    Die Regierung will damit den Abfluss von sensiblem Fachwissen und Spitzenkräften in die USA verhindern.
    Bisher galten vergleichbare Regelungen primär für Mitarbeiter in staatsnahen Institutionen.

    Bloomberg: China Expands Travel Curbs to Top AI Talent at Private Firms
    The Straits Times: China expands travel curbs to top AI talent at private firms
    The Edge Malaysia: China said to expand travel curbs to top AI talent at private firms
    Business Today Malaysia: China Imposes Travel Ban On Top AI Talent In Private Firms

    Chinesische Behörden verbieten wichtigen KI-Fachkräften privater Unternehmen wie Alibaba und DeepSeek ungenehmigte Auslandsreisen. Die strengen Kontrollen für internationale Flüge weiten die staatliche Macht auf den privaten Tech-Sektor aus und erschweren den globalen Austausch. Angst vor dem Verlust wertvoller KI-Modelle Bisher galten solche harten Restriktionen in der Volksrepublik primär für staatsnahe Forschungseinrichtungen. Nun greift die Regierung direkt in den Alltag ziviler Tech-Konzerne ein. Das primäre Ziel dieser Vorgabe ist der strikte Schutz fortschrittlicher Technologie. Peking möchte um jeden Preis verhindern, dass Details über die Architektur neuer KI-Modelle in ausländische Hände geraten. Der harte globale Wettbewerb zwingt den Staat zu drastischen Kontrollmaßnahmen. Besonders der andauernde Konkurrenzkampf mit den USA beschleunigt die aktuelle staatliche Abschottung. Wenn herausragende Köpfe in den Westen abwandern, schwächt das die heimische Wirtschaft im Tech-Sektor direkt. Die Behörden prüfen daher vor jedem Abflug extrem präzise, wer für welche spezifischen Forschungsprojekte das Land verlassen darf. Anzeige Erinnerungen an die Ära der Sowjetunion Diese restriktive Politik weckt unweigerlich historische Assoziationen. Die Methoden erinnern stark an die Sowjetunion, als Wissenschaftler den Staat nicht frei verlassen durften, um das eigene Wissen abzuschirmen. Im Jahr 2026 wiederholen sich solche Muster der strikten Isolation auf dem Feld der künstlichen Intelligenz. Für Unternehmen wie Alibaba oder das Start-up DeepSeek bedeutet das einen immensen administrativen Aufwand. Sie müssen die strategische Bedeutung ihres Personals bewerten und rechtzeitig staatliche Anträge für jede Reise stellen. Ein spontaner Flug zu einer Konferenz über Themen der künstlichen Intelligenz entfällt damit völlig.

  • Qwen3.7-Max schlägt Konkurrenz bei Agenten-Benchmarks

    Ein Qwen Baer kontrolliert Agenten

    GPT-Images-2.0

    Kurzfassung

    Quellen

    Alibaba hat das KI-Modell Qwen 3.7-Max für komplexe Agenten-Aufgaben veröffentlicht.
    Die KI arbeitet über viele Stunden hinweg eigenständig und optimiert selbstständig Code.
    In aktuellen Benchmarks übertrifft Qwen 3.7-Max etablierte Konkurrenten wie Claude 4.6 Opus oder DeepSeek V4 Pro.
    Das KI-Modell lässt sich flexibel in verschiedene Umgebungen wie OpenClaw oder Claude Code integrieren.

    Qwen – Qwen3.7: The Agent Frontier

    Das Qwen-Team hat das neue Flaggschiff-KI-Modell Qwen3.7-Max vorgestellt, das speziell als Basis für autonome KI-Agenten konzipiert wurde. Dieses KI-Modell soll komplexe Programmieraufgaben lösen, Büro-Workflows automatisieren und über hunderte von Schritten hinweg stabil agieren. Die Neuentwicklung zeichnet sich vor allem durch eine verbesserte Generalisierung über verschiedene Agenten-Frameworks hinweg aus. Flexibler Einsatz in OpenClaw und Claude Code Ein zentraler Aspekt des neuen KI-Modells ist die nahtlose Integration in bestehende Infrastrukturen für KI-Agenten. Qwen3.7-Max ist so trainiert, dass es nicht für eine einzelne Umgebung optimiert ist, sondern über verschiedene Gerüste wie Claude Code, OpenClaw, Qwen Code oder Hermes hinweg stabil funktioniert. Durch die Entkopplung von Aufgabe, Umgebung und Verifizierer im Training lernt das KI-Modell allgemeine Strategien zur Problemlösung anstatt plattformspezifischer Abkürzungen. In Tests auf Plattformen wie QwenClawBench und CoWorkBench liefert die Neuentwicklung konstante Ergebnisse, unabhängig vom genutzten System. Entwickler können das KI-Modell über die Alibaba Cloud Model Studio API ansprechen, wobei ein spezieller Modus zur Bewahrung des internen Denkprozesses über mehrere Interaktionen hinweg implementiert wurde. + Quelle: Alibaba Spitzenwerte bei Coding und mathematischem Reasoning Die Leistung des KI-Modells spiegelt sich in den aktuellen Benchmark-Ergebnissen wider, bei denen es etablierte Konkurrenten teilweise übertrifft oder einholt. Im Programmiertest Terminal Bench 2.0-Terminus erreicht Qwen3.7-Max einen Spitzenwert von 69,7 Punkten und setzt sich damit gegen DeepSeek V4 Pro Max mit 67,9 Punkten durch. Bei SWE-Verified liegt das KI-Modell mit 80,4 Punkten fast gleichauf mit Claude Opus-4.6 Max, welches 80.8 Punkte erzielt. Besonders starke Zuwächse verzeichnet die Fachwelt bei allgemeinen Agenten-Anwendungen und komplexen Logiktests. Im extrem anspruchsvollen Humanity’s Last Exam (HLE) führt Qwen3.7-Max mit 41,4 Punkten vor Opus-4.6 Max mit 40,0 Punkten und Qwen3.6-Plus mit 28,8 Punkten. Auch im mathematischen Reasoning-Benchmark Apex distanziert das KI-Modell mit 44,5 Punkten die Konkurrenz von DeepSeek V4 Pro, das bei 38,3 Punkten landet. + Quelle: Alibaba Autonome Höchstleistung im 35-Stunden-Dauertest Wie stabil das KI-Modell über extrem lange Zeiträume agiert, demonstrierten die Entwickler in einem realen Optimierungsszenario für GPU-Kernel. Qwen3.7-Max optimierte einen komplexen Aufmerksamkeits-Operator in SGLang auf einer völlig unbekannten Hardware-Architektur ohne Dokumentation komplett eigenständig. Über einen Zeitraum von rund 35 Stunden führte das KI-Modell 1.158 Tool-Aufrufe durch, diagnostizierte Kompilierungsfehler und korrigierte Fehler im Code selbstständig. Das Ergebnis dieses autonomen Prototypings war eine zehnfache Beschleunigung des Kernels gegenüber der Standard-Referenz. Andere Spitzenmodelle wie GLM 5.1 oder Kimi K2.6 brachen diesen Test vorzeitig ab, da sie keine weiteren Fortschritte erzielen konnten. Insgesamt ein sehr interessantes und starkes Modell, welches man sich näher anschauen sollte. + Quelle: Alibaba Anzeige

  • USA geben Nvidia-H200-Chips für China frei, doch die Regierung blockiert den Kauf

    Die USA haben rund zehn chinesische Unternehmen, darunter Alibaba, Tencent und ByteDance, für den Kauf von bis zu 75.000 Nvidia-H200-Chips freigegeben. Geliefert wurde bisher kein einziger Chip. Laut US-Handelsminister Lutnick blockiert Peking die Käufe, um die eigene Chipindustrie zu schützen.

    Der Artikel USA geben Nvidia-H200-Chips für China frei, doch die Regierung blockiert den Kauf erschien zuerst auf The Decoder.

  • Qwen-Image-2.0: Weniger Rechenschritte, stärkere Kompression, bessere Prompts

    Junge chinesische Frau mit roter Kamelienblüte im Haar vor sonniger, von Bäumen gesäumter Straße.

    Alibaba legt den technischen Bericht zu Qwen-Image-2.0 offen: Das Bildmodell komprimiert Bilder doppelt so stark wie üblich, stabilisiert das Training durch einen umgebauten Transformer und nutzt ein eigenes Modul, das knappe Nutzereingaben automatisch in detaillierte Prompts übersetzt. Eine schnelle Variante braucht nur noch vier statt 40 Rechenschritte pro Bild. In der LMArena, einer Plattform für Blindvergleiche durch Nutzer, landet Qwen-Image-2.0 auf Rang 9.

    Der Artikel Qwen-Image-2.0: Weniger Rechenschritte, stärkere Kompression, bessere Prompts erschien zuerst auf The Decoder.

  • Alibaba veröffentlicht effizientes Open-KI-Modell Qwen3.6-35B-A3B

    Chromatisches Glitch-Muster aus überlappenden Hexagrammen, das durch RGB-Farbverschiebungen einen lebendigen Retro-Futurismus vermittelt.

    Alibaba legt mit Qwen3.6-35B-A3B nach: Das neue Open-Source-Modell aktiviert nur drei von 35 Milliarden Parametern und schlägt damit laut Benchmarks Googles deutlich größeres Gemma 4-31B beim Programmieren und Schlussfolgern.

    Der Artikel Alibaba veröffentlicht effizientes Open-KI-Modell Qwen3.6-35B-A3B erschien zuerst auf The Decoder.

  • Qwen3.6-Plus: Alibaba stellt neues proprietäres KI-Modell für Entwickler vor

    Alibaba hat mit Qwen3.6-Plus sein drittes proprietäres KI-Modell innerhalb weniger Tage veröffentlicht.

    Der Artikel Qwen3.6-Plus: Alibaba stellt neues proprietäres KI-Modell für Entwickler vor erschien zuerst auf The Decoder.

  • Sehen, hören, coden: Alibabas Qwen3.5-Omni macht alles gleichzeitig

    Werbegrafik von Alibaba zeigt zwei Teddybären in traditioneller chinesischer Kleidung. Der linke Bär sitzt am Schreibtisch vor einem Monitor und repräsentiert Qwen3.5-Omni-Plus mit Funktionen wie SOTA Performance, Detailed Audio-Visual Captioning, Native Multimodal und Extensive Multilingual. Der rechte Bär hält ein Smartphone und steht für Qwen3.5-Omni-Plus-Realtime mit Voice Control, WebSearch Tool, Voice Clone und Semantic Interruption.

    Alibaba veröffentlicht Qwen3.5-Omni, ein omnimodales KI-Modell mit Text-, Bild-, Audio- und Videoverständnis. Es soll Gemini 3.1 Pro bei Audio-Aufgaben übertreffen und beherrscht eine neue Fähigkeit: Programmieren per gesprochener Anweisung und Videoinput.

    Der Artikel Sehen, hören, coden: Alibabas Qwen3.5-Omni macht alles gleichzeitig erschien zuerst auf The Decoder.

  • Alibaba gründet „Token Hub“: Neue KI-Sparte soll Forschung, Apps und Geräte unter einem Dach vereinen

    Alibaba bündelt seine KI-Aktivitäten in einer neuen Geschäftseinheit namens „Alibaba Token Hub“ (ATH), die CEO Eddie Wu direkt leitet, berichtet Bloomberg.

    Der Artikel Alibaba gründet „Token Hub“: Neue KI-Sparte soll Forschung, Apps und Geräte unter einem Dach vereinen erschien zuerst auf The Decoder.

  • Alibabas offene Qwen-3.5-Modellreihe liefert mehr Leistung bei weniger Rechenaufwand

    Alibaba hat die neue Qwen-3.5-Modellreihe vorgestellt. Sie umfasst vier Modelle: Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B und Qwen3.5-27B.

    Der Artikel Alibabas offene Qwen-3.5-Modellreihe liefert mehr Leistung bei weniger Rechenaufwand erschien zuerst auf The Decoder.

  • Qwen3.5 von Alibaba: Gigantisches Sprachmodell für lokale KI-Agenten

    Ein KI-Agenten-Bär programmiert

    Nano Banana

    Kurzfassung

    Quellen

    Alibaba hat mit Qwen3.5-397B-A17B ein gewaltiges Open-Weight-Modell für autonome KI-Agenten veröffentlicht.
    Die Software verarbeitet Texte, Bilder und hochauflösende Videos nativ in einem einzigen neuronalen Netz.
    Dank der effizienten Mixture-of-Experts-Architektur bleiben die reinen Rechenanforderungen während der Texterstellung im Rahmen.
    In ersten Benchmarks schließt das lizenzfreie System eindrucksvoll zu führenden geschlossenen Modellen auf.

    Offizieller Blog: Qwen3.5: Towards Native Multimodal Agents

    GitHub Qwen3.5

    Alibaba veröffentlicht Qwen3.5: Erstes Open-Weight-Modell mit Fokus auf KI-Agenten Alibaba hat mit Qwen3.5-397B-A17B das erste Open-Weight-Modell der neuen Generation unter der Apache-2.0-Lizenz veröffentlicht. Das multimodale Sprachmodell zielt speziell auf den Einsatz als autonomer KI-Agent ab und verarbeitet Text sowie Medien nativ. Architektur und Hardware-Bedarf Das Modell Qwen3.5-397B-A17B ist ab sofort frei verfügbar. Alibaba stellt die Gewichte unter der permissiven Apache-2.0-Lizenz im Netz bereit. Entwickler können das Open-Weight-Modell dadurch kommerziell ohne strenge Einschränkungen in eigenen Projekten nutzen. Technisch handelt es sich um ein fortschrittliches Mixture-of-Experts-Modell. Das System wählt für jede spezifische Aufgabe nur spezialisierte Teilnetze aus. Von den insgesamt 397 Milliarden Parametern sind bei einer Abfrage lediglich 17 Milliarden aktiv. Dieser Aufbau senkt den Rechenaufwand während der Texterstellung ganz erheblich. Der Speicherbedarf bleibt aufgrund der gewaltigen Gesamtgröße jedoch enorm hoch. Je nach Komprimierung (Quantisierung) belegt das Modell geschätzt 200 bis über 400 Gigabyte an Arbeits- oder Grafikspeicher. Nutzer benötigen für den lokalen Betrieb daher teure und extrem leistungsstarke Server-Hardware. In den nächsten Tagen und Wochen sollen aber auch noch deutlich kleinere Modelle erscheinen. Anzeige Native Multimodalität für Agenten Eine Besonderheit der neuen Qwen3.5-Serie ist die native Multimodalität. Das Modell verarbeitet verschiedene Datentypen direkt in einem einzigen neuronalen Netz. Dazu gehören einfache Texte, Bilder, lange Dokumente und hochauflösende Videos. Frühere KI-Systeme schalteten oft separate Modelle für die Bildverarbeitung und Textverarbeitung hintereinander. Dieser integrierte Ansatz reduziert typische Informationsverluste zwischen den einzelnen Modulen. Das System versteht den Kontext von verschachtelten Videoinhalten dadurch wesentlich präziser. Die Entwickler rücken den Einsatz als autonomen KI-Agenten stark in den Fokus. Das Modell soll künftig selbstständig im Internet recherchieren und lokale Dateien fehlerfrei analysieren. Die native Integration aller Medientypen bildet dafür die notwendige technische Basis. + Quelle: Alibaba Skalierung durch Trainingsumgebungen Alibaba zeigt in einer veröffentlichten Grafik den genauen Zusammenhang zwischen Modellleistung und Trainingsumgebungen. Die Entwickler haben die Menge an simulierten Umgebungen während des Trainings stark erhöht. Sie skalierten die Anzahl der Szenarien auf bis zu 15.000 Umgebungen. Eine Umgebung stellt dabei ein spezifisches Szenario in einem Computersystem dar. Darin trainiert das Modell konkrete Handlungen und komplexe Interaktionen mit Software. Die vorliegenden Daten belegen eine klare Leistungssteigerung bei zunehmender Anzahl dieser Trainingsszenarien. Die Modellvariante mit aktivierter Denk-Funktion erreicht bei 15.000 Umgebungen eine durchschnittliche Platzierung von 3,5. Damit schließt Qwen3.5-397B-A17B zu sehr starken proprietären Modellen wie Claude-Opus 4.5 auf. Die Standardversion ohne diese spezielle Denk-Funktion landet im direkten Vergleich auf dem siebten Rang. Sie wurde im Vorfeld mit knapp 12.000 Umgebungen umfassend trainiert. Der beobachtete Sprung verdeutlicht den positiven Effekt des zusätzlichen Rechenaufwands für die Planung. + Quelle: Alibaba Benchmarks zeigen beeindruckende Leistung Ein genauer Blick auf die Benchmark-Ergebnisse offenbart ein äußerst starkes Bild für die Nutzer. Bei der reinen Befehlsausführung im bekannten IFBench führt das neue Alibaba-Modell. Es setzt sich dort mit 76,5 Punkten an die Spitze des Testfeldes. + Quelle: Alibaba Auch bei der agentenbasierten Websuche schneidet das große Modell sehr gut ab. Im etablierten Test BrowseComp erreicht es überzeugende 78,6 Punkte. Die komplexe Dokumentenanalyse im OmniDocBench v1.5 entscheidet Qwen mit 90,8 Punkten ebenfalls eindeutig für sich. Mit dieser Punktzahl lässt es namhafte Konkurrenten wie GPT-5.2 und Claude Opus 4.5 hinter sich. In anderen Disziplinen zeigen sich nur sehr kleine, verzeihliche Rückstände auf die teure Konkurrenz. Bei komplexen Programmieraufgaben im SWE-bench Verified erreicht das Modell beachtliche 76,4 Punkte. Hier führen die geschlossenen Modelle Claude Opus 4.5 und GPT-5.2 das restliche Feld zwar an. Für ein kostenloses Open-Weight-Modell ist dieser Wert dennoch ein großer Erfolg. Ein ähnliches Bild zeigt sich beim logischen Schließen im anspruchsvollen Test GPQA Diamond. Dort liegt das System mit 88,4 Punkten nur denkbar knapp hinter dem proprietären GPT-5.2. Bei der visuellen Analyse im MMMU-Pro liefert das Sprachmodell ebenfalls extrem starke Werte. Es ordnet sich mit exzellenten 79,0 Punkten nur minimal hinter dem Platzhirsch Gemini 3 Pro ein. Die Entwickler liefern mit dem Release ein beeindruckend starkes Gesamtpaket für den lokalen Agenten-Einsatz. Anzeige