Den 14. maj dukkede et nyt navn op på AI Arenas tekst-leaderboard. Qwen 3.7-Max-Preview landede direkte på en 13. plads med en Elo-rating på 1.475 - og rykkede ind i top-10 på matematik. Fem dage senere annoncerede Alibaba sin nye AI-chip Zhenwu. Timingen er ikke tilfældig.
Mens USA strammer eksportkontrol på avancerede chips til Kina, bygger Alibaba stille og roligt en fuld AI-stak: egne modeller, eget silicium, egen infrastruktur. Qwen 3.7 er det nyeste led i den kæde.
Hvad Qwen 3.7 kan
Arkitekturen er en Mixture-of-Experts-model (MoE) med Gated Delta Networks - en tilgang der aktiverer kun de relevante dele af modellen per forespørgsel. Det giver høj ydeevne uden at brænde compute på parametre der ikke er nødvendige for den konkrete opgave.
Kontekstvinduet bygger videre på Qwen 3.5 og 3.6-serien, der startede med 262.000 tokens og kunne udvides til over 1 million tokens. Den kapacitet gør modellen relevant til opgaver med store dokumenter, lange kodegennemgange og komplekse analyser.
Modellen er stadig i preview og kan testes via chat.qwen.ai. Der er endnu ikke frigivet åbne vægte - men Alibabas track record med Qwen-serien giver grund til at forvente det. Tidligere versioner er udgivet under Apache 2.0-licens, som giver fuld kommerciel frihed uden restriktioner.
Fra 3.6 til 3.7 - hvad er nyt
Qwen 3.6 var allerede en stærk model. 3.7 bygger videre på det fundament med en ny arkitekturkomponent og bedre placering på tværs af benchmarks.
| Parameter | Qwen 3.6 | Qwen 3.7 |
|---|---|---|
| Kontekstvindue | 1M tokens | 1M tokens |
| Arkitektur | MoE | MoE + Gated Delta Networks |
| SWE-bench (kodning) | 78,8% | Preview - endelige tal afventer |
| Hastighed vs. 3.5 | 3x hurtigere | Fortsat på 3.6-niveau eller bedre |
| Arena-placering | Lavere end top-15 | #13 overordnet, top-10 matematik |
| Multimodal | Ja | Ja (3.7-Plus-Preview #16) |
Springet fra 3.6 til 3.7 handler mindre om rå parametertal og mere om arkitekturen. Gated Delta Networks giver modellen en mere selektiv aktivering af netværkets lag - færre beregninger per token, bedre kvalitet per compute-enhed.
Qwen 3.7 mod feltet
En 13. plads lyder beskeden, men feltet er tæt. Her er Qwen 3.7 sat op mod de modeller den konkurrerer direkte med.
| Model | Arena-placering | Styrke | Kontekst |
|---|---|---|---|
| Claude Opus 4.6 | #1 (Elo ~1.530) | Generalist, lang kontekst | 1M tokens |
| GPT-5.5 | Top-5 | Kodning, reasoning | 200K tokens |
| Grok-3 | Top-5 | MMLU ~92,7% | - |
| DeepSeek V4-Pro | Top-10 | Kodning 93,5% | - |
| Qwen 3.7-Max | #13 (Elo 1.475) | Matematik, kodning | 1M+ tokens |
Qwen 3.7 slår ikke de bedste vestlige modeller overordnet, men den er konkurrencedygtig i matematik og kodning. Og den gør det med en åben licens - det er ingen af de andre i top-5 der tilbyder.
Benchmarks i kontekst
Placeringen på AI Arena fortæller en del. En 13. plads overordnet og top-10 i matematik placerer Qwen 3.7 i selskab med modeller fra OpenAI, Anthropic og Google. Visionsversionen Qwen 3.7-Plus-Preview ligger på en 16. plads i multimodal-kategorien.
På Artificial Analysis Intelligence Index scorer Qwen 3.7 57 ud af 100. Det lyder beskedent, men medianen for sammenlignelige modeller ligger på 14. Det er et markant spring over gennemsnittet.
Kodningsevnerne er endnu mere bemærkelsesværdige set i historisk perspektiv. Qwen 3-serien scorede 94,2% på Codeforces-benchmarket - en score der slog både DeepSeek-R1 og Grok-3. Det er det niveau der gør open source-modeller til et reelt alternativ til lukkede konkurrenter.
Self-hosting og åbne vægte
Qwen-seriens mønster er forudsigeligt. Qwen 3.6 gik fra preview til åbne vægte på to dage - preview den 20. april, åbne vægte den 22. april. Hvis 3.7 følger samme kadence, kan åbne vægte lande inden for uger, ikke måneder.
De nuværende åbne størrelser i Qwen 3-serien giver et fingerpeg om hvad der kommer:
- 27B (dense) - kræver ~54 GB VRAM i FP16, men kan kvantiseres til 24 GB
- 35B-A3B (MoE) - kun ~3 mia. aktive parametre per forespørgsel, kører på 24 GB VRAM (RTX 4090 / A5000)
- Apache 2.0-licens - fuld kommerciel frihed, ingen restriktioner
35B-A3B-varianten er særligt interessant for virksomheder der vil self-hoste. En enkelt RTX 4090 er nok til at køre modellen med rimelig hastighed. Det bringer frontier-klasse AI ned på et budget der ikke kræver cloud-kontrakter eller specialiseret hardware.
Forventningen er at Qwen 3.7 følger samme licensmodel. Alibaba har ingen historik med at stramme vilkårene mellem versioner.
Chippen og den større strategi
Dagen før Qwen 3.7 nåede pressen, præsenterede Alibaba sin Zhenwu AI-chip. Det er ikke to separate nyheder - det er to sider af samme strategi. Kina har i årevis været afhængig af Nvidias H100- og A100-chips til AI-træning, men amerikanske eksportrestriktioner har gjort den forsyningskæde ustabil og uforudsigelig.
Alibabas svar er vertikalt: byg modellen, byg chippen, byg platformen. Det er samme mønster Apple har brugt i årtier - kontrol over hele stakken fra silicium til software. Forskellen er at Alibaba gør det under pres, ikke af lyst.
For resten af verden er konsekvensen at der nu eksisterer en fuld AI-infrastruktur uden vestlige komponenter. Det er nyt.
Åben kildekode som konkurrencefordel
Qwen-serien har konsekvent satset på åbenhed. Apache 2.0-licensen på tidligere modeller betyder at virksomheder verden over kan downloade, finjustere og deploye Qwen-modeller uden at betale licensafgifter eller binde sig til en cloud-udbyder.
Det er en fundamentalt anderledes forretningsmodel end OpenAIs API-baserede tilgang eller Googles semi-åbne Gemma-serie. Alibaba tjener penge på cloud-infrastruktur - jo flere der bruger Qwen, jo flere der hoster på Alibaba Cloud. Modellen er tabslederen, platformen er forretningen.
For europæiske virksomheder giver det en interessant mulighed. En open-weight frontmodel med Apache 2.0-licens kan hostes lokalt, tilpasses specifikke domæner og driftes uden afhængighed af en enkelt leverandør. Compliance og datalokation er nemmere at håndtere når modellen kører på egen infrastruktur.
Hvad det betyder i praksis
Qwen 3.7 er stadig i preview. Åbne vægte er ikke tilgængelige endnu, og performance kan ændre sig inden final release. Men retningen er tydelig: kinesiske AI-modeller konkurrerer nu direkte med de bedste vestlige alternativer, og de gør det med en åbenhed der er sjælden i branchen.
For virksomheder der vurderer AI-modeller til produktion, er billedet blevet mere nuanceret. Det handler ikke længere kun om OpenAI versus Anthropic versus Google. Alibabas Qwen, DeepSeek og Z.ai's GLM er reelle alternativer med konkurrencedygtige benchmarks, åbne licenser og - i mange tilfælde - markant lavere driftsomkostninger.
Eksportkrigen mellem USA og Kina har ikke bremset udviklingen. Den har accelereret den.
Kilde: Qwen - Qwen 3.7


