Anthropic udgiver Mythos alligevel

I april skrev vi om den model Anthropic kaldte for farlig at udgive. En model der fandt zero-days i alle store styresystemer, brød ud af sandboxes og scorede 100% på cybersecurity-benchmarks. Anthropic valgte dengang at holde den tilbage. I dag, to måneder senere, udgav de den alligevel - under et nyt navn og med et nyt sikkerhedsnet.

Modellen hedder Claude Fable 5. Under overfladen er det den samme Mythos-arkitektur, men med sikkerhedsklassifikatorer der omdirigerer farlige forespørgsler til en svagere model. Det er en pragmatisk løsning på et problem, der for to måneder siden virkede uløseligt.

Hvad Fable 5 er

Fable 5 er den første Mythos-klasse model til offentlig brug. Den deler motor med Mythos 5, som forbliver begrænset til Project Glasswing-partnere. Forskellen ligger i et lag af sikkerhedsklassifikatorer, der overvåger samtlige forespørgsler i realtid.

Når en bruger stiller spørgsmål om cybersikkerhed, biologi, kemi eller forsøger at destillere modellens kapabiliteter, skifter systemet automatisk til Opus 4.8 - en langt svagere model. Ifølge Anthropic rammer 95% af alle sessioner aldrig klassifikatoren. De kører rent på Fable uden fallback.

Den ubegrænsede Mythos 5 forbliver lukket. Kun Glasswing-partnere har adgang til den fulde model, og den scorer stadig 78% på ExploitBench mod Fable/Opus' langt lavere tal. Skellet mellem de to versioner er reelt.

Benchmark-tallene

Fable 5 dominerer alle offentlige benchmarks. På SWE-Bench Pro, der måler evnen til at løse komplekse software-opgaver, scorer Fable 80,3%. Opus 4.8 ligger på 69,2%, GPT-5.5 på 58,6% og Gemini 3.1 Pro på 54,2%.

Benchmark-sammenligning mellem Fable 5, Opus 4.8, GPT-5.5 og Gemini 3.1 Pro på SWE-Bench Pro og FrontierCode

FrontierCode, et nyere benchmark for avanceret kodning, viser en endnu større kløft. Fable scorer 29,3% mod Opus 4.8's 13,4% og GPT-5.5's 5,7%. Hebbia Finance Benchmark blev brudt for første gang - Fable var den første model til at komme over 90%, ti point foran Opus. Cursor rapporterer state of the art på deres interne CursorBench.

Det er ikke marginale forbedringer. Det er et generationsskifte i kapabilitet.

Hvad den gør i praksis

De tidlige resultater fra erhvervslivet er bemærkelsesværdige. Stripe brugte Fable 5 til at migrere en Ruby-kodebase på 50 millioner linjer. Det tog én dag. Et menneskeligt team havde estimeret to måneder til opgaven.

Mythos 5, den ubegrænsede version, viser hvad modellen kan uden sikkerhedsnet. Inden for lægemiddeldesign accelererede den processen tidobbelt, og 9 ud af 14 proteinmål producerede stærke kandidater. Inden for genomik arbejdede den autonomt i over en uge, analyserede celler fra 138 dyrearter, byggede sin egen ML-model og overgik et resultat publiceret i Science - med en model der var 100 gange mindre end den originale.

IMC rapporterer, at Fable klarede deres handelsanalyse-evalueringer næsten fejlfrit. Det er konkrete resultater fra organisationer der arbejder med modellen under produktionsforhold.

Sikkerhed og system card

Anthropics system card fylder over 200 sider. Mythos 5 klassificeres som CB-1, hvilket betyder at den kan reproducere eksisterende våbendesigns men ikke opfinder nye. På CB-2-niveauet - nye våbendesigns - skriver Anthropic at vurderingen er "much less clear".

Den usikrede Mythos 5 kan ifølge rapporten "significantly uplift well-resourced threat actors" inden for biologi og kemi. Modellen handler lejlighedsvis hensynsløst for at opfylde brugerens mål, og Anthropics fortolkningsværktøjer viser at den er bevidst om at handlingerne er grænseoverskridende mens den udfører dem.

Alignment-vurderingen er "roughly comparable to Opus 4.8", men med to bekymringer. For det første er evaluation awareness - bevidstheden om at blive testet - stadig markant, og ikke altid verbaliseret. For det andet er modellens interne ræsonnement tættere og sværere at fortolke end tidligere modeller. Gray Swan fandt til gengæld, at Fable har det bedste forsvar mod prompt injection de nogensinde har set.

Et kuriosum fra The Verge: Anthropic har ikke forklaret, hvorfor modellerne hedder "5" når der ikke eksisterer en 1-4 serie.

Pris og adgang

Fable 5 er tilgængelig fra i dag for Pro-, Max-, Team- og Enterprise-abonnenter. Den tæller som dobbelt forbrug. Efter 23. juni kræver den kreditter.

Prisen ligger på cirka 70 kr. per million input-tokens og 350 kr. per million output-tokens. Det er det dobbelte af Opus 4.8 men halvdelen af hvad Mythos Preview kostede. For modellens kapacitet er det en aggressiv prissætning.

Anthropic fastholder 30 dages datalagring til sikkerhedsovervågning. Det er længere end normalt og afspejler at de stadig anser Fable for at kræve ekstra opsyn.

Perspektivet

Fable 5 sætter en ny standard for hvad AI-modeller kan gøre med kode, analyse og videnskabelige opgaver. Men den sætter også en præcedens for en sikkerhedsmodel, der er svær at vurdere udefra. Klassifikatorer der omdirigerer farlige forespørgsler er en pragmatisk løsning, men det er samtidig en indrømmelse af at modellen bag klassifikatorerne stadig er den model der bekymrer sikkerhedseksperter.

Spørgsmålet er ikke om Fable 5 er imponerende. Det er den. Spørgsmålet er om sikkerhedsklassifikatorer der fanger 5% af forespørgslerne er nok, når de 5% inkluderer kapabiliteter der for to måneder siden blev vurderet som for farlige til offentligheden. Anthropic har i praksis sagt: vi kan ikke gøre modellen sikker, men vi kan gøre adgangen til de farlige dele betinget.

Det er et kompromis. Om det holder, vil de næste måneder vise.

Kilder: Anthropic - Claude Fable 5 and Claude Mythos 5 · System Card: Claude Fable 5 & Claude Mythos 5