Når AI forbedrer AI

AGI har fået en afløser som branchens foretrukne buzzword. Det hedder RSI - Recursive Self-Improvement - og det beskriver en AI der kan forbedre sig selv. Forskellen fra AGI-debatten er, at RSI ikke kun er et tankeeksperiment. Der er startups med milliarder i ryggen, konkrete benchmarks der bevæger sig i rette retning, og AI-systemer der allerede skriver store dele af deres egen kode. Spørgsmålet er ikke længere om det sker, men hvor hurtigt.

Hvad er rekursiv selvforbedring

Grundideen er enkel. En AI der kan opgradere sig selv. Når AI-systemet håndterer opgraderingscyklussen bedre end mennesker, lukker løkken sig - og processen accelererer uden menneskelig indgriben.

Det er vigtigt at skelne mellem to ting. At bruge AI-værktøjer til at lave AI-forskning er allerede hverdag. Det gør de fleste forskningslaboratorier. Men det er ikke RSI i klassisk forstand. Helen Toner fra Georgetown CSET, tidligere medlem af OpenAIs bestyrelse, er klar i mælet: den klassiske definition af RSI kræver at der ikke er brug for mennesker overhovedet. Ingen der sætter retning, ingen der verificerer resultater, ingen der beslutter hvad der skal prioriteres.

Den skelnen er afgørende. For selv de mest avancerede AI-systemer i dag har stadig svært ved selvstændigt at håndtere ugelange opgaver, forstå organisatoriske prioriteter og udøve den slags dømmekraft der kræver kontekst ud over det tekniske.

Dem der bygger det nu

Flere virksomheder har gjort RSI til deres eksplicitte mål, og de er ikke små.

Richard Socher, der grundlagde You.com og tidligere var forskningschef hos Salesforce, lancerede i 2026 startuppen Recursive Superintelligence. Navnet er programmet. Virksomheden rejste en Serie A på ca. 4,5 mia. DKK til en værdiansættelse på ca. 32 mia. DKK, med GV og Greycroft i front og Nvidia og AMD som investorer. Peter Norvig - forfatteren bag den mest brugte AI-lærebog i verden - er med på holdet. Sochers erklærede mål: "Hele processen med idéudvikling, implementering og validering af forskningsidéer skal være automatisk."

Andrej Karpathy, medstifter af OpenAI og en af feltets mest kendte stemmer, har arbejdet på et projekt kaldet Auto-Research, hvor agentsvärme træner sprogmodeller. I maj 2026 skiftede han til Anthropic, hvor han nu arbejder under Nick Joseph på pre-training. Det er et signal om hvor alvorligt Anthropic tager ambitionen om AI der forbedrer sin egen træning.

Sara Hooker, tidligere leder af Googles Brain-team og Cohere for AI, lancerede Adaption med værktøjet AutoScientist. Det co-optimerer data og modelvægte samtidig og sigter mod at gøre frontier-træning mulig uden for de store laboratorier. Det er et konkret forsøg på at demokratisere den proces der i dag kræver hundredvis af forskere og milliarder i compute.

Så er der Doris Xin og hendes startup Disarray. Deres selvtrænede ML-agent vandt 28 Kaggle-medaljer - en præstation de fleste menneskelige data scientists aldrig kommer i nærheden af. Xins perspektiv er afvæbnende nøgternt: "Med uendelig compute og uendelig tid er vi allerede der. Det er ikke en kreativ øvelse. Det er bare en masse grundlæggende ingeniørarbejde."

Hvor langt er vi

Ajeya Cotra fra METR har formuleret det klareste framework for at vurdere hvor langt RSI er nået. Det har tre stadier.

Det første er Adequacy. AI kan producere forskning alene, selvom den måske ikke er lige så god som menneskelig forskning. Cotras vurdering: "Jeg ville ikke blive helt chokeret, hvis vi allerede har passeret det stadie."

Det andet er Parity. AI-systemer alene matcher mennesker alene i kvalitet og produktivitet. Det kommer sandsynligvis et par år efter adequacy.

Det tredje er Supremacy. AI alene overgår selv den bedste kombination af mennesker og AI. Cotras model forudsiger at det kan ske inden for et år efter parity er nået. Og efter parity skifter dynamikken fundamentalt: i stedet for tusindvis af forskere kan man skalere til millioner af parallelle AI-forskere.

Cotras RSI-framework - fra adequacy til supremacy

De konkrete datapunkter peger i retning af at adequacy enten er nået eller er tæt på.

Anthropics Boris Cherny har sagt at tæt på 100 procent af Claude Codes kode er skrevet af Claude Code selv. Det er ikke en hypotetisk fremtidsversion - det er det værktøj udviklere bruger i dag. I en intern undersøgelse hos Anthropic mente 5 ud af 18 ingeniører at deres Mythos-model kunne erstatte en L4-ingeniør - et mellemniveau i Anthropics hierarki. 132 ingeniører blev spurgt, og de rapporterede at de bruger Claude i 60 procent af deres arbejde med en produktivitetsstigning på 50 procent.

NanoGPT-benchmarket fortæller en lignende historie. Træningstiden faldt fra 45 minutter til 1 minut og 43 sekunder mellem maj 2024 og marts 2026. Det er en 31x forbedring på under to år. SWE-bench Verified, der måler AI-systemers evne til at løse reelle softwareproblemer, sprang fra omkring 60 procent i 2024 til næsten 100 procent i 2025.

Men svaghederne er stadig tydelige. AI-systemerne kæmper med at styre sig selv over ugelange, tvetydige opgaver. De mangler forståelse for organisatoriske prioriteter. De har ikke smag - den intuition der fortæller en erfaren forsker hvilke problemer der er værd at løse. Og de er dårlige til at verificere deres egne resultater uden menneskeligt tilsyn.

Hvorfor tempoet accelererer

Logikken bag acceleration er cirkulær på den mest bogstavelige måde. Når AI forbedrer AI-forskning, forbedrer forbedringerne fremtidige forbedringer. Hver iteration gør den næste hurtigere.

NanoGPT-benchmarket illustrerer det konkret. Det er ikke bare blevet hurtigere - tempoet i forbedringerne er steget. De første optimeringer tog måneder. De seneste tog uger. Og mange af optimeringerne kom fra AI-assisterede eksperimenter, ikke fra menneskelige forskere der sad med papir og tavle.

METRs model forudsiger at 99 procent af AI-forskning og -udvikling kan automatiseres omkring 2032. Det er seks år fra nu. Selv hvis modellen er optimistisk med en faktor to, taler vi om et årti.

Men der er modstemmer. Googles CEO Sundar Pichai sagde det direkte: "På den måde folk beskriver RSI, ville det repræsentere et nyt niveau af acceleration... men vi er ikke helt der endnu." Helen Toner advarer mod det hun kalder smooth-ladder-tænkning - antagelsen om at fordi hvert trin indtil nu har været jævnt, vil de næste trin også være det. Historisk set har mennesker hele tiden delegeret mere til maskiner, men der har altid været et menneskeligt lag der styrer fra toppen. Spørgsmålet er om det lag forsvinder denne gang, eller om det bare rykker et niveau op som det altid har gjort.

Der er også et praktisk argument. AI-agenter der arbejder autonomt er allerede en del af udvikleres hverdag. Det er ikke science fiction. Men springet fra "AI der udfører opgaver" til "AI der sætter sine egne opgaver" er kvalitativt anderledes, og det er der ingen der har demonstreret overbevisende endnu.

Det svære spørgsmål

RSI ligner AGI på et afgørende punkt: alle er enige om at vi ikke er helt der endnu, men brikkerne falder på plads hurtigere end forventet. Uenigheden mellem eksperterne - fra Doris Xins "vi er allerede der med nok compute" til Picahis "ikke helt endnu" - er i sig selv sigende. Når feltet er delt, er det som regel fordi svaret afhænger af definitioner, og definitionerne afhænger af hvad man vælger at måle.

Det eneste der er sikkert, er at det er sværere end nogensinde at forudsige tidslinjen. For to år siden ville de fleste have kaldt en 31x forbedring i træningstid for et vildt gæt. I dag er det et benchmark-resultat.

For teams der bygger med AI i dag, er den praktiske konsekvens konkret. De værktøjer de bruger i morgen, vil være målbart bedre end dem de bruger i dag - ikke kun fordi en virksomhed har shippet en opdatering, men fordi AI'en har bidraget til sin egen forbedring. Afstanden mellem "AI som værktøj" og "AI der forbedrer AI" er ved at lukke sig. Hvor hurtigt den lukker sig helt, er det spørgsmål som selv de klogeste hoveder i branchen ikke kan blive enige om.

Kilde: TechCrunch - RSI is the new AGI