AI-verdenen er fuld af forkortelser, tekniske termer og buzzwords der kan få selv erfarne ledere til at miste tråden. Det er et problem, fordi man ikke kan træffe gode beslutninger om noget man ikke forstår.
Denne ordbog er skrevet til dig der vil forstå hvad der faktisk foregår - uden at skulle læse et forskningspapir. Vi har delt begreberne op i fire kategorier: det du skal kende, det AI kan, det der kan gå galt, og den infrastruktur det hele kører på.
Det du skal kende
LLM (Large Language Model) er de sprogmodeller der driver ChatGPT, Claude, Gemini og andre AI-assistenter. De er trænet på enorme mængder tekst og lærer at forudsige det næste ord i en sætning. Når du skriver en besked til en AI-assistent, genererer modellen det mest sandsynlige svar baseret på de mønstre den har lært. GPT er OpenAI's model, Claude er Anthropics, Gemini er Googles.
Tokens er de byggesten en sprogmodel læser og skriver. Et token er typisk et ord eller en del af et ord. Når du bruger en AI-tjeneste, betaler du per token - både for det du sender ind (input) og det modellen svarer (output). Lange dokumenter eller komplekse forespørgsler bruger flere tokens og koster mere. Det er vigtigt at forstå når man budgetterer AI-drift.
Kontekstvindue er det maksimale antal tokens en model kan håndtere i en enkelt session. Tænk på det som modellens arbejdshukommelse. Et større kontekstvindue betyder at modellen kan læse længere dokumenter og huske mere af samtalen. Moderne modeller har kontekstvinduer fra 128.000 til over 1 million tokens.
Inference er processen når en trænet model faktisk kører og genererer svar. Træningsfasen er dyr og sker en gang. Inference er det der koster i daglig drift - hver gang en bruger stiller et spørgsmål, kører modellen inference.
Træning er den proces hvor en model lærer fra data. Rå data (bøger, artikler, kode) fødes ind, og modellen justerer sine parametre for at lære mønstre. Træning kræver enorme mængder beregningskraft og kan koste millioner af dollar for de største modeller.
Parametre (weights) er de numeriske værdier der definerer hvad en model har lært. Når vi siger at en model har 70 milliarder parametre, refererer vi til antallet af justerbare værdier i modellen. Flere parametre giver generelt større kapacitet, men også højere driftsomkostninger.
AGI (Artificial General Intelligence) er ideen om en AI der er mindst lige så dygtig som et menneske på tværs af de fleste opgaver. Det er det langsigtede mål for virksomheder som OpenAI og Google DeepMind - men definitionen varierer. Nogle mener det kræver overmenneskelig performance, andre at det blot skal matche en gennemsnitlig medarbejder. I 2026 er vi ikke der endnu, men investeringerne der jagter AGI driver hele industriens udvikling.
Deep learning og neurale netværk er den underliggende arkitektur bag moderne AI. Et neuralt netværk er lag på lag af matematiske funktioner inspireret af hjernens neuroner. Deep learning betyder at netværket har mange lag, hvilket gør det i stand til at finde komplekse mønstre i data - fra billedgenkendelse til sprogforståelse. Det er fundamentet som LLM'er, billedgenerering og talegenkendelse er bygget på.
Det AI kan
AI-agenter er systemer der ikke bare svarer på spørgsmål, men udfører opgaver på dine vegne. En agent kan læse en e-mail, slå op i en database, skrive et svar og sende det - alt sammen uden at du skal gøre noget mellem trinene. I 2026 er agenter gået fra eksperiment til produktiv brug i kundeservice, kodeudvikling og procesautomatisering.
RAG (Retrieval Augmented Generation) lader en AI-model hente svar direkte fra jeres egne dokumenter i stedet for kun at stole på sin træning. Modellen søger i en vidensdatabase, finder de mest relevante passager og bruger dem som grundlag for sit svar. Det reducerer hallucinations med op til 71% og er den mest udbredte teknik til virksomheds-AI i 2026.
Fine-tuning er yderligere træning af en eksisterende model på specialiserede data. Hvis RAG er at give modellen en opslagsbog, er fine-tuning at give den en uddannelse. Det bruges når modellen skal lære en bestemt skrivestil, et fagsprog eller en konsistent struktur. Det er dyrere end RAG og kræver retræning når data ændres.
Chain-of-thought (kæde-ræsonnering) er en teknik hvor modellen gennemgår mellemregningerne i stedet for at hoppe direkte til svaret. Det forbedrer præcisionen markant på logiske, matematiske og kodningsopgaver. Moderne "reasoning models" som Claudes thinking mode og GPT's o-serie bruger denne teknik som standard.
Multimodal refererer til modeller der kan håndtere mere end bare tekst. En multimodal model kan analysere billeder, forstå lyd, se video og svare på tværs af medietyper i en samlet session. Qwen 3.5 Omni og Gemini er eksempler på modeller der er bygget multimodalt fra bunden.
MCP (Model Context Protocol) er en åben standard der lader AI-modeller forbinde til eksterne værktøjer - databaser, API'er, Slack, GitHub, billedgenerering og meget mere. Tænk på det som USB-standarden for AI: en fælles måde at tilslutte værktøjer på, uanset leverandør.
Embeddings er numeriske repræsentationer af tekst der fanger betydning snarere end ordlyd. To sætninger med samme mening men forskellige ord ender tæt på hinanden i vektorrummet. Embeddings er grundlaget for RAG og semantisk søgning - det er det der gør at en AI kan finde relevant information selv når brugerens formulering ikke matcher dokumentets ordvalg.
Coding agents er AI-agenter specialiseret i softwareudvikling. I stedet for blot at foreslå kode til en udvikler, kan en coding agent selv skrive, teste og debugge kode på tværs af hele codebases. De håndterer den iterative trial-and-error proces der normalt fylder en udviklers dag. Tænk på det som en ekstremt hurtig kollega der aldrig mister fokus - men som stadig kræver review af sit arbejde.
API endpoints er de "knapper" på bagsiden af software som andre programmer kan trykke på for at få ting til at ske. Udviklere bruger dem til integrationer - fx at lade en applikation hente data fra en anden, eller lade en AI-agent styre tredjepartstjenester direkte. Efterhånden som AI-agenter bliver mere kapable, kan de selv finde og bruge disse endpoints, hvilket åbner for kraftfuld automatisering.
Det der kan gå galt
Hallucinations er AI-industriens ord for når modeller opdigter information. En model kan generere overbevisende men fuldstændig forkerte svar - opdigtede kilder, falske statistikker, ikke-eksisterende lovparagraffer. Problemet opstår fordi modeller forudsiger sandsynlige ord, ikke verificerer fakta. RAG og grounding er de primære værktøjer til at reducere hallucinations i virksomhedsbrug.
Grounding er processen med at forankre AI-output i verificerbare kilder. I stedet for at lade modellen svare udelukkende baseret på sin træning, gives den adgang til konkrete dokumenter eller databaser. Hvert svar kan derefter spores tilbage til en specifik kilde. Det er kritisk for compliance, auditing og tillid.
RLHF (Reinforcement Learning from Human Feedback) er den teknik der gør AI-modeller nyttige og sikre efter den indledende træning. Mennesker vurderer modellens svar og rangerer dem fra bedst til dårligst. Modellen lærer derefter at producere den type svar mennesker foretrækker. Det er RLHF der gør forskellen mellem en rå sprogmodel og en hjælpsom assistent som ChatGPT eller Claude. Uden RLHF ville modeller være langt mindre præcise og langt mere tilbøjelige til at generere skadeligt indhold.
Infrastrukturen bag det hele
Compute refererer til den beregningskraft der driver AI-modeller. I praksis er det GPU'er, TPU'er og specialiserede AI-acceleratorer i store datacentre. Compute er den største enkeltomkostning i AI-industrien og årsagen til at virksomheder som Nvidia er blevet blandt verdens mest værdifulde.
Open source vs closed models er et fundamentalt valg. Lukkede modeller (GPT, Claude, Gemini) køres via API og kontrolleres af udvikleren. Open source-modeller (Qwen, GLM, Llama) kan downloades, hostes i egen infrastruktur og tilpasses frit. Lukkede modeller er ofte stærkest på rå performance. Open source giver datakontrol, lavere omkostninger og uafhængighed.
Diffusion er teknologien bag de fleste billedgenererende AI-modeller. Systemet lærer at tilføje støj til billeder gradvist, og lærer derefter at køre processen baglæns - så det kan skabe nye billeder fra ren støj. Det er grundlaget for DALL-E, Midjourney og Stable Diffusion.
Distillation er en teknik til at gøre store modeller mindre og hurtigere. En stor "lærer-model" genererer svar, og en mindre "elev-model" trænes til at efterligne læreren. Resultatet er en kompakt model der bevarer det meste af den stores kapacitet til en brøkdel af driftsomkostningerne.
Hvorfor det her betyder noget
AI-begreber er ikke akademisk teori. De er forretningsbeslutninger.
Forskellen på RAG og fine-tuning afgør om jeres AI-løsning koster 5.000 eller 50.000 kroner at vedligeholde årligt. Forskellen på open source og closed models afgør om jeres data forlader virksomheden. Forskellen på en chatbot og en agent afgør om AI sparer jer fem minutter eller fem timer om dagen.
Du behøver ikke at forstå matematikken bag et neuralt netværk. Men du bør forstå hvad de rigtige valg er - og hvad de koster.
Har du også svært ved at finde rundt i de mange forskellige AI-begreber? Hos Nordium tilbyder vi AI-rådgivning der hjælper jer med at navigere landskabet og træffe de rigtige valg.
Kilder: TechCrunch, Suprmind, IBM


