Kennisbank · Achtergrond

De geschiedenis van large language models

Van ELIZA (1966) tot GPT-5 en DeepSeek R1: in zestig jaar evolueerde taalverwerkende AI van regelgebaseerde trucjes naar systemen die programmeren, redeneren en miljarden vragen per week beantwoorden. Deze tijdlijn legt de belangrijkste momenten uit — en waarom ze ertoe doen voor wie vandaag online vindbaar wil zijn.

Belangrijkste punten

  • ELIZA (1966) was de eerste chatbot — puur op patroonherkenning, geen 'begrip'
  • Het transformer-paper van Google (2017) maakte moderne LLM's mogelijk
  • GPT-3 (2020) en ChatGPT (nov 2022) zijn de twee kantelpunten naar massagebruik
  • Vanaf 2024–2026 verschuift het accent naar redeneren, agents en multimodaliteit
  • Open-weight modellen (Llama, Mistral, DeepSeek) sluiten de kloof met gesloten labs

1950–1966 · De vroege fundamenten

De geschiedenis van LLM's begint niet in 2022, maar in 1950 — toen Alan Turing zijn beroemde imitation game beschreef: de vraag of een machine een gesprek kon voeren dat niet van een mens te onderscheiden was. Zestien jaar later bouwde MIT-onderzoeker Joseph Weizenbaum ELIZA, een chatbot die een Rogeriaanse psychotherapeut imiteerde door eenvoudige patroon-substituties uit te voeren ('I am sad' → 'Why are you sad?'). ELIZA 'begreep' niets, maar gebruikers gingen er regelmatig diepe gesprekken mee aan — het eerste bewijs dat mensen taal projecteren op alles wat lijkt te antwoorden. In de decennia daarna domineerden regelgebaseerde systemen (SHRDLU, expert systems) en statistische methoden zoals n-grams en Hidden Markov Models het veld.

2003–2013 · Statistiek wordt neuraal

In 2003 publiceerden Yoshua Bengio en collega's het paper dat tekst voor het eerst voorstelde als dichte vector-representaties (word embeddings) — een neuraal taalmodel. Tien jaar later, in 2013, maakte Tomas Mikolov's word2vec dit idee bruikbaar: woorden werden punten in een hoogdimensionale ruimte waar 'koning − man + vrouw ≈ koningin' opeens betekenis kreeg. Combineer dat met Recurrent Neural Networks (RNN's) en hun opvolger Long Short-Term Memory (LSTM, Hochreiter & Schmidhuber 1997), en je had de eerste modellen die zinnen genereerden in plaats van losse woorden voorspelden. Google Translate stapte in 2016 over op een neuraal model — de eerste grote consumenten-AI met dit DNA.

2017 · 'Attention is All You Need'

Op 12 juni 2017 publiceerde een team bij Google Brain en Google Research het paper 'Attention is All You Need'. Daarin introduceerden ze de transformer-architectuur: een neuraal netwerk dat sequenties parallel verwerkt via self-attention, in plaats van woord-voor-woord zoals RNN's. Twee gevolgen veranderden alles. Ten eerste werd training drastisch sneller, omdat GPU's eindelijk hun volle parallelliteit konden benutten. Ten tweede bleek de architectuur opmerkelijk goed te schalen: meer data en meer parameters bleven het model verbeteren, zonder duidelijk plafond. Vrijwel elk modern LLM — GPT, Claude, Gemini, Llama, Mistral, Qwen, DeepSeek — is een variant op deze transformer.

Video · Andrej Karpathy: Intro to Large Language Models

Voor wie de werking van LLM's diepgaander wil begrijpen is dit één uur durende college van Andrej Karpathy (medeoprichter van OpenAI, oud-hoofd AI bij Tesla) de beste startplek. Hij legt stap voor stap uit hoe een model wordt getraind, hoe finetuning en RLHF werken, en waar de echte beperkingen zitten.

Video: Andrej Karpathy, 'Intro to Large Language Models' (2023) — Engelstalig, ±60 minuten.

2018–2019 · BERT en de eerste GPT's

Op de transformer bouwden twee scholen voort. Google's BERT (2018) was encoder-only en gericht op begrip: het haalde state-of-the-art in zoekrelevantie en werd in 2019 in Google Search ingebouwd. OpenAI's GPT-serie was decoder-only en gericht op generatie. GPT (2018, 117M parameters) en GPT-2 (2019, 1,5 miljard) lieten zien dat een eenvoudig 'voorspel het volgende woord'-doel op heel veel tekst tot verrassend coherente generatie leidde. OpenAI hield GPT-2 aanvankelijk achter omdat het 'te gevaarlijk' zou zijn — een beslissing die in 2026 nog steeds debat oplevert.

2020 · GPT-3 en de schaalwet

GPT-3 verscheen in juni 2020 met 175 miljard parameters, ruim 100× zo groot als GPT-2. Belangrijker dan de omvang was wat OpenAI in het paper 'Scaling Laws for Neural Language Models' aantoonde: modelprestaties verbeterden voorspelbaar met meer compute, data en parameters. Dat veranderde het AI-onderzoek van 'welk algoritme is slimmer' naar 'wie kan een groter cluster bouwen'. GPT-3 kon for het eerst echt few-shot learning: je beschreef een taak in de prompt en het model deed het, zonder hertraining. De eerste GPT-3-API-startups (Jasper, Copy.ai, GitHub Copilot via Codex) ontstonden in 2021–2022.

30 november 2022 · ChatGPT en de massa-adoptie

OpenAI lanceerde ChatGPT als 'low-key research preview' op een woensdagavond. Binnen vijf dagen waren er 1 miljoen gebruikers, binnen twee maanden 100 miljoen — destijds de snelst groeiende consumenten-app ooit. De magie zat niet in een nieuw model (het was GPT-3.5, een variant van GPT-3), maar in twee dingen: een gratis chat-interface en RLHF (Reinforcement Learning from Human Feedback), waardoor het model behulpzaam en gespreksgericht reageerde. Microsoft investeerde $10 miljard, Google riep code red uit, en Anthropic (in 2021 opgericht door ex-OpenAI'ers) lanceerde Claude. De LLM-race was begonnen.

2023–2024 · Multimodaal en open-source

GPT-4 (maart 2023) bracht multimodaliteit — tekst én beeld als input — en aanzienlijk betere redenering. Google reageerde met Gemini (december 2023, native multimodaal), Anthropic met Claude 3 (maart 2024). Even belangrijk was de open-source-revolutie: Meta bracht Llama uit (februari 2023) en publiceerde de gewichten — een breuk met de gesloten OpenAI-strategie. Mistral (Frankrijk), Qwen (Alibaba) en het Chinese DeepSeek volgden. In 2024 was de prestatiekloof tussen open-weight en closed-weight modellen kleiner dan ooit, en konden bedrijven serieuze LLM's op eigen infrastructuur draaien.

2025–2026 · Redeneren, agents en GEO

Drie ontwikkelingen domineren de huidige fase. Ten eerste reasoning models: OpenAI's o1 en o3, DeepSeek R1 (januari 2025) en Claude Opus 4.5 'denken' eerst hardop door een probleem voordat ze antwoorden — een doorbraak in wiskunde, code en wetenschap. Ten tweede agents: modellen die niet alleen tekst genereren maar zelfstandig tools gebruiken, web browsen, software bouwen en taken uitvoeren over meerdere stappen. Ten derde de verschuiving van zoeken naar antwoorden: Google AI Overviews, Perplexity, ChatGPT Search en Gemini in zoekresultaten verschijnen voor honderden miljoenen queries per dag. Dat heeft een nieuw vakgebied geboren — Generative Engine Optimization (GEO) — waarin merken werken aan citeerbaarheid in plaats van enkel ranking.

Wat dit betekent voor jouw bedrijf

Voor marketing en groei zijn drie consequenties belangrijk. (1) Een groeiend aandeel van het 'zoekverkeer' komt nooit meer op je site terecht — gebruikers krijgen direct een antwoord. (2) Geciteerd worden in dat antwoord is de nieuwe vorm van zichtbaarheid; dat vraagt heldere entiteiten, gestructureerde data, brand-mentions en sterke PR. (3) De technologie blijft elk kwartaal versnellen, dus een GEO-strategie is geen project van 2024 dat je 'klaar' kunt verklaren — het is een doorlopend spel van meten, bijsturen en investeren in fundamentele autoriteit. Wie dat nu inricht, bouwt een voorsprong die over twee jaar moeilijk in te halen is.

Veelgestelde vragen

Wat was het eerste large language model?+

Daar is geen harde definitie van, maar de meeste onderzoekers wijzen GPT-2 (OpenAI, 2019, 1,5 miljard parameters) aan als het eerste model dat algemeen als 'large language model' werd betiteld. De daadwerkelijke doorbraak voor het brede publiek kwam met GPT-3 in 2020 en ChatGPT in november 2022.

Wat is de rol van het 'Attention is All You Need'-paper uit 2017?+

Dit Google-paper introduceerde de transformer-architectuur — het fundament onder vrijwel elk modern LLM. Door de combinatie van self-attention en parallelle training werd het voor het eerst praktisch haalbaar om modellen met miljarden parameters op enorme tekstcorpora te trainen.

Wanneer werd ChatGPT gelanceerd?+

Op 30 november 2022 lanceerde OpenAI ChatGPT als gratis web-demo van GPT-3.5. Binnen vijf dagen had het 1 miljoen gebruikers en binnen twee maanden 100 miljoen — destijds de snelst groeiende consumenten-app ooit.

Wat is het verschil tussen GPT-3, GPT-4 en GPT-5?+

GPT-3 (2020) was de eerste echte general-purpose LLM. GPT-4 (2023) voegde multimodaliteit (beeld), betere redenering en grotere context toe. GPT-5 (2025) bracht ingebouwde redeneersporen, agentic gedrag en aanzienlijk lagere hallucinatie. Elke generatie betekende ongeveer een ordegrootte meer compute.

Welke open-source LLM's zijn er nu?+

De belangrijkste open-weight families zijn Meta's Llama (3, 3.1, 4), Mistral, Qwen (Alibaba), DeepSeek en Google's Gemma. Vooral DeepSeek R1 (januari 2025) en Llama 4 maakten high-end redeneren toegankelijk buiten de gesloten labs.

Wat betekent de opkomst van LLM's voor SEO en marketing?+

ChatGPT, Perplexity, Gemini en Claude zijn nieuwe vindkanalen geworden naast Google. Wie in die antwoorden geciteerd wil worden, moet investeren in Generative Engine Optimization (GEO): heldere entiteiten, gestructureerde data, citeerbare content en sterke brand-mentions in PR.

Verder lezen

Ready?

Klaar om gespot te worden?

Plan een gratis kennismaking van 30 minuten. We kijken mee naar je huidige vindbaarheid en vertellen eerlijk wat we zouden doen — wel of geen samenwerking.

Stuur ons een bericht