GPT-5.4 scoort hoger dan mensen op computergebruik: wat betekent dat voor jouw bedrijf?

NextEnabler AI - Abstract AI neural network visualization

75 procent. Dat is de score die OpenAI’s gloednieuwe GPT-5.4 haalt op de OSWorld-benchmark, een test die meet hoe goed een AI-model zelfstandig een computer kan bedienen. Klikken, typen, formulieren invullen, schakelen tussen applicaties. De menselijke score op diezelfde test? 72,4 procent.

Lees dat nog eens. Een AI-model dat beter is dan mensen in het bedienen van software. Niet in theorie, niet in een labopstelling, maar gemeten op echte desktoptaken.

Wat kan GPT-5.4 precies?

OpenAI presenteerde GPT-5.4 op 5 maart 2026 als zijn krachtigste model tot nu toe. De grote doorbraak zit niet in nóg slimmere antwoorden op vragen, maar in wat OpenAI “autonomous multi-step workflows” noemt. Het model kan zelfstandig door softwareomgevingen navigeren, meerdere stappen achter elkaar uitvoeren en taken afmaken zonder dat iemand tussendoor instructies hoeft te geven.

Denk aan het automatisch verwerken van facturen in je boekhoudsoftware, het bijwerken van klantgegevens in je CRM of het samenstellen van rapportages uit verschillende bronnen. Taken die nu nog uren kosten aan klik-en-kopieerwerk.

Waarom dit ertoe doet voor jouw bedrijf

De vorige generatie, GPT-5.2, scoorde 47,3 procent op dezelfde benchmark. In een paar maanden tijd is de score dus bijna verdubbeld. Dat tempo is belangrijk, want het betekent dat de drempel om AI in te zetten voor dagelijkse werkzaamheden razendsnel daalt.

Voor Nederlandse ondernemers en managers is dit concreet relevant. Niet elke organisatie heeft een IT-afdeling die maatwerk-integraties kan bouwen. Maar een AI-model dat gewoon je bestaande software kan bedienen zoals een medewerker dat zou doen? Dat is een heel ander verhaal. Geen API-koppelingen nodig, geen dure implementatietrajecten.

Daarnaast meldt OpenAI dat GPT-5.4 47 procent minder tokens verbruikt bij taken die veel tool-gebruik vereisen. Vertaald naar de praktijk: lagere kosten per geautomatiseerde taak.

De bredere context

GPT-5.4 staat niet op zichzelf. Google lanceerde Gemini 3.1 Flash-Lite, een model dat 2,5 keer sneller reageert en slechts $0,25 per miljoen tokens kost. Anthropic bracht Claude Opus 4.6 uit met een context window van een miljoen tokens. De concurrentie tussen de grote AI-labs is moordend, en de winnaar is de gebruiker: betere modellen, lagere prijzen, meer mogelijkheden.

Gartner voorspelt dat 40 procent van alle enterprise-applicaties eind 2026 ingebouwde AI-agents zal hebben. Begin 2025 was dat nog geen 5 procent. De verschuiving van “AI als chatbot” naar “AI als digitale collega” is in volle gang.

Wat nu?

De vraag is niet meer of AI jouw werk gaat veranderen, maar hoe snel je ermee aan de slag gaat. Bedrijven die nu experimenteren met AI-agents voor hun dagelijkse processen, bouwen een voorsprong op die straks lastig in te halen is.

Benieuwd wat AI concreet voor jouw organisatie kan betekenen? Bij NextEnabler helpen we bedrijven om AI praktisch in te zetten, van eerste verkenning tot implementatie. Neem gerust contact op voor een vrijblijvend gesprek.