Waarom generatieve AI heel overtuigend kan zijn terwijl het onjuist is

Wat zijn AI-hallucinaties?
Een van de grootste uitdagingen bij generatieve AI (GenAI) is niet dat het soms fouten maakt, maar dat die fouten vaak worden gepresenteerd op een manier die gepolijst, aannemelijk en zelfverzekerd klinkt. AI systemen worden al op grote schaal gebruikt voor het opstellen van concepten, samenvatten, vertalen, brainstormen en het ondersteunen van dagelijkse werkzaamheden, waardoor dit probleem in de praktijk steeds relevanter wordt.
Dat is wat mensen doorgaans bedoelen met hallucinaties: momenten waarop een AI-systeem een antwoord produceert dat gepolijst en aannemelijk klinkt, maar onjuist, ongefundeerd of simpelweg verzonnen is. Het Gemeenschappelijk Centrum voor Onderzoek (JRC) van de Europese Commissie heeft al gewezen op kwaliteitsproblemen in de output van generatieve AI, waaronder hallucinaties, vooroordelen en overmatig vertrouwen, en heeft de noodzaak van waarborgen en menselijk toezicht benadrukt.
Waarom hallucineren generatieve AI-systemen?
Generatieve AI is ontworpen om nieuwe tekst, afbeeldingen, code, audio of video te creëren die lijkt op de data waarop het is getraind. In technische termen leren deze modellen patronen en waarschijnlijkheidsverdelingen in gegevens en genereren ze daar vervolgens nieuwe voorbeelden uit. Dat maakt ze zo nuttig en veelzijdig. Het is ook de reden waarom ze vloeiende output kunnen produceren zonder enige ingebouwde garantie dat een specifieke bewering correct is.
Dus wanneer een model een verkeerd antwoord geeft, is het meestal niet aan het “verzinnen” in de menselijke zin van het woord. Het doet waarvoor het is gebouwd: de output genereren die het beste past bij de patronen die het heeft geleerd uit eerdere gegevens. Als de vraag dubbelzinnig is, de context mager is, of het model geen toegang heeft tot de juiste bronnen, vult het de leemte misschien op met iets dat klinkt alsof het juist is, in plaats van iets dat daadwerkelijk juist is. Zo bekeken lijkt een hallucinatie minder op opzettelijke misleiding en meer op een statistische voorspelling zonder verificatie.
Waarom vormen hallucinaties een risico?
Omdat welbespraaktheid vals vertrouwen wekt. Een zwak antwoord geschreven in gebrekkige taal is gemakkelijk te duiden. Een verkeerd antwoord geschreven in een rustige, gezaghebbende toon is veel moeilijker te herkennen. Daarom is het fenomeen hallucinaties geen onbeduidend technisch mankement; het vormt een serieus risico op het gebied van betrouwbaarheid en beheer. De EU-AI-wet weerspiegelt precies die zorg door de nadruk te leggen op nauwkeurigheid, robuustheid, transparantie en menselijk toezicht voor risicovollere toepassingen van AI.
In gereguleerde, op bewijs gebaseerde omgevingen is “grotendeels juist” simpelweg onvoldoende.
Praktijkvoorbeelden van AI-fouten
Er zijn al voorbeelden hiervan in serieuze professionele omgevingen. In 2025 gaf Deloitte Australië toe dat een in opdracht van de overheid uitgevoerd landelijk controleonderzoek naar het Targeted Compliance Framework verzonnen verwijzingen en citaten bevatte die waren gegenereerd met Azure OpenAI GPT-4o, en stemde het ermee in een gedeeltelijke terugbetaling te doen. Het probleem was niet dat het rapport er onprofessioneel uitzag. Het was dat een deel van het bewijsmateriaal erachter verzonnen was. Dat is precies wat hallucinaties zo lastig maakt: de fout kan verborgen zitten in werk dat er verder geloofwaardig uitziet. In dit geval werden de problemen opgemerkt door een menselijke beoordelaar, de Australische welzijnswetenschapper Chris Rudge.
In de gezondheidszorg en bij farmaceutisch werk staat er nog meer op het spel. Een studie gepubliceerd in BMJ Quality & Safety, een door vakgenoten beoordeeld tijdschrift gericht op de kwaliteit van de gezondheidszorg en patiëntveiligheid, onderzocht door AI aangestuurde chatbot-antwoorden op vragen van patiënten over veel voorgeschreven medicijnen. Hoewel veel antwoorden in grote lijnen juist waren, beoordeelden deskundigen 66% van een subgroep van onjuiste antwoorden als potentieel schadelijk, en 22% als potentieel ernstig of zelfs levensbedreigend indien opgevolgd. In gereguleerde, op bewijs gebaseerde omgevingen is “grotendeels juist” simpelweg onvoldoende.
Daarom is dit van belang voor sectoren als de farmacie, gezondheidszorg en R&D. Als een AI-tool een verzonnen referentie genereert, feiten verkeerd weergeeft of een zelfverzekerde maar onjuiste interpretatie geeft, gaat het niet alleen om slechte formulering. Het wordt een probleem van wetenschappelijke geloofwaardigheid, een risico op naleving en mogelijk een veiligheidsrisico voor patiënten. Meer in het algemeen heeft het JRC al gewaarschuwd dat generatieve AI sectoroverschrijdende risico's met zich meebrengt op het gebied van desinformatie, vertrouwen en de kwaliteit van de besluitvorming wanneer mensen er te snel op vertrouwen.
Moeten we stoppen met het gebruik van generatieve AI?
Het goede nieuws is dat dit geen reden is om te stoppen met het gebruik van generatieve AI. Het is wel een reden om er bewuster mee om te gaan. Waar feiten ertoe doen, moeten de resultaten gebaseerd zijn op betrouwbaar bronmateriaal in plaats van alleen gebaseerd op het geheugen van het model. Net zo belangrijk is dat organisaties mensen verantwoordelijk houden voor het eindresultaat. De meest nuttige vraag is vaak de eenvoudigste: wat is de bron hiervan? Als die vraag niet duidelijk beantwoord kan worden, mag het resultaat niet als bewijs worden beschouwd. Dat geldt met name voor communicatie met klanten, juridische zaken, wetenschappelijke teksten, regelgevingsdocumenten en besluitvormingsondersteuning.
Toch blijft dit een buitengewoon hulpmiddel. Generatieve AI heeft een aanzienlijk potentieel om innovatie en productiviteit in alle sectoren te verbeteren. Maar het is nuttig om de output ervan met een kritische blik te bekijken en het een beetje te behandelen als je overmoedige collega: vaak behulpzaam, vaak indrukwekkend snel, soms briljant, maar niet iemand die je klakkeloos zou citeren zonder eerst de bron te controleren.
Hoe GenAI verantwoord te gebruiken
Daarom moeten we de juiste balans vinden. Generatieve AI is krachtig en nuttig, maar als we het verantwoord willen gebruiken, moeten we eerlijk zijn over één ding: het kan heel overtuigend overkomen, terwijl het feitelijk niet klopt.
PS. Ik zou de bron nog eens controleren als ik jou was J *Andrikyan W, Sametinger SM, Kosfeld F, et al Door kunstmatige intelligentie aangestuurde chatbots in zoekmachines: een transversaal onderzoek naar de kwaliteit en risico's van geneesmiddeleninformatie voor patiënten BMJ Quality & Safety 2025; 34:100-109
Tekst bewerkt met behulp van M365 Copilot GTP 5.4