Waarom generatieve AI heel overtuigend kan zijn terwijl het onjuist is

We maken ons vaak zorgen over foutieve informatie uit AI. Een groter gevaar is echter dat de informatie fout is, maar klinkt alsof het klopt. In dit artikel bespreekt Marta Dobrowolska, hoofd Data Science en Kennisbeheer bij Incotec, dit fenomeen.

Marta Dobrowolska-Haywood, hoofd Data Science en Kennisbeheer

Wat zijn AI-hallucinaties?

Een van de grootste uitdagingen bij generatieve AI (GenAI) is niet dat het soms fouten maakt, maar dat die fouten vaak worden gepresenteerd op een manier die gepolijst, aannemelijk en zelfverzekerd klinkt. AI systemen worden al op grote schaal gebruikt voor het opstellen van concepten, samenvatten, vertalen, brainstormen en het ondersteunen van dagelijkse werkzaamheden, waardoor dit probleem in de praktijk steeds relevanter wordt.

Dat is wat mensen doorgaans bedoelen met hallucinaties: momenten waarop een AI-systeem een antwoord produceert dat gepolijst en aannemelijk klinkt, maar onjuist, ongefundeerd of simpelweg verzonnen is. Het Gemeenschappelijk Centrum voor Onderzoek (JRC) van de Europese Commissie heeft al gewezen op kwaliteitsproblemen in de output van generatieve AI, waaronder hallucinaties, vooroordelen en overmatig vertrouwen, en heeft de noodzaak van waarborgen en menselijk toezicht benadrukt.

Waarom hallucineren generatieve AI-systemen?

Generatieve AI is ontworpen om nieuwe tekst, afbeeldingen, code, audio of video te creëren die lijkt op de data waarop het is getraind. In technische termen leren deze modellen patronen en waarschijnlijkheidsverdelingen in gegevens en genereren ze daar vervolgens nieuwe voorbeelden uit. Dat maakt ze zo nuttig en veelzijdig. Het is ook de reden waarom ze vloeiende output kunnen produceren zonder enige ingebouwde garantie dat een specifieke bewering correct is.

Dus wanneer een model een verkeerd antwoord geeft, is het meestal niet aan het “verzinnen” in de menselijke zin van het woord. Het doet waarvoor het is gebouwd: de output genereren die het beste past bij de patronen die het heeft geleerd uit eerdere gegevens. Als de vraag dubbelzinnig is, de context mager is, of het model geen toegang heeft tot de juiste bronnen, vult het de leemte misschien op met iets dat klinkt alsof het juist is, in plaats van iets dat daadwerkelijk juist is. Zo bekeken lijkt een hallucinatie minder op opzettelijke misleiding en meer op een statistische voorspelling zonder verificatie.

Waarom vormen hallucinaties een risico?

Omdat welbespraaktheid vals vertrouwen wekt. Een zwak antwoord geschreven in gebrekkige taal is gemakkelijk te duiden. Een verkeerd antwoord geschreven in een rustige, gezaghebbende toon is veel moeilijker te herkennen. Daarom is het fenomeen hallucinaties geen onbeduidend technisch mankement; het vormt een serieus risico op het gebied van betrouwbaarheid en beheer. De EU-AI-wet weerspiegelt precies die zorg door de nadruk te leggen op nauwkeurigheid, robuustheid, transparantie en menselijk toezicht voor risicovollere toepassingen van AI.

In gereguleerde, op bewijs gebaseerde omgevingen is “grotendeels juist” simpelweg onvoldoende.

Praktijkvoorbeelden van AI-fouten

Er zijn al voorbeelden hiervan in serieuze professionele omgevingen. In 2025 gaf Deloitte Australië toe dat een in opdracht van de overheid uitgevoerd landelijk controleonderzoek naar het Targeted Compliance Framework verzonnen verwijzingen en citaten bevatte die waren gegenereerd met Azure OpenAI GPT-4o, en stemde het ermee in een gedeeltelijke terugbetaling te doen. Het probleem was niet dat het rapport er onprofessioneel uitzag. Het was dat een deel van het bewijsmateriaal erachter verzonnen was. Dat is precies wat hallucinaties zo lastig maakt: de fout kan verborgen zitten in werk dat er verder geloofwaardig uitziet. In dit geval werden de problemen opgemerkt door een menselijke beoordelaar, de Australische welzijnswetenschapper Chris Rudge.

In de gezondheidszorg en bij farmaceutisch werk staat er nog meer op het spel. Een studie gepubliceerd in BMJ Quality & Safety, een door vakgenoten beoordeeld tijdschrift gericht op de kwaliteit van de gezondheidszorg en patiëntveiligheid, onderzocht door AI aangestuurde chatbot-antwoorden op vragen van patiënten over veel voorgeschreven medicijnen. Hoewel veel antwoorden in grote lijnen juist waren, beoordeelden deskundigen 66% van een subgroep van onjuiste antwoorden als potentieel schadelijk, en 22% als potentieel ernstig of zelfs levensbedreigend indien opgevolgd. In gereguleerde, op bewijs gebaseerde omgevingen is “grotendeels juist” simpelweg onvoldoende.

Daarom is dit van belang voor sectoren als de farmacie, gezondheidszorg en R&D. Als een AI-tool een verzonnen referentie genereert, feiten verkeerd weergeeft of een zelfverzekerde maar onjuiste interpretatie geeft, gaat het niet alleen om slechte formulering. Het wordt een probleem van wetenschappelijke geloofwaardigheid, een risico op naleving en mogelijk een veiligheidsrisico voor patiënten. Meer in het algemeen heeft het JRC al gewaarschuwd dat generatieve AI sectoroverschrijdende risico's met zich meebrengt op het gebied van desinformatie, vertrouwen en de kwaliteit van de besluitvorming wanneer mensen er te snel op vertrouwen.

Moeten we stoppen met het gebruik van generatieve AI?

Het goede nieuws is dat dit geen reden is om te stoppen met het gebruik van generatieve AI. Het is wel een reden om er bewuster mee om te gaan. Waar feiten ertoe doen, moeten de resultaten gebaseerd zijn op betrouwbaar bronmateriaal in plaats van alleen gebaseerd op het geheugen van het model. Net zo belangrijk is dat organisaties mensen verantwoordelijk houden voor het eindresultaat. De meest nuttige vraag is vaak de eenvoudigste: wat is de bron hiervan? Als die vraag niet duidelijk beantwoord kan worden, mag het resultaat niet als bewijs worden beschouwd. Dat geldt met name voor communicatie met klanten, juridische zaken, wetenschappelijke teksten, regelgevingsdocumenten en besluitvormingsondersteuning.

Toch blijft dit een buitengewoon hulpmiddel. Generatieve AI heeft een aanzienlijk potentieel om innovatie en productiviteit in alle sectoren te verbeteren. Maar het is nuttig om de output ervan met een kritische blik te bekijken en het een beetje te behandelen als je overmoedige collega: vaak behulpzaam, vaak indrukwekkend snel, soms briljant, maar niet iemand die je klakkeloos zou citeren zonder eerst de bron te controleren.

Hoe GenAI verantwoord te gebruiken

Daarom moeten we de juiste balans vinden. Generatieve AI is krachtig en nuttig, maar als we het verantwoord willen gebruiken, moeten we eerlijk zijn over één ding: het kan heel overtuigend overkomen, terwijl het feitelijk niet klopt.

PS. Ik zou de bron nog eens controleren als ik jou was J *Andrikyan W, Sametinger SM, Kosfeld F, et al Door kunstmatige intelligentie aangestuurde chatbots in zoekmachines: een transversaal onderzoek naar de kwaliteit en risico's van geneesmiddeleninformatie voor patiënten BMJ Quality & Safety 2025; 34:100-109

Tekst bewerkt met behulp van M365 Copilot GTP 5.4

Gepubliceerd door

Marta Dobrowolska-Haywood Research and Development Manager

Terug naar

Incotec Nieuws en Opinie

Name	Typical content	Expires
cookieConsent	Used to check if your device accepts cookies and used to remember users cookie consent.	1 year
SC_ANALYTICS_GLOBAL_COOKIE	This analytics cookie is provided by Sitecore. It tracks a visitor’s multiple visits to our Website in one year. We use this information to help improve our Website. This cookie is not used to identify individuals using the Website.	10 Years
.AspNet.Cookies	This cookie is used to identify and authenticate logged-in users. It maintains secure sessions by storing an encrypted authentication token.	30 days
ASP.NET_SessionId	This cookie is used by ASP.NET to maintain an anonymous user session by assigning a unique session ID. It enables the website to store temporary information between pages, such as login status or form input.	End of session
_sample_basket	Used to store sample items added to basket by user. Contents are serialised.	30 days
sitename#lang	This cookie is provided by Sitecore. This cookie tracks a user's language selection. The name of the cookie varies based on the configured site name	End of Session
__RequestVerificationToken	An anti forgery token used to help prevent CSRF attacks.	End of Session
_form_goals	Used to check if you have previously complete a form.	2 years
lastShownMarketingConsentDate_{identifier}	Use to determine when we requested you review your marketing consent for your account. It helps ensure we limit prompting to review your marketing consent, improving user experience.	1 year
productFinderLastSearch	Used within our product finder to determine the last search performed.	1 year
shell#lang	This cookie is provided by Sitecore. This cookie tracks a user's language selection. The name of the cookie varies based on the configured site name	End of Session
mailinglistsignupbanner_{identifier}	Use to determine when whether a mailing list sign up form has been already shown within a time period. It helps ensure that users are not repeatedly prompting or shown sign up forms, improving user experience. We may create multiple cookies with different identifiers.	< 120 days
resourcesAreaLastSearch	Used within our literature finder to determine the last search performed.	1 year
isProactiveInvite	This cookie is set by the SnapEngage live chat widget to track whether a proactive chat invitation (a pop-up asking if you need help) has already been shown during your visit. It helps ensure that users are not repeatedly prompted with the same chat invite, improving user experience.	End of session
SnapABugAgentAvatar	This cookie stores the agent image URL in order to show the agent avatar on the minimize state of the chat.	16 mins
SnapABugHistory	Keeps track of the visitor visits and last chats to present history to agent	1 year
SnapABugNoProactiveChat		6-12 months
SnapABugRef	This tracks the origin and site entry	120 mins
SnapABugUserAlias	This cookie stores the visitor alias (name). This cookie is used to support subsequent chats so that once it is known, the chat agent doesn’t need to collect the information again.	1 year
SnapABugVisit	This cookie is used to keep track of the visitor visits	End of session

Name	Typical content	Expires
recentlyViewedItems	Contains a list of recently visited items including products or formulations.	30 days
lidc	Used by LinkedIn for routing.	24 hours
li_gc	Used by LinkedIn to store consent of guests regarding the use of cookies for non-essential purposes.	6 months

Name	Typical content	Expires
_gat	Used by Google Analytics to throttle request rate.	10 minutes
_ga	Contains a unique identifier used by Google Analytics to determine unique visitors to our website.	2 years
_clsk	Used by Microsoft Clarity to connect multiple page views by a user into a single Clarity session recording.	1 day
_clck	Persists the Microsoft Clarity User ID and preferences, unique to that site is attributed to the same user ID.	1 year

Name	Typical content	Expires
ANONCHK	Used by Microsoft Clarity and Microsoft Ads to store session ID for a users session to ensure that clicks are verified for reporting purposes and for personalisation.	10 mins
MUID	Identifies unique web browsers used by Microsoft. These cookies are used for advertising, site analytics, and other operational purposes.	1 year
SM	Used by Microsoft to synchronise the unique identifier across Microsoft domains for consistent user recognition and ad targeting.	End of session
MR	Used by Microsoft to support ad delivery and performance tracking.	7 days
SRM_B	Set by Microsoft Bing Ads and is used for advertising purposes. It helps deliver targeted ads and measure the effectiveness of ad campaigns across websites.	1 year
CLID	Used by Microsoft Clarity to identify the first time a user visited any site using Clarity. Helps track user behaviour and engagement across sessions for analytics purposes.	1 year