Onderzoekers: AI zal artsen waarschijnlijk niet vervangen Het idee dat kunstmatige intelligentie (AI) de rol van artsen volledig zou overnemen, lijkt onwaarschijnlijk. Integendeel, onderzoekers suggereren zelfs op humoristische wijze dat artsen in de toekomst wellicht virtuele patiënten kunnen verwachten tijdens hun spreekuur. De vraag of AI ooit menselijke artsen kan vervangen, houdt velen bezig. Hoewel AI zeker een belangrijke ondersteunende rol kan spelen en zelfs specifieke taken kan overnemen, zoals het analyseren van medische gegevens, herkennen van patronen voor diagnoses of aanbevelen van behandelingen, is de vervanging van artsen door AI niet aan de orde. Dit blijkt uit een onderzoek dat met een knipoog werd gepubliceerd in The BMJ. Vooruitgang in kunstmatige intelligentie De recente vooruitgang op het gebied van AI heeft geleid tot veel speculatie, zowel optimistisch als bezorgd, over de mogelijkheid dat chatbots ooit beter kunnen worden dan menselijke artsen. Grote taalmodellen (LLM’s) blijken uit diverse studies indrukwekkend goed in het uitvoeren van medische diagnostische taken. Maar onderzoekers stelden zichzelf een prikkelende vraag: in hoeverre zijn deze systemen onderhevig aan menselijke beperkingen, zoals cognitieve achteruitgang? Cognitieve vaardigheden van chatbots getest Om dit te onderzoeken, analyseerden wetenschappers de cognitieve capaciteiten van toonaangevende, openbaar beschikbare LLM’s, waaronder ChatGPT versies 4 en 4o (OpenAI), Claude 3.5 ‘Sonnet’ (Anthropic), en Gemini versies 1 en 1.5 (Alphabet). Ze maakten hierbij gebruik van de ‘Montreal Cognitive Assessment (MoCA)-test’. De MoCA-test is een standaardinstrument om cognitieve achteruitgang en vroege tekenen van dementie te signaleren. Het meet vaardigheden zoals aandacht, geheugen, taal, visuospatiële vaardigheden en uitvoerende functies. De maximale score is 30 punten, waarbij 26 of meer als normaal wordt beschouwd. De chatbots kregen dezelfde instructies als menselijke proefpersonen en werden beoordeeld volgens de officiële MoCA-richtlijnen door een praktiserend neuroloog. Resultaten: AI scoort matig De prestaties van de chatbots vielen op sommige punten tegen. ChatGPT 4o behaalde de hoogste score met 26 van de 30 punten, gevolgd door ChatGPT 4 en Claude met elk 25 punten. Gemini 1.0 scoorde beduidend lager met slechts 16 punten. Hoewel alle chatbots redelijk presteerden op gebieden als benoemen, aandacht, taal en abstractie, lieten ze te wensen over bij visuospatiële taken en uitvoerende functies. Voorbeelden hiervan zijn het verbinden van cijfers en letters in de juiste volgorde en het tekenen van een klok met een specifieke tijd. Daarnaast faalden de Gemini-modellen bij een geheugenopdracht waarbij vijf woorden moesten worden onthouden. Ook in complexere visuospatiële tests, zoals het interpreteren van visuele scènes of het tonen van empathie, bleven de prestaties achter. Alleen ChatGPT 4o slaagde in de Stroop-taak, een test die de impact van interferentie op reactietijd meet. Chatbots en cognitieve achteruitgang De resultaten suggereren dat veel toonaangevende chatbots tekenen van milde cognitieve beperkingen vertonen volgens de MoCA-test. Net zoals oudere patiënten, presteren ‘oudere’ versies van AI-modellen slechter op deze test. Samenwerking tussen artsen en AI Hoewel het onderzoek met een knipoog is uitgevoerd, werpt het licht op fundamentele verschillen tussen menselijke hersenen en AI. Vooral het onvermogen van chatbots om goed te presteren bij visuele abstractie en uitvoerende functies benadrukt een zwak punt. Dit kan hun inzet in klinische omgevingen beperken. De onderzoekers stellen daarom dat het idee dat AI binnenkort menselijke artsen zal vervangen, onrealistisch is. Het menselijke aspect van de geneeskunde – zoals empathie, morele beslissingen en complexe interpretaties – blijft cruciaal. In plaats van een vervanging lijkt een samenwerking tussen artsen en AI veel waarschijnlijker. Artsen kunnen vertrouwen op AI voor ondersteunende taken, terwijl zij zelf de cruciale menselijke aspecten van zorgverlening blijven vervullen. Een geruststellende conclusie De bevindingen bieden geruststelling: “Neurologen hoeven zich voorlopig geen zorgen te maken over vervanging door taalmodellen,” concluderen de onderzoekers. Met een knipoog voegen ze toe: “Onze resultaten suggereren zelfs dat artsen binnenkort misschien nieuwe, virtuele patiënten zullen behandelen: chatbots die tekenen van vroege dementie vertonen.” Bronmateriaal: The BMJ