Het medicijn dat u vanochtend innam, heeft een lange weg afgelegd om van het lab naar uw pillendoosje te komen. Eerst is er uitgebreid laboratoriumonderzoek. Dan dierproeven. Maar voordat een medicijn kan worden goedgekeurd voor gebruik, moet het worden getest op mensen - in een duur, complex proces dat bekend staat als een klinische studie.
De basis
In zijn eenvoudigste vorm gaat een klinisch onderzoek als volgt: Onderzoekers werven patiënten die de ziekte hebben waar het experimentele geneesmiddel voor bedoeld is. Vrijwilligers worden willekeurig verdeeld in twee groepen. De ene groep krijgt het experimentele geneesmiddel; de andere, de controlegroep, krijgt een placebo (een behandeling die identiek lijkt aan het geteste geneesmiddel, maar geen effect heeft). Als de patiënten die het actieve geneesmiddel krijgen meer verbetering vertonen dan degenen die het placebo krijgen, is dat het bewijs dat het geneesmiddel werkt.
Een van de grootste uitdagingen bij het opzetten van een onderzoek is het vinden van voldoende vrijwilligers die precies voldoen aan de criteria voor het onderzoek. Artsen weten misschien niet welke onderzoeken geschikt zijn voor hun patiënten, en patiënten die bereid zijn zich aan te melden hebben misschien niet de kenmerken die nodig zijn voor een bepaald onderzoek. Maar kunstmatige intelligentie kan dat werk een stuk gemakkelijker maken.
Ontmoet uw tweeling
Digitale tweelingen zijn computermodellen die echte objecten of systemen simuleren. Ze gedragen zich statistisch vrijwel hetzelfde als hun fysieke tegenhangers. NASA gebruikte een digitale tweeling van het Apollo 13-ruimteschip om reparaties uit te voeren nadat een zuurstoftank was ontploft, waardoor ingenieurs op aarde op 200.000 mijl afstand reparaties moesten uitvoeren.
Met voldoende gegevens kunnen wetenschappers een digitale tweeling van mensen maken met behulp van machine learning, een vorm van kunstmatige intelligentie waarbij de programma's leren van grote hoeveelheden gegevens in plaats van specifiek geprogrammeerd te zijn voor de betreffende taak. Digitale tweelingen van patiënten in klinische proeven worden gecreëerd door modellen voor machinaal leren te trainen op patiëntgegevens uit eerdere klinische proeven en uit individuele patiëntendossiers. Het model voorspelt hoe de gezondheid van de patiënt zich in de loop van het onderzoek zou ontwikkelen als hij een placebo zou krijgen, waardoor in wezen een gesimuleerde controlegroep voor een bepaalde patiënt ontstaat.
Dus dit is hoe het zou werken: Een persoon, laten we haar Sally noemen, wordt toegewezen aan de groep die het actieve geneesmiddel krijgt. Sally's digitale tweelingbroer (het computermodel) zit in de controlegroep. Het voorspelt wat er zou gebeuren als Sally de behandeling niet zou krijgen. Het verschil tussen Sally's reactie op het geneesmiddel en de voorspelling van het model van Sally's reactie als zij in plaats daarvan een placebo zou krijgen, is een schatting van de effectiviteit van de behandeling voor Sally.
Ook voor de patiënten in de controlegroep wordt een digitale tweeling gecreëerd. Door de voorspellingen van wat er zou gebeuren met de digitale tweeling die de placebo krijgt te vergelijken met de mensen die de placebo daadwerkelijk kregen, kunnen onderzoekers eventuele problemen in het model opsporen en het nauwkeuriger maken.
Het vervangen of uitbreiden van controlegroepen met digitale tweelingen kan zowel de patiënt-vrijwilligers als de onderzoekers helpen. De meeste mensen die aan een proef meedoen, hopen een nieuw geneesmiddel te krijgen dat hen zou kunnen helpen wanneer reeds goedgekeurde geneesmiddelen hebben gefaald. Maar er is een 50/50 kans dat ze in de controlegroep terechtkomen en de experimentele behandeling niet krijgen. Het vervangen van controlegroepen door digitale tweelingen kan betekenen dat meer mensen toegang krijgen tot experimentele medicijnen.
Het onverwachte
De technologie kan veelbelovend zijn, maar wordt nog niet op grote schaal gebruikt - misschien met een goede reden. Daniel Neill, PhD, is een expert in machine learning, inclusief de toepassingen ervan in de gezondheidszorg, aan de New York University. Hij wijst erop dat modellen voor machinaal leren afhankelijk zijn van veel gegevens, en het kan moeilijk zijn om gegevens van hoge kwaliteit over individuen te verkrijgen. Informatie over zaken als voeding en lichaamsbeweging wordt vaak zelf gerapporteerd, en mensen zijn niet altijd eerlijk. Ze overschatten de hoeveelheid lichaamsbeweging die ze krijgen en onderschatten de hoeveelheid junkfood die ze eten, zegt hij.
Rekening houden met zeldzame bijwerkingen kan ook een probleem zijn, voegt hij eraan toe. "Waarschijnlijk zijn dat dingen waar je geen model voor hebt in je controlegroep." Iemand kan bijvoorbeeld een onverwachte negatieve reactie hebben op een medicijn.
Maar de grootste zorg van Neill is dat het voorspellende model weergeeft wat hij "business as usual" noemt. Stel dat een grote onverwachte gebeurtenis - iets als de COVID-19 pandemie, bijvoorbeeld - ieders gedragspatroon verandert en mensen ziek worden. "Dat is iets waar deze controlemodellen geen rekening mee houden," zegt hij. Die onverwachte gebeurtenissen, waarmee in de controlegroep geen rekening wordt gehouden, kunnen de uitkomst van de proef beïnvloeden.
Eric Topol, oprichter en directeur van het Scripps Research Translational Institute en een expert in het gebruik van digitale technologieën in de gezondheidszorg, vindt het idee geweldig, maar nog niet klaar voor prime time. "Ik denk niet dat klinische proeven op korte termijn zullen veranderen, want dit vereist meerdere lagen van gegevens buiten de gezondheidsdossiers, zoals een genoomsequentie, darmmicrobioom, milieugegevens, en ga zo maar door." Hij voorspelt dat het jaren zal duren voordat grootschalige proeven met behulp van AI kunnen worden gedaan, met name voor meer dan één ziekte. (Topol is ook hoofdredacteur van Medscape, de zusterwebsite van Arts).
Het verzamelen van voldoende kwaliteitsgegevens is een uitdaging, zegt Charles Fisher, PhD, oprichter en CEO van Unlearn.AI, een start-up die pioniert met digitale tweelingen voor klinische proeven. Maar, zegt hij, het aanpakken van dat soort problemen maakt deel uit van de langetermijndoelen van het bedrijf.
Met twee van de meest genoemde zorgen over modellen voor machinaal leren - privacy en bias - is al rekening gehouden, zegt Fisher. "Privacy is gemakkelijk. Wij werken alleen met gegevens die al geanonimiseerd zijn."
Als het gaat om bias, is het probleem niet opgelost, maar het is irrelevant - althans voor de uitkomst van de proef, volgens Fisher. Een goed gedocumenteerd probleem met hulpmiddelen voor machinaal leren is dat ze kunnen worden getraind op bevooroordeelde gegevenssets - bijvoorbeeld die waarin een bepaalde groep is ondervertegenwoordigd. Maar, zegt Fisher, omdat de proeven gerandomiseerd zijn, zijn de resultaten ongevoelig voor vertekeningen in de gegevens. De proef meet hoe het geteste geneesmiddel de mensen in de proef beïnvloedt op basis van een vergelijking met de controles, en past het model aan om beter overeen te komen met de echte controles. Dus, volgens Fisher, zelfs als de keuze van de proefpersonen bevooroordeeld is, en de oorspronkelijke dataset bevooroordeeld is, "zijn wij in staat proeven zo te ontwerpen dat zij ongevoelig zijn voor die bevooroordeeldheid."
Neill vindt dit niet overtuigend. Je kunt vooroordelen in een gerandomiseerd onderzoek in enge zin wegnemen, door je model aan te passen om het behandelingseffect voor de studiepopulatie correct in te schatten, maar je zult die vooroordelen weer invoeren wanneer je probeert te generaliseren buiten het onderzoek. Unlearn.AI "vergelijkt geen behandelde personen met controles", zegt Neill. "Het vergelijkt behandelde individuen met modelgebaseerde schattingen van wat de uitkomst van het individu zou zijn geweest als ze in de controlegroep zaten. Eventuele fouten in die modellen of gebeurtenissen die ze niet voorzien kunnen leiden tot systematische vertekeningen - dat wil zeggen, over- of onderschattingen van het behandelingseffect."
Maar unlearn.AI gaat door. Het werkt al samen met geneesmiddelenbedrijven om proeven te ontwerpen voor neurologische ziekten, zoals Alzheimer, Parkinson en multiple sclerose. Er zijn meer gegevens over deze ziekten dan over vele andere, dus waren ze een goede plek om te beginnen. Fisher zegt dat de aanpak uiteindelijk op elke ziekte kan worden toegepast, waardoor de tijd die nodig is om nieuwe geneesmiddelen op de markt te brengen aanzienlijk wordt verkort.
Als deze technologie nuttig blijkt, kunnen zowel patiënten als onderzoekers van deze onzichtbare broers en zussen profiteren.