Het is datacrisis. Wie zorgt voor FAIR-data?
Als er één ding duidelijk is geworden in de deelsessies, is het dit: zeg je paraatheid, dan zeg je data. Keynote speaker Jildau Bouwman, Senior Scientist en Programmaleider digital health bij TNO, laat zien hoe we tijdens een volgende pandemie de beschikbaarheid van data kunnen waarborgen. Met andere woorden, FAIR data: ‘Findable’, ‘Accessible’, ‘Interoperable’ en ‘Reusable’. En welke rol kan AI hierin spelen?
Dagvoorzitter Milou Dijkman zegt het: we zijn behoorlijk onder de indruk van de informatiedichtheid tijdens de deelsessies vandaag. Over data gesproken: een ‘applausbarometer’ meet de waardering voor kennis, inspiratie en netwerk onder de aanwezigen, die ondanks de hoeveelheid gepresenteerde onderzoeken nog goedlachs zijn.
Back to business. Is de data die tijdens de pandemie is verzameld herbruikbaar tijdens een nieuwe pandemie in Nederland? En hoe kunnen we die data gebruiken? Is die FAIR genoeg?
FAIR
Herbruikbaar? “Zucht,” imiteert Bouwman een aanwezige in de foyer, “ik moest mijn data FAIR maken van mijn funder!” Dat de parameters van FAIR-data vermoeiend en frustrerend zijn, lijkt iedereen in de zaal wel te voelen. Een bezoeker voegt er via de Mentimeter op het achterdoek, waarmee het publiek kan participeren, aan toe: “Mijn collegae klagen dat hun data niet FAIR kan zijn, omdat het kwalitatieve data is.”
Maar voor Bouwman is FAIR een noodzakelijk gegeven om in de toekomst pandemisch paraat te kunnen zijn. “Als we data netjes, FAIR, aan mensen én aan machines leveren, dan hebben we een systeem dat we kunnen vertrouwen.” Even back to basics. Wat is FAIR?
Beschikbaarheid, deelbaarheid, herbruikbaarheid
FAIR gaat over de beschikbaarheid van data. Dat betekent niet alleen of een onderzoeker er goed bij kan, maar ook of de metadata beschikbaar is: data en informatie om de vervaardigde data mee te kunnen begrijpen en interpreteren. Daarbij gaat beschikbaarheid ook over de koppeling tussen verschillende soorten data. Sets data van sociale aard gebruiken andere terminologieën dan klinische data en data-interpretaties. “We moeten dezelfde taal leren spreken,” zegt Bouwman.
FAIR, de vier principes met vijftien onderliggende richtlijnen, is volgens Bouwman veel meer dan een frustrerend protocol. Sterker nog, we zouden samen moeten bewegen richting het FAIR maken en delen van nuttige data. Zo kunnen we ervoor zorgen dat we data die we voor, tijdens en na een volgende pandemie verzamelen ook voor daarop volgende crisissituaties bruikbaar zijn voor alle domeinen die er vruchtbaar onderzoek mee uit kunnen voeren. De vraag is: hoe kunnen we afspraken maken over verschillende soorten datasets die zich beide in dezelfde gemeenschap bevinden, bijvoorbeeld klinische en sociale data, die andere parameters voor beschikbaarheid kennen?
Cui bono
En wie zijn dat, de stakeholders van beschikbare data? In een grafiek toont Bouwman wie baat hebben bij beschikbare, FAIR data. Het onderzoek van Bouwman is pragmatisch van aard, ze voegt daad bij het woord. Wie is er verantwoordelijk voor het beschikbaar houden van data? Simpel: die verantwoordelijkheid ligt bij VWS.
De aanbeveling van Bouwman is helder. Het ministerie moet een ‘crisis’-team aanstellen dat zich specifiek richt op het beschikbaar maken van data. Niet voor het geval dat er een crisis uitbreekt, maar nú. Er moeten juridische experts en datastewards worden aangesteld, er moet actief naar relevante bronnen worden gezocht, voor, tijdens en na de pandemie. Grondslagen moeten worden georganiseerd indien nodig. Kortom: VWS moet rollen delegeren en een visie ontwikkelen, want nú is er een datacrisis. Zij kunnen de regie nemen over een infrastructuur van beschikbare data, zodat datasets van verschillende soorten en onderzoeken gekoppeld kunnen worden.
Mens, machine en privacy
Daar is ook een rol voor AI in weggelegd. Kunstmatige intelligentie kan data structureren, spraak naar data vertalen, nieuwe diagnostiek en nieuw advies leveren. Als de voorwaarden goed worden gesteld, kan AI voorkomen dat mensen unfair worden behandeld. Juist onderwezen kan een machine binnen onze ethische kaders opereren.
Met Mentimeter stelt het publiek Bouwman vragen. De eerste vraag zat er aan te komen, want data betekent privacy: “Wat is uw mening over privacy issues in relatie tot de beschikbaarheid van individuele patiëntgegevens? Kunnen we mensen dwingen om gegevens beschikbaar te maken of is er altijd een opt-out?” “Soms is het collectieve belang van data zo groot,” zegt Bouwman, “dat dit het persoonlijke belang kan overstijgen.” Bouwman draait de opt-out ook om: soms is er een groot persoonlijk belang om data juist te delen. Hoe kunnen we mensen een opt-in geven, waarbij patiënten hun eigen data actief aan kunnen bieden?
Tot slot
De uitdaging is duidelijk: als we pandemisch paraat willen zijn, moeten we nu actie ondernemen. Alleen door de verantwoordelijkheid voor data serieus te nemen en deze FAIR te maken, kunnen we ervoor zorgen dat zowel mens als machine klaar zijn voor de volgende crisis. De tijd van wachten is voorbij—de datacrisis vraagt om directe antwoorden en actie.