Big Data: ‘Help, de dokter verzuipt!’

Sociale Data en Gezondheidszorg

Sociale Data en Gezondheidszorg

Erik Hekman werkt voor UCREATE, een samenwerkingsverband voor de creatieve industrie. UCREATE is een initiatief van de Hogeschool Utrecht, de Hogeschool voor de Kunsten in Utrecht en het UMC Utrecht.
 

Steeds meer data
‘Wanneer je één mens zou reduceren tot een binaire code, dan bestaan we per persoon op dit moment uit ongeveer 150 triljard bytes, ofwel 150 zetabytes’, zo houdt Hekman ons voor. ‘Maar wat kunnen we daarmee. En wat dóen we er al mee?’

De mogelijkheden van Big Data zijn sinds John Snow (Labs), en zeker sinds de opkomst van de Informatie Technologie enorm toegenomen, benadrukt Hekman. ‘Waar een grote harde schijf met een capaciteit van 100 Mb nog maar enkele tientallen jaren terug duizenden euro’s kostte, heb je nu voor een paar cent al één gigabyte aan opslag; en dat op sleutelhangerformaat. Via onze smartphone zijn we bovendien vrijwel continu verbonden aan een bijna oneindige cloud vol data.’

Niet alleen de kwantiteit van de IT neemt razendsnel toe, ook de kwaliteit. Volgens een oude ‘wet’ van chipfabrikant Gordon Moore (1965) verdubbelt de capaciteit van een computer iedere twee jaar, terwijl de kosten voor die computer in dezelfde tijd halveren. Mede door die exponentiële toename van de reken- en opslagcapaciteit wordt 90% van alle beschikbare data steeds in de afgelopen twee jaar gecreëerd. Op dit moment worden dagelijks naar schatting 2,5 triljoen bytes aan data gecreëerd.’
 
Bron van innovatie
Het is heel makkelijk om in de snelgroeiende stroom van informatie te verdrinken. ‘Toch zijn Big Data vooral een enorme stimulans gebleken voor technologische innovatie’, zegt Hekman. ‘Dat gaat van een slimme thermostaat in ons huis, waarmee we onze eigen verbruiksgegevens van gas en elektriciteit kunnen vergelijken met die van de buren of om het even wie, tot een knuffelbaar robotje dat al daadwerkelijk wordt ingezet in de zorg voor dementerenden. Er zijn bijvoorbeeld ook al apps op de markt, die je helpen om op een optimaal moment wakker te worden’, vertelt Hekman. ‘Als je die app op je smartphone installeert, en je legt hem onder je kussen, dan detecteert het apparaat wanneer je, vlak voor het moment dat je echt op moet staan, in een lichte slaap bent. Daarmee voorkom je dat je op het moment suprême uit een heel diepe slaap gewekt zou moeten worden, wat je prestaties voor die ochtend niet ten goede komt.’
 
Van individu naar gemeenschap
Naast de onvoorstelbare hoeveelheid data die over een individu te verzamelen zijn, worden er vooral ook data geanalyseerd op het niveau van grote groepen mensen. Berichten op de sociale media kunnen vertellen wat er binnen specifieke groepen speelt. Zo kan het voor beleidsmakers of zorgverleners zeer interessant zijn om te volgen wat er speelt onder de mensen die met, zeg, de hashtag ‘diabetes’ twitteren. Hekman: ‘Met het Nederlands Instituut voor Onderzoek van de Gezondheidszorg, NIVEL, verkennen wij bijvoorbeeld nu de mogelijkheden om zorgverlening te verbeteren op basis van de gegevens die uit de sociale media te analyseren zijn.’
 
Health Map ziet uitbraak vóór de autoriteiten
Wat de analyse van data uit de sociale media kan opleveren, bleek rond de uitbraak van Ebola, die West-Afrika in 2014 in zijn greep hield. ‘Uit een analyse op Healthmap van alle berichten op de sociale media was het al duidelijk dat hier een uitbraak aan de gang was vóórdat de autoriteiten dit bekend maakten’, aldus Hekman. 

Vergelijkbare analyses worden gedaan door apps als ‘germ tracker’. ‘Daar zitten nog wel wat haken en ogen aan’, erkent Hekman. ‘Een tweet met de tekst “ik voel me ziek”, kan door germtracker goed geplaatst worden. Maar wat doet zo’n programma met de straattaal van tieners, wanneer die spreken over een “ziek feestje”? Toch wordt de analyse van taal ook met de dag beter, en kunnen ook dit soort berichten waardevolle kennis ontsluiten.’

Het taalgebruik op sociale media lijkt zelfs enige voorspellende waarde te bezitten voor het optreden van een postnatale depressie, stelt Hekman. ‘Wanneer het taalgebruik van – een bescheiden groep - net bevallen moeders werd geanalyseerd was daar een correlatie van 80% tussen het optreden van een postnatale depressie en “somber” taalgebruik in de dagen die daaraan vooraf gingen.’
 
Potentie
Een voorspelbaarheid van 5 tot hooguit 15% dat iemand mogelijk kanker zal hebben, op basis van de zoektermen die hij of zij gebruikt op het internet, en op basis van de berichten op sociale media, is natuurlijk bij langen na niet voldoende om actie op te ondernemen. ‘Toch laten dit soort analyses wel zien wat de potentie is van de analyse van de externe big data die we met z’n allen genereren’, zegt Hekman. 
‘Die analyse van externe data zou je kunnen zien als een soort petri-schaaltje, waarin je de eigen, interne data uit de zorg verrijkt. De uitdaging is om díe data te vinden die ook daadwerkelijk wat toevoegen aan de zorg.’  

1. Predicting Depression via Social Media. De Choudhurry et al., Proceedings of the Seventh International AAAI Conference on Weblogs and Social Media 2016

2. Psychological Language on Twitter Predicts County-Level Heart Disease Mortality
Johannes C. Eichstaedt, Psychological Science, DOI: 10.1177/0956797614557867

NFU Nederlandse Federatie van Universitair Medische Centra / Oudlaan 4, 3515 GA / Postbus 9696, 3506 GR Utrecht / T 030 273 98 80 / nfu@nfu.nl