“JASP past heel goed in het open science tijdperk”
Wat betekent Research Data Management in de dagelijkse praktijk? In deze serie interviews van RDM Support delen onderzoekers hun ervaringen over verschillende aspecten van research data management. In dit interview vertelt Herbert Hoijtink wat hij geleerd heeft tijdens de workshop Handling Personal Data en waarom hij zo'n fan is van JASP.
Toen Hoijtink, hoogleraar Bayesiaanse statistiek bij de faculteit Sociale Wetenschappen, bezig was met de voorbereidingen van een tweetal kennisclips over open data analyse met JASP, hoorde hij woorden als ‘anoniem’ en ‘gescoopt’. “Ik dacht: Ik weet hier niet genoeg van, ik moet me echt bij laten scholen.” Daarom volgde hij de workshop Handling Personal Data van RDM Support. “In de kennisclips verwijs ik naar deze cursus. Absoluut een aanrader.”
“Ik ben erg geporteerd van , een open statistiekprogramma. Dat is nagenoeg een volwaardige vervanger van SPSS, alleen JASP is open, gratis. En het werkt prachtig!” Terwijl Hoijtink enthousiast vertelt, blaast hij kleine wolkjes uit. Hij zit buiten in de vrieskou voor zijn favoriete koffietentje, waar hij dagelijks komt voor een coffee to go. Een pauze tijdens zijn fietstocht om even een frisse neus te halen tussen het werken door. Hij vervolgt: “Je kunt er dingen aan toevoegen als je dat wilt. Als je vragen stelt, dan reageren ze snel. Bij SPSS is dat niet zo. En JASP past heel goed in het tijdperk. Het programma maakt het FAIR maken van data mogelijk.” Hoijtink werkt mee aan die openheid in de wetenschap. Hij vindt dat meer mensen binnen de Universiteit Utrecht moeten weten wat JASP is en wat je ermee kunt. Daarom ontwikkelt Hoijtink : één voor docenten en één voor bachelorstudenten.
Soms kún je je data niet open publiceren. Maar je kunt wel alles openen, behálve je data.
Open science in het onderwijs
“In de kennisclip voor docenten laat ik zien hoe docenten op een hele korte en krachtige manier in tien minuten open science, en specifiek open data en open data-analyses, kunnen promoten in hun onderwijs. Met JASP kun je namelijk één file maken waar je data instaan. Daar kun je een beschrijving van je data in plaatsen, daar kun je de uitvoer van je analyses in opnemen en die kun je ook nog annoteren. Dan heb je één file waar de kern van je onderzoek in staat en die kun je dan open publiceren. In die kennisclip leg ik uit hoe dat in zijn werk gaat en moedig daarmee docenten aan om dat in hun college te doen.” In de tweede kennisclip met de naam ‘Open your bachelor thesis’ richt Hoijtink zich tot studenten. “Ik leg uit dat ze alles in één JASP-file kunnen verpakken.” Hoijtink vertelt hoe studenten de data van hun thesis kunnen verzamelen in JASP, de analyses erin uit kunnen voeren en de resultaten en hun interpretaties kunnen verpakken in de JASP-file. “Vervolgens kunnen ze dat met de hele wereld delen.”
Data anonimiseren is een must
“Twee zaken spelen bij open science een belangrijke rol. Ten eerste kun je niet altijd alles van je onderzoek openbaar maken, omdat data volstrekt geanonimiseerd moeten zijn. Je data mogen niet herleidbaar zijn tot een echt persoon. Dat mag gewoon niet. Dat betekent dat je je data soms niet open kúnt publiceren. Maar je kunt wel alles openen, behálve je data. Je kunt de analyses die je gedaan hebt laten zien, je kunt het codeboek geven, beschrijven waar je data over gaan. Je kunt de analyses voor data open neerzetten, die annoteren. En nodig mensen uit om bij je langs te komen en naar je data te komen kijken, ook al is dat nu in deze tijd natuurlijk lastig.
Je wilt niet gescoopt worden door andere wetenschappers.
En het tweede aspect is: je deelt je data, maar misschien wil je dat nog niet gelijk, want mogelijk wil je er eerst zelf nog dingen mee doen.” En dan noemt Hoijtink de term waarover hij meer leerde tijdens de workshop. “Je wilt niet gescoopt worden door andere wetenschappers.” Hoijtink legt uit dat je dan alleen dat deel van je data open maakt waar je echt klaar mee bent. “Waarbij je zegt: ‘Ik heb nog veel meer, maar daar wil ik eerst zelf leuke dingen mee doen.’ Dit wist ik allemaal niet. Dit heb ik geleerd van Jacques Flores tijdens de workshop.”
Groter vertrouwen in de wetenschap
Door de is Hoijtink een voorstander geworden van open science. “In 2015 heeft de Open Science Collaboration nog eens opnieuw gedaan. In 1/3 van de gevallen kwam er hetzelfde uit en in 2/3 van de gevallen kwam er totaal iets anders uit. Schokkend!”
De open science beweging stelde daarom de vraag: Wat is er gaande in de wetenschap? “Zij concludeerden dat je dit met open wetenschap kunt voorkomen. We moeten open zijn over wat we doen. En één aspect van open is dat als we data verzamelen, dat we die data voor iedereen ter wereld vrij toegankelijk en bereikbaar maken. Data zou FAIR moeten zijn, want als wij onderzoek doen en mensen vertrouwen de resultaten niet, dan kunnen ze die data controleren. Ze kunnen onze data pakken, kijken wat erin staat, kijken wat we ermee gedaan hebben, alles nog eens nadoen en misschien op een andere manier berekeningen uitvoeren. Dan zijn we open en maken we onszelf kwetsbaar. Dat zou kunnen leiden tot een veel groter vertrouwen in de wetenschap.”
Yoda versus Open Science Collaboration
Daarnaast kwam Hoijtink tijdens deze training voor het eerst in aanraking met Yoda. “Ik was gewend om data open te publiceren in de repository van de Open Science Collaboration.” Hoijtink verdiepte zich in Yoda, had ook contact met het Yoda-team. In zijn kennisclip besteedt hij meer aandacht aan de repository van de Open Science Collaboration. “De reden? Die repository kun je in twee minuten opzetten en dan kun je hem gebruiken.” Daardoor is deze volgens Hoijtink zeer geschikt voor simpele onderzoeken. “Ik heb één dataset, die is niet al te groot en die wil ik daar neerzetten met analyses en uitkomsten. Yoda is veel verder ontwikkeld en is in handen van de universiteit zelf. Daar kun je een dataproces neerzetten. Yoda biedt veel meer mogelijkheden. Dat is prachtig. Een mogelijk nadeel daarbij is dat je het niet helemaal zelf kunt doen. Dat kan bij de Open Science Collaboration wel. Ik zie die noodzaak bij Yoda, maar het belemmert me ook een beetje, omdat je niet snel kunt opereren. Dus daar zat een soort van spanningsveld.”
De reden? Die repository kun je in twee minuten opzetten en dan kun je hem gebruiken.
Hoijtink publiceert de kennisclips natuurlijk open. “In mijn eigen repository van de Open Science Collaboration: waar beide kennisclips begin maart 2021 geplaatst worden.”