Een goed research data management brengt FAIR (meta)data voort: (meta)data die “Findable” (vindbaar), “Accessible” (toegankelijk), “Interoperable” (interoperabel) en “Reusable” (herbruikbaar) zijn. We hanteren de term meta(data) omdat metadata en data twee verschillende entiteiten zijn en beide zouden in lijn moeten zijn met de FAIR-principes. Meer informatie over (het onderscheid tussen) data en metadata vind je hier.
Op deze pagina lichten we de basis toe wat FAIR betreft. Als je hierover meer kennis wilt vergaren, verwijzen we je door naar het GO FAIR initiative en FAIRsFAIR. Hou je van een verhaaltje, lees dan zeker de FAIRy tale.
Hoe maak je je (meta)data vindbaar?
Hoe maak je je (meta)data toegankelijk?
Hoe maak je je (meta)data interoperabel?
Hoe maak je je (meta)data herbruikbaar?
Tools
Hoe maak je je (meta)data vindbaar?
Ken globaal unieke en persistente identifiers toe aan je dataset(s). Globaal uniek betekent dat de identifier naar één specifiek item verwijst, en naar dat item alleen. Persistent betekent dat de identifier je altijd zal brengen tot bij dat ene item ook al is het ondertussen van locatie (bv. URL) veranderd. Wanneer je een dataset uploadt in een repository zal die repository normaalgezien automatisch een persistente identifier eraan toekennen.
Een voorbeeld van een persistente identifier is een DOI. Als we willen verwijzen naar de hierboven vermelde FAIRy tale, die opgeladen is in de repository Zenodo, dan verkiezen we om de DOI ((https://doi.org/10.5281/zenodo.2248200) te citeren in plaats van de URL (https://zenodo.org/record/2248200#.YMnea2gzZPZ) omdat die laatste minder stabiel is.
Een ander voorbeeld van een persistente identifier is een ORCID iD. Dat is een uniek nummer dat je voor jezelf kan aanmaken om jezelf van anderen te onderscheiden, vooral van degene die dezelfde naam (of dezelfde initialen) hebben als jij. De auteurs van de FAIRy tale hebben allemaal een ORCID iD, bv. Karsten Kryger Hansen (https://orcid.org/0000-0002-2407-8764).
Omdat metadata en data twee aparte entiteiten zijn (cf. supra), moet je ervoor zorgen dat de metadata expliciet de identifier/referentie vermelden van de dataset die ze beschrijven. Op die manier zijn ze altijd gelinkt aan de data.
Om de vindbaarheid van je data nog meer te verhogen, kan je er best rijke metadata aan toevoegen (bv. auteur(s), publicatiedatum, beschrijving, gerelateerde identifier(s), taal, trefwoorden, etc.). Ga eens op zoek naar een dataset die relevant zou zijn voor jouw eigen onderzoek: welke zoekfacetten gebruik je? Dat zal je helpen om te bepalen welke metadata je kan toewijzen aan jouw data.
UHasselt onderzoekers worden verwacht om de metadata die hun peer-reviewed publicaties ondersteunen te uploaden in de UHasselt metadata repository.
Hoe maak je je (meta)data toegankelijk?
Toegankelijk betekent dat zowel mensen als machines in staat moeten zijn om de (meta)data op te roepen door middel van een gestandaardiseerd communicatieprotocol. Meestal is dit het protocol tcp, wat zich in de praktijk vertaalt naar “je klikt op een link en de (meta)data verschijnt”. Het zou ook een telefoonnummer of een e-mailadres kunnen zijn van de verantwoordelijke die gecontacteerd moet worden om toegang tot de data te verkrijgen, zolang als dat communicatieprotocol duidelijk omschreven is in de metadata.
Toegankelijk is dus niet noodzakelijk gelijk aan “Open Access”. Er kunnen immers geldige redenen zijn om je data niet open te stellen voor het publiek (meer informatie). In dat geval kan je ervoor kiezen om de data beperkt open te stellen door middel van een authenticatie- en authorisatieprocedure of om de data volledig af te schermen (closed access). De metadata, integendeel, zouden altijd beschikbaar moeten zijn. UHasselt onderzoekers kunnen hun metadata opladen in de metadata repository van de instelling, waarmee ze hun toegankelijkheid verzekeren op de lange termijn.
Hoe maak je je (meta)data interoperabel?
De (meta)data zijn interoperabel wanneer ze gecombineerd en uitgewisseld kunnen worden met andere (meta)data door zowel mensen als computers.
Dit kan je bekomen door:
- Gestandaardiseerde taal te hanteren in je (meta)data: gecontroleerde woordenlijsten, ontologieën en thesauri die gebruikelijk zijn (in jouw discipline) en goed gedocumenteerd zijn.
- Bv. de MeSH thesaurus is een gecontroleerde en hiërarchisch georganiseerde woordenschat uitgebracht door de National Library of Medicine.
- Een (meta)data model te hanteren dat gebruikelijk is (in jouw discipline) en goed gedocumenteerd is.
- Bv. Dublin Core en DataCite zijn generische metadata standaarden.
- Bv. MIFlowCyt is een metadata standaard die gebruikt wordt bij flowcytometrie.
- Bv. FITS is een standaard dataformaat dat gebruikt wordt in de astronomie.
- Standaard, open formaten te gebruiken in plaats van eigendomsmatige (meer informatie).
Als jouw dataset voortgebouwd is op een andere dataset of omgekeerd, of jouw dataset ligt ten grondslag aan een publicatie, dan zou je deze connecties expliciet moeten maken in de metadata, bij voorkeur door gebruik van gekwalificeerde referenties en links (bv. een persistente identifier).
Hoe maak je je (meta)data herbruikbaar?
Wanneer iemand je data begrijpt, dan kan hij/zij ze hergebruiken. Daarom voeg je best metadata toe die de context, inhoud en structuur van je data beschrijven: doel, herkomst, methodologie, procedures, beperkingen, variabelen, etc. Gebaseerd op die informatie kan een externe oordelen of de dataset relevant is voor zijn/haar studie en kan hij/zij de data interpreteren en bijgevolg hergebruiken. Idealiter zouden deze metadata ook gestructureerd moeten zijn volgens een metadata standaard (cf. interoperabiliteit).
Tot slot kan de dataset enkel hergebruikt worden als er een licentie aan toegekend is die bepaalt wat anderen er wel of niet mee mogen doen. Die licentie zou ook in een machine-leesbaar formaat moeten staan. Een voorbeeld van zo’ n licentie is de Creative Commons licentie. Meerdere open licenties kan je vinden op de Open Definition website. Als er geen licentie toegekend is aan je data, dan is copyright van kracht en kan niemand ze hergebruiken.
Tools
- FAIR checklist
- FAIR self-assessment tools:
- Automated FAIR assessment tool: F-UJI
U kan hier de volledige lijst met tools en handleidingen raadplegen die we aanraden.