Bewaren

U bent hier

Herbruikbare data
Dataopslag en samenwerking (korte termijn / tijdens het onderzoek)
Dataopslag (lange termijn / na het onderzoek)
Tools

Herbruikbare data

Goed georganiseerde data

Organiseer jouw data bij de start van je onderzoeksproject. Het zal de sleutel zijn tot gemakkelijk herbruikbare data.

In de volgende instructie video wordt semantisch versiebeheer en hoe een changelog bij te houden toegelicht:

                                     20210903_FileVersioning.png

                                            (clip door Netherlands Science Center)

Duurzame formaten

  • Zorg ervoor dat jouw data nog steeds bruikbaar zijn op lange termijn. Update formaten en software zodat ze niet verouderd zijn. 
  • Gebruik standaard, open-source en duurzame bestandsformaten in plaats van propriëtaire. Meer informatie over aanbevolen formaten vind je op deze websites:

Begrijpbare data

Voeg extra informatie toe aan jouw dataset om het begrijpelijk te maken:

In de volgende instructie video worden er tips getoond omtrent mappenstructuur, README bestanden, begrijpbare bestandtypes, bestandsnamen en ordelijke data.

                                       20210903_Organising_files_folders.png

                                       (clip door Netherlands Science Center)

 

Data opslag en samenwerking (korte termijn / tijdens het onderzoek)

Digitale en fysieke data zouden op een geschikte manier opgeslagen dienen te worden samen met de bijhorende metadata.

Gebruik veilige opslagmogelijkheden zoals:  

  • Google shared drive
    UHasselt heeft een licentieovereenkomst waarbij jouw gegevens goed beveiligd zijn. Houd er rekening mee dat jouw persoonlijke gratis Google-account geen deel uitmaakt van dezelfde overeenkomst en dat jouw gegevens op die locatie niet veilig zijn. Google geeft ook een paar mogelijkheden om gegevens te herstellen, zoals versiebeheer en Google-kluis.
    Met Google drive kan je jouw werk makkelijk delen met collega’s, maar ook beperkingen instellen waar nodig. Het staat toe om op een gemakkelijke manier samen te werken in een veilige omgeving. Meer info over Google
    Hou er rekening mee dat wanneer een onderzoeker de instelling verlaat, het onmogelijk is om de gegevens legaal uit zijn/haar MyDrive te halen. Als u geen risico wilt lopen op gegevensverlies en helemaal opnieuw moet beginnen wanneer een onderzoeker het project verlaat, moet de promotor erop toezien dat de onderzoeker de gedeelde schijf gebruikt. Wanneer Google Shared Drive gebruiken? We raden je aan om er bijna altijd gebruik van te maken... De gedeelde schijf is bedoeld om je data met anderen te delen en je data vindbaar te maken tijdens je project. Uitzonderingen zijn wanneer u werkt met persoonlijke werkgerelateerde bestanden waar geen samenwerking nodig is. Dan mag je MyDrive gebruiken. Een gedeelde schijf geeft ook meer mogelijkheden om verloren data terug te halen. Zoals het RDM-beleidsplan beschrijft, is het delen van je onderzoek met je begeleider verplicht. Daarom zouden alle onderzoekers Shared Drive moeten gebruiken. De volledige lijst met verschillen tussen MyDrive - Gedeelde schijf vindt u hier. Hoe u een gedeelde Drive gebruikt voor gevoelige gegevens, vindt u hier. Voor meer informatie over shared drive kunt u contact opnemen met CID.
  • Vlaams Supercomputer Centrum (VSC) 
    VSC biedt infrastructuren om data te beheren. Wanneer je onderzoek uitvoert in samenwerking met private bedrijven, gelieve dan Geert Jan Bex te contacteren voor meer informatie.
     
  • Elektronic Lab Notebooks (ELNs)
    Een Elektronic Lab Notebook is software die de papieren laboratorium notitieboeken vervangt. Een ELN heeft veel functionaliteiten en is een handige tool om samen te werken. (meer informatie
     
  • Elektronic Data Capture (EDC) platform
    Dit is een tool voor klinische studies van elke schaal. Data Captatie is een vereiste om conform te zijn met ICH-GCP (Good Clinical Practice) en ook een vereiste voor een subsidieaanvraag voor het KCE (Kenniscentrum). (meer informatie)

De volgende ELNs/EDC worden technisch en financieel ondersteund door de UHasselt. 
Signals Notebook Standard: disciplinaire ELN voor Chemie, Fysica en Biologie;
- ELabFTW: generieke ELN;
- OSF: ELN voor internationale samenwerking;
- Castor: EDC voor klinische studies.

 

Opslagcapaciteit

Zorg dat er voldoende opslagcapaciteit ter beschikking is.
Voor de Google Shared Drive is er op dit moment 250GB per onderzoeker beschikbaar. Een alternatief voor meer capaciteit zijn de "Google Storage Buckets".
Indien je meer info wenst over de "Google Storage Buckets", capaciteit of andere mogelijkheden neem je best contact op met CID.

 

Data opslag (lange termijn / na het onderzoek)

Voor een optimaal hergebruik van jouw gegevens en voor verificatiedoeleinden is het van belang dat jouw gegevens op lange duur toegankelijk blijven. Daarnaast verplicht de financier je vaak om jouw onderzoeksgegevens gedurende vijf jaar na het project te bewaren. Controleer de vereisten van de financier wanneer je overweegt externe gegevensopslag te gebruiken.

Alles bewaren?  

Nee. Maak een selectie. Goede richtlijnen in de selectie zijn de volgende: 

  • Unieke gegevens of gegevens die niet gemakkelijk kunnen worden gereproduceerd (bv. onbewerkte gegevens, analyse workflow);
  • Gegevens die in de toekomst waarschijnlijk hergebruikt zullen worden;
  • Gegevens van grote waarde voor de samenleving (wetenschappelijk, historisch of cultureel);
  • Gegevens die nodig zijn voor validatie;

Neem geen gegevens op die tijdelijk of veranderlijk zijn.
Hou er rekening mee dat je de gegevens mogelijk niet mag bewaren vanwege ethische en juridische kwesties (bv. persoonlijke gegevens, gegevens van derden, enz.). Bezoek onze ethische en juridische webpagina voor meer informatie.

Waar bewaren?

Een data repository is een online infrastructuur waar je jouw dataset(s) kan deponeren. Het biedt vele voordelen zoals unieke identificatie van datasets (bv. DOI), automatische metadata creatie, automatische back-ups en controles, toegangscontrolemogelijkheden (bv. authenticatieprocedures), enz. Je kan kiezen tussen een generieke opslagplaats of een discipline-specifieke databank om jouw werk op te laden.

Vind een geschikte opslagplaats voor jouw dataset(s):

  • Je kan een geschikte domeinspecifieke opslagplaats opzoeken via Re3Data en/of Fairsharing.
  • Indien je geen domeinspecifieke opslagplaats kan vinden, gebruik dan een opslagplaats voor algemene doeleinden, bv. Figshare, Dryad, Harvard Dataverse of Zenodo.
  • Er dient voorkeur gegeven te worden aan een gecertificeerde opslagplaats. Een betrouwbare opslagplaats staat garant voor betrouwbare digitale opslag bevestigd door een CoreTrustSeal certificaat. Voor elk geüpload object of dataset in een betrouwbare opslagplaats wordt een persistent identifier toegewezen tezamen met de bijhorende metadata. 
  • Maak gebruik van de institutionele opslagplaats indien mogelijk. 

Een metadata repository is een online infrastructuur waar je de metadata die jouw dataset(s) beschrijven, kan deponeren. Metadata zijn “data over de data” die je dataset beschrijven volgens een machine-leesbare structuur (bijvoorbeeld auteur, titel, trefwoorden, herkomst, etc.). Als UHasselt onderzoeker word je verondersteld om de metadata op te laden van de datasets die aan jouw peer-reviewed publicaties ten grondslag liggen in de UHasselt metadata repository. Het kan zijn dat je om ethische of juridische redenen jouw dataset niet mag bewaren en/of openstellen, maar je kan (en moet) de onderliggende metadata altijd vrij toegankelijk maken.

Denk eraan om ook de geselecteerde repository te vermelden in jouw DMP. Geef informatie over wie er verantwoordelijk zal zijn voor de data toegang en hergebruik van de data.

Fysieke opslaglocatie

Maak jouw gegevens op lange termijn bruikbaar zodat ze niet verouderd raken of verslechteren (zoals papier, magneetband, enz.). Het is een goede keuze om zulke analoge onderzoeksgegevens eerst te digitaliseren en vervolgens de Google drive of een computer met een back-upsysteem te gebruiken. USB of externe schijven zijn niet aan te raden omdat je het risico loopt gegevens te verliezen wanneer deze defect raken of verloren gaan.

 

Tools

U kan hier de volledige lijst met tools en handleidingen raadplegen die we aanraden.

Top