Verzamelen

U bent hier

Wat zijn onderzoeksgegevens?
Verschillende soorten onderzoeksgegevens
Invloed van het gekozen bestandsformaat
Specifieke regelgeving inzake gevoelige onderzoeksgegevens

Wat zijn onderzoeksgegevens?

Onderzoeksgegevens zijn alle gegevens die worden gecreëerd, verzameld of gebruikt in het kader van een onderzoeksproject. Deze bijzonder ruime definitie kan een brede waaier van verschillende soorten onderzoeksgegevens in uiteenlopende bestandsformaten omvatten, gaande van ruwe data tot bewerkte en zelfs gepubliceerde gegevens. Bij wijze van voorbeeld deze niet-exhaustieve lijst: notities, interviews, afbeeldingen, objecten, audiovisuele bestanden, rekenbladen, databanken, statistische gegevens, geografische gegevens, softwarecode, simulaties, monsters (inclusief biologisch materiaal, persoonsgegevens, patiëntengegevens, enz.).

 

Verschillende soorten onderzoeksgegevens

Ten eerste, op basis van de onderzoeksmethode maakt men een onderscheid tussen:

  • Kwantitatieve gegevens
    Deze onderzoeksgegevens kunnen steeds in cijfers uitgedrukt worden, d.w.z. zij kunnen geteld en gemeten worden, of vergeleken worden op een numerieke schaal.
  • Kwalitatieve gegevens
    Deze onderzoeksgegevens zijn eerder beschrijvend en conceptueel van aard, d.w.z. zij kunnen niet in cijfers uitgedrukt worden, maar beschrijven eerder kwaliteiten of eigenschappen in een on(semi-)gestructureerde verhalende vorm.

Ten tweede, op basis van de materialiteit van de gegevens maakt men een onderscheid tussen:

  • Digitale gegevens
  • Niet-digitale, analoge of fysieke data
    Fysieke gegevens worden evenzeer beschouwd als onderzoeksgegevens. Uiteraard vereist dit soort gegevens een geheel andere aanpak inzake bv. opslag en langetermijnbewaring. 
    Voorbeelden: interviews en notities op papier, archeologische vondsten, kunstwerken (bv. schilderijen, beeldhouwwerken, foto’s), bloedstalen, DNA-monsters, bouwplannen, geluids- en/of video-opnames op band of schijf.

Ten derde, op basis van de oorsprong van de gegevens maakt men een onderscheid tussen:

  • Primaire gegevens
    Deze gegevens worden gecreëerd door de onderzoeker zelf.
  • Secundaire gegevens
    Deze gegevens worden gecreëerd door iemand anders dan de onderzoeker zelf en/of in het kader van een ander onderzoeksproject. Wanneer men zulke gegevens hergebruikt, moet men er rekening mee houden dat bepaalde overeenkomsten of beperkingen kunnen gelden. Om deze reden moet men vooreerst de gebruiksvoorwaarden (bv. wanneer men een bestaande databank gebruikt) raadplegen, de overeenkomsten tot overdracht van materiaal (MTA) of gegevens (DTA), of andere mogelijke contracten. Meer informatie hierover vind je op de webpagina over ethische en juridische issues.

Ten vierde, op basis van de inhoud van de gegevens maakt men een onderscheid tussen:

  • Gegevens in tabelvorm (gestructureerd in rijen en kolommen)
    Voorbeelden: rekenbladen
  • Tekstuele gegevens
    Voorbeelden: notities van veldopzoekingen of labo-experimenten, antwoorden op enquêtes, transcripten van interviews
  • Binaire of numerieke gegevens
    Voorbeelden: metingen van magnetische velden, metingen van sensoren
  • Audiovisuele gegevens
    Voorbeelden: geluidsopnames van interviews, video-opnames van deelnemers terwijl zij bepaalde opdrachten uitvoeren
  • Beeldmateriaal
    Voorbeelden: medische beeldvorming (bv. MRI of EEG), microscopie.

Ten slotte, op basis van de wijze van gegevensverzameling maakt men een onderscheid tussen gegevens die werden gecreëerd door:

  • Observaties
    Deze gegevens worden op het moment zelf vastgelegd, ofwel via observaties of interviews e.d. door onderzoekers, ofwel door instrumenten en automatische sensoren. Om deze reden zijn zulke gegevens doorgaans onvervangbaar en is het dus van cruciaal belang om ze bv. veilig te bewaren. 
    Voorbeelden: metingen door sensoren, resultaten van enquêtes, geluids- en/of video-opnames van interviews
  • Experimenten
    Deze gegevens worden verzameld in gecontroleerde omstandigheden in een laboratorium. Zij zijn vaak reproduceerbaar, maar deze procedure kan wel erg kostelijk of tijdrovend zijn.
    Voorbeelden: genetische sequenties, chromatogrammen, metingen van een magnetisch veld
  • Afleiding of samenvoeging
    Deze gegevens worden gecreëerd door meerdere bestaande datasets te bewerken en daarna te combineren.
    Voorbeelden: text- en datamining, gecompileerde databank
  • Computerberekeningen, modellen of simulaties
    Deze gegevens worden automatisch gegenereerd op basis van computermodellen. De output-bestanden zijn doorgaans reproduceerbaar, mits het model zelf en de ingevoerde gegevens bewaard blijven. Om deze reden kunnen deze vaak erg omvangrijke output-bestanden verwijderd worden, zodra het onderzoeksproject afgerond wordt en enkel de meest relevante gegevens geselecteerd worden voor langetermijnbewaring.
    Voorbeelden: klimaatmodellen, economische modellen
  • Referenties (canonieke gegevens)
    Deze gegevens zijn een statische of organische bundeling of verzameling van kleinere (peer-reviewed) datasets. Deze kleinere datasets zijn doorgaans reeds gepubliceerd en gecureerd.
    Voorbeelden: databanken van genetische sequenties of chemische structuren, portalen met data uit ruimteonderzoek

 

Invloed van het gekozen bestandsformaat

Gezien de enorme verscheidenheid aan soorten onderzoeksgegevens is het wellicht geen verrassing te noemen dat onderzoeksgegevens eveneens kunnen voorkomen in vele verschillende technische bestandsformaten, afhankelijk van het type software dat gebruikt werd voor de analyse en bewerking van de gegevens. Zodra echter het onderzoek afgerond is en de gegevens voorbereid kunnen worden voor langetermijnbewaring, is het een slimme keuze om deze verschillende formaten om te zetten naar een standaard en stabieler ‘bewaarformaat’. Zulke formaten zijn veel beperkter qua aantal, en waarborgen de leesbaarheid, toegankelijkheid en uitwisselbaarheid van gegevens op lange termijn.  

Doorgaans impliceert dit dat een relatief beperkte set van ‘open’ of veel gebruikte formaten de voorkeur genieten boven de veelheid aan gedeponeerde of commerciële alternatieven. Enkele voorbeelden van geschikte bewaarformaten zijn: OpenDocument Format (ODF), ASCII, tab-delimited format (.tsv), comma-separated values (.csv) en XML. Voor meer informatie over aanbevolen bestandsformaten, zie ook UKdataservice and DANS.

 

Specifieke regelgeving inzake gevoelige onderzoeksgegevens

Specifieke regelgeving is van kracht wanneer een onderzoeksproject betrekking heeft op menselijke (levende) deelnemers, of wanneer dierlijk of plantaardig materiaal gebruikt wordt. Ook indien de onderzoeksresultaten gebruikt zouden kunnen worden in een militaire context of wanneer ze octrooieerbaar zijn, moet je rekening houden met bijkomende regelgeving en vereisten. Meer informatie hierover vind je op de webpagina over ethische en juridische issues.

Top