4. Gjenfinning og gjenbruk
I tillegg til, eller i stedet for egen datainnsamling, finnes det mange muligheter for gjenbruk av allerede eksisterende forskningsdata, offentlige data, registerdata og helsedata.
Innhold på denne siden
Innledning
I tillegg til, eller i stedet for egen datainnsamling, finnes det mange muligheter for gjenbruk av allerede eksisterende forskningsdata, offentlige data, registerdata og helsedata. Potensialet i datagjenbruk er stort, og det vil som del av prosjektplanleggingen være nyttig å kartlegge de mulighetene som finnes. Under har vi gjort et utvalg av datakilder for ulike formål, samt utbredte søketjenester spesielt utviklet for gjenfinning av datasett. I tillegg til informasjon om datasitering, og lisenser og bruksvilkår i gjenbrukssammenheng.
Potensialet i datagjenbruk er stort, og det vil som del av prosjektplanleggingen være nyttig å kartlegge de mulighetene som finnes. Under har vi gjort et utvalg av datakilder for ulike formål, samt utbredte søketjenester spesielt utviklet for gjenfinning av datasett. I tillegg til informasjon om datasitering, og lisenser og bruksvilkår i gjenbrukssammenheng.
Datakilder
Gjenfinning og bruk
Søketjenester
En utfordring med å skulle gjenbruke allerede eksiterende data er det å skulle ha kjennskap til hvilke kilder man kan finne relevant materiale. Under har vi derfor gjort et utvalgt av ulike søketjenester som lar deg gjenfinne delte datasett.
Datasitering
Når man bruker andres data i forskningssammenheng, skal disse siteres. Formålet er det samme som ved annen sitering i akademisk arbeid, nemlig å anerkjenne opphavspersonens arbeid og for at leseren selv skal kunne oppsøke den samme informasjonen. Dette er styrkende for transparens og etterprøvbarhet, samt bidrar til at data som er tilgjengelig for gjenbruk i ytterligere grad synliggjøres.
Datasitering kan regnes som et steg i riktig retning for at også denne delen av det vitenskapelige bidraget kan meritteres.
Hvor referanser til datasett skal plassers i publikasjonen vil avhenge av retningslinjene til forlaget/tidsskriftet. Ofte vil det være krav om at opplysninger om tilgjengelighet av publikasjonens data oppgis i en egen erklæring i teksten, et såkalt «data availability statement» eller «data access statement», og den fulle referansen bør da tilføres i denne seksjonen. Om ikke annet er oppgitt vil det ofte være naturlig at det opplyses om bruken av dataene og tilhørende referanse i metodekapittelet. Det må også vurderes om det mest hensiktsmessige er å referere til datasettet direkte eller til den tilhørende publikasjonen.
Viste du at datasitering gjelder også dine egne data?
Hvis du har arkivert data du selv samlet inn bør disse også refereres til, på denne måten lager du en kobling mellom publikasjonen og dataene den baserer seg på. [dyplenke til punkt 5 under 2.5?]
Datasiteringen skal føres i henhold til referansestilen som brukes for resten av teksten, og bør i praksis inneholde følgende informasjon:
- Forfatter(er)
- Publiseringsdato
- Tittel
- Versjonsnummer (hvis relevant)
- Ressurstype (hvis relevant)
- Arkiv
- DOI eller en annen persistent identifikator
Eksempel på syntaks – Merk! Oppsett avhenger av referansestil som benyttes:
Forfatter. (år). Tittel. (Versjon). Arkiv/Utgiver. Persistent identifikator (f.eks. DOI)
Lisenser og vilkår
Om man skal ta i bruk data som er gjort tilgjengelig enten åpent eller med begrenset tilgang må man være oppmerksom på hvilke lisenser og vilkår dataene stilles til disposisjoner under.
For data som gjøres åpent tilgjengelig gjennom dataarkiv og andre delingsplattformer vil det vanligvis være tilknyttet en åpen lisens. Her finnes en del forskjellige alternativer, men de mest brukte for datasett er Creative Commons (CC) og Open Data Commons (ODC), hvor hvert av rammeverkene har et sett med lisenser som alle varierer i grad av fri bruk og eventuelle restriksjoner som pålegges. Det kan også forekomme at arkiver/institusjonen bruker egendefinerte lisenser.
Det er ikke uvanlig at data som i utgangspunktet stilles til rådighet for forskning og gjenbruk vil kreve en form for tilgangskontroll. Det kan være så enkelt som at man tar kontakt med dataenes opphavsperson og avtaler bruk direkte eller det kan innebære en mer omfattende søknadsprosess hvor for eksempel prosjekt og formål må dokumenteres og hvor det kan stilles særstilte vilkår som må innfris for å oppnå tilgang.
3. Innsamling og bearbeidelse
Gå til forrige steg i prosessenGå tilbake til forrige steg i prosessen.