Innhold på denne siden:

At forskningsdataene lagres sikkert er kritisk for at forskningsvirksomheten skal opprettholde god forskningsetikk og lovmessighet. Avhengig av dataenes karakter, stilles det ulike krav til sikkerheten i lagringsløsningene. Sensitive eller store mengder data krever spesialiserte løsninger for sikker mellom- og langtidslagring. Personopplysninger skal aldri lagres på personlige enheter, og en sikkerhetsmessig vurdering av lagringsløsningen må alltid gjøres.  

Som forsker må du derfor sette deg inn i institusjonens retningslinjer for informasjonssikkerhet og ha oversikt over hvilke lagringstjenester som er godkjent for dataene ditt prosjekt håndterer, samt som tjenesten har tilstrekkelig funksjonalitet. Det er viktig å planlegge lagring og organisering av filer i forkant av datainnsamlingen. Et verdifullt hjelpeverktøy i denne fasen er å opprette en datahåndteringsplan for prosjektet. 

Les mer om nytten av datahåndteringsplaner (DMP) og oversikt over DMP-verktøy.

denne siden finner du informasjon om et utvalg aktuelle tjenester for lagring, tips og råd for organisering og dokumentasjon

Organisering og dokumentasjon 

Gode rutiner for organisering og dokumentasjon av dataene som skal lagres er grunnleggende for en effektiv og oversiktlig gjennomføring av forskningsprosjektet og for å kunne sikre at dataene kan gjenbrukes i fremtidig, enten for egne formål eller hvis dataene skal deles åpent. Etterprøvbarhet, replikasjon og annen gjenbruk forutsetter at innholdet i filene kan tydes og forstås av de utenfor prosjektet som selv ikke har vært med på innsamlingen.  

Strukturering og dokumentasjon som en ettertanke når behovet oppstår er ofte tidkrevende og ubeleilig, under finner du et sett med punkter som det derfor tidlig i prosjektet bør tas stilling til

Mappestruktur

Å finne en logisk og effektiv struktur for organisering av filer kan være utfordrerne, spesielt i prosjekter med flere bidragsytere. Samtidig vil hvilke gjenfinningsprinsipper man baserer innordningen avhenge av prosjektets særstilte behov. I startfasen av hvert forskningsprosjekt bør man derfor opprette og enes om én felles mappestruktur. Her har vi samlet noen gode råd til hvordan best praktisere organisering av filer og informasjon:   

  • Planlegg og bli enige om en felles struktur for organisering av filer og mapper tidlig i prosjektet, og senest i forkant av datainnsamlingen. 

  • Opprett et mappehierarki – Det viktigste er at hierarkiet har en logisk inndeling og at denne inndeling er konsekvent. Som oftest vil det være en god ide å gå fra generell til spesiell, dvs. at øverste nivå i hierarkiet er selve prosjektmappen etterfulgt av de overende kategorier som hver inneholder relaterte underinndelte mapper.    

  • Meningsbærende og entydige mappenavn Alle mappenavn bær være beskrivende for filene de inneholder, samtidig som man unngår tvetydige og overlappende kategorier. For generelle mappenavn eller flere mapper som tjener samme funksjon bør alltid unngås.   

  • Unngå et for grunt eller for dypt hierarki Førstnevnte vil lede til mapper som inneholder uoversiktlig mengder med filer uten en logisk og veiledende inndeling. Mens sistnevnte vil skape overdreven detaljstyrt inndeling som gjør det vanskelig å finne manøvrere og finne tilbake til riktig fil. Det finnes ingen fasit på hvor mange nivåer hierarkiet bør bestå av, men å begrense seg til 3 – 4 vil være en god øvelse.  

  • Dokumenter mappehierarki, mappenes innhold, samt navnekonvensjoner for filer i en README.txt fil. En beskrivelse og oversikt over hierarkiet[...] 

  • Filer aldri legges dobbelt i forskjellige mapper – Som unntak kan man etter behov opprette en snarvei som peker til originalfilen. Dupliserte filer innad i samme mappe bør ha ulike versjonsnumre (se versjonskontroll for mer informasjon).  

Versjonskontroll 

I løpet av forskningsprosjektet vil man ofte, av ulike årsaker, opprette nye versjoner av filer og hvor flere av filene vil ha tilnærmet likt navn. For å unngå at du selv eller andre i prosjektet ikke jobber med feil filer eller overskriver viktige data, bør man etablere et system for å holde oversikt.

 Her er to enkle grep man kan ta for å utøve god versjonskontroll: 

Versjonkontroll

Navngivning av filer 

Navngivning av filer i et prosjekt bør være tydelig og konsekvent, det vil derfor være en fordel å konstruere en egen navnekonvensjon. Hensikt er å gjøre det enklere å strukturere, søke, adskille fra hverandre og forstå en fils innhold, basert på filnavnet. Samtidig sikrer dette at filnavnet er kompatibelt med de aller fleste programvarer, arkiv og lagringstjenester.  

  • Alle filene i prosjektet bør følge samme navnekonvensjon.  
  • Filnavnet bør være kortfattet og ikke lenger enn 32 tegn 
  • Ikke bruk mellomrom, bruk heller understrek «_» (e.g. min_fil.txt). Navnet bør være uten store bokstaver. Eventuelt kan man bruke navnekonvensjonene camel-case eller pascal-case. I camel-case begynner filnavnet med liten forbokstav, men hvert påfølgende ord etter først begynner med stor bokstav (e.g. minFil.txt). Pascal-case er lik camel-case, med uttak av at filnavnet i tillegg til påfølgende ord begynner med stor forbokstav (e.g. MinFil.txt).  
  • Ikke bruk spesialtegn (e.g. «!&%$#@/).  
  • Punktum skal ikke brukes annet en i slutten av filnavnet før filformatet (e.g. «.txt»). 
  • For at filene skal kunne sorteres etter dato er det fordel å oppgi denne i invertert form og da uten mellomrom (e.g. 20250227). For å kunne sortere på dato må dato plasseres fremst i filnavnet eller etter første felles del av filnavnet for prosjektets filer totalt.  
  • Hvis man nummerer filene, bør man avhengig av det totalet antallet filer i prosjektet legge til nuller (e.g. 01 eller 001). Dette er viktig for at filene skal havne i riktig rekkefølge når man sorterer på navn. Sortering av filnavn leses symbol for symbol, så tallet 10 vil leses som 1 og 0 og vil derfor regnes som en lavere verdi en tallet 2.  
  • Man kan også vurdere om man i filnavnet skal inkludere endringen som har blitt gjort, f.eks. «sortert» eller «vasket».  

Filformat

For at filer skal kunne åpnes også i fremtiden bør man velge åpne og ikke-proprietær filformater i de tilfellene hvor dette er mulig. Selv om det ikke finnes noen forsikring om at et spesifikt filformat vil leve evig, har åpne filformater en langt større sannsynlighet for å kunne brukes selv etter selskapet eller programmet det ble laget for opphører. Åpne filformat er de som vedlikeholdes og dokumenteres gjennom fritt tilgjengelige og internasjonale standarder.  

Så langt det er mulig bør man også unngå bruk av relativt ukjente eller nisje filformat. I tilfeller hvor det ikke finnes eller ikke kan brukes ikke-proprietære filformater bør man benytte de mest utbredte.  

Bruk av åpne og ikke-proprietære filformat gjør seg kanskje først og fremst gjeldende hvis man skal oppbevare data over lengere tid, enten til egen forskning og når dataene skal deles eller arkiveres. Det er verdt å være oppmerksom på at ikke nødvendigvis alle proprietære programvarer støtter eksportering til åpne filformat. I disse tilfellene kan det lønne seg å se etter åpen programvare med tilsvarende funksjonalitet som et alternativ. 

For å sikre varig tilgjengelighet og gjenbrukbarhet bør man velge filformater som er:    

  • Åpne og ikke-proprietære.  
  • Enkle å dele og gjenbruke, nå og i fremtiden. Dette innebærer at filene kan brukes av andre som kanskje benytter annen programvare eller operativsystem.  
  • Som bevarer mest mulig av informasjonen fra de opprinnelige filene, dvs. filformat hvor man i størst mulig grad unngår kompresjon.  
  • Som ikke er utsatt for å bli utdatert ved introduksjonen av nye versjoner.  
  • Støttes av dataarkivet man ønsker å deponere data i. 

Se fullstendig oversikt over anbefalte åpne/arkivverdige filformater.  

Lagringstjenester 

Lagring.