Guide til bevaring i DTU Data

DTU Data har som mål at være et pålideligt repositorie, hvor bevaringspraksisser er klart definerede og forstået af brugerne. 

Ved at publicere dine data i et pålideligt repositorie som DTU Data påbegynder du bevaringsprocessen og tager det første skridt mod at sikre, at dine forskningsresultater forbliver tilgængelige og genanvendelige.
DTU Bibliotek administrerer DTU Data og er ansvarlig for al dokumentation samt brugersupport. Bibliotekets mål er at sikre, at de gemte metadata og data er findbare, tilgængelige og forståelige på lang sigt. DTU Bibliotek samarbejder med IT-afdelingen, som har ansvar for den tekniske infrastruktur, hardwaremigration og IT-sikkerhedsforanstaltninger.

Data kan oprindeligt være skabt med ét specifikt formål, men på længere sigt kan deres værdi afhænge af, at de gemmes i åbne formater. Desuden kan data have værdi for genbrug i andre sammenhænge.

Bevaring skaber først værdi, når den understøttes af dokumentation om datakilde, samt software- og hardwarekrav til genbrug. DTU Data’s personale gennemgår metadata for de indsendte elementer for at øge findbarhed, interoperabilitet og genbrug for data-brugere.

Dette sker i tæt samarbejde med den, der uploader dataene. Som uploader skal du også vurdere elementet ud fra videnskabelig kvalitet og kontekst, da disse aspekter er vigtige ved vurdering af, hvilke data der skal langtidsbevares.

Metadata til DOI'en
Digital Object Identifiers (DOI’er) i DTU Data registreres hos DataCite i henhold til DataCite Metadata Schema. Derfor er DTU Bibliotek forpligtet til at sikre vedvarende adgang til metadata enten via DTU Data eller et andet åbent tilgængeligt arkiv.

Bevaring af filer
DTU Data anvender to niveauer af filunderstøttelse:

  • Bit-niveau bevaring: Adgang til filen i dens indsendte format sikres.

  • Fuld bevaring: Filernes anvendelighed kan kræve handlinger såsom migration, normalisering og konvertering.

Med bit-niveau bevaring garanterer DTU Data adgang til filerne i mindst 10 år (se Kuraterings niveau 2 nedenfor). Derfor kan udvidet adgang til elementfiler afhænge af, at filerne uploades i foretrukne formater. Se listen over foretrukne formater. For filer, der opbevares uden for DTU Data, se Kurateringsniveau 3 nedenfor.

Kurateringsniveauer beskriver de forskellige grader af omsorg og bevaringshandlinger, der anvendes på forskningsdata. De hjælper med at tydeliggøre, hvilket niveau af tilgængelighed, anvendelighed og langsigtet sikkerhed man kan forvente, afhængigt af hvordan dataene opbevares og vedligeholdes.

Niveau 1                                                                                                                                                                                                                                                               

Tilgængelighed i mere end 10 år skal fastlægges på forskningsgruppe- eller institutniveau i henhold til lokale retningslinjer. Handlinger omfatter kuratering af variable og filer til langsigtet bevaring. Data konverteres til langsigtede formater. Dokumentation af variable og anvendte metadata-standarder bevares sammen med anden dokumentation. Langsigtet tilgængelighed sikres også gennem hardware-migration. Data kan være egnet til indberetning til Rigsarkivet. Dette afgøres i samarbejde med forskningsgruppen/instituttet, hvis det ikke allerede er påkrævet i henhold til dansk lovgivning. Eksempler er tidsseriedata, kohortestudier og databaser. Forskningdata med høj værdi for de tekniske videnskaber eller nationalt.

Niveau 2                                                                                          

Data er tilgængelige i det format, de er indleveret i. Data er tilgængelige i minimum 10 år, men kun med backup på bit-niveau. Indlevering i foretrukne filformater er nødvendig for anvendelighed ud over 10 år. Sekundær brug af data er mulig, for eksempel til validering af publicerede resultater. Eksempler er data og kode, der understøtter publikationer, modeller, videoer og billeder. Data med utilstrækkelig dokumentation.

Niveau 3

           

Ingen filbevaringshandlinger udføres for filer, der opbevares uden for DTU Data. For eksempel hvis data er gemt andre steder og linket med en metadata-post publiceret i DTU Data. Dette kan omfatte data arkiveret i institutarkiver, såsom fortrolige data (inklusive persondata) eller data gemt på andre webtjenester. Nogle data, der ikke kan deles åbent, kan stadig kræve langsigtet bevaring i henhold til dansk lovgivning.

Nogle forskningsdata og -resultater kan vurderes til at have så høj værdi, at langsigtet bevaring, dvs. i mere end 10 år, ønskes (se Kurateringsniveau 1 ovenfor).

Nogle forskningsdata skal indberettes til Rigsarkivet. Efter indberetning vil Rigsarkivet vurdere, hvilke data der bør bevares i mere end 100 år. Omkostninger til bevaringshandlinger skal bæres af forskningsprojektet eller instituttet. Hvis dine forskningsdata ikke er omfattet af indberetningskravet, har du stadig mulighed for at få en vurdering af Rigsarkivet, hvis dataene kan overføres til langsigtet bevaring.

Det er muligt at bruge DTU Data til overførsel af data til Rigsarkivet.

Det er også muligt at bruge DTU Data til langsigtet bevaring af højt værdifulde data, som ikke bevares af Rigsarkivet (se kurateringsniveau 1). Sådanne fulde bevaringshandlinger kræver dedikerede ressourcer til filformat-migration og hardware-migration. Derudover kræver både data og bevaringshandlinger regelmæssig revurdering. Derfor er en individuel aftale om handlinger og udgifter nødvendig med DTU Bibliotek og IT-afdelingen.

Kontakt datamanagement@dtu.dk før du forbereder dine forskningsdata til langsigtet bevaring.

Ifølge dansk lov skal visse data indberettes og afleveres til langtidsbevaring hos Rigsarkivet. Langtidsbevaring betyder arkivering i længere tid end de krævede 5 år efter publikation.

Data, der publiceres i DTU Data, er dog undtaget fra denne indberetning, da de allerede høstes til arkivering hos Netarkivet.dk. 

Nogle forskningsdata vurderes at have så høj værdi, at de skal bevares i mere end 100 år. I Danmark er det Rigsarkivet, der afgør, hvilke digitale forskningsdata der hører til i denne kategori.