Foretrukne formater i DTU Data
DTU Data accepterer data i alle filformater. For at sikre langsigtet tilgængelighed og læsbarhed bør du dog om muligt vælge åbne filformater til de filer, du uploader.
Åbne filformater er kendetegnet ved, at kildekoden er åben og derfor som udgangspunkt er ikke-proprietære formater. Når du gemmer data i åbne filformater, vil det
-
gøre det lettere for dig og andre at anvende filerne i fremtiden, hvis der ikke længere er adgang til den proprietære software, som bruges til at behandle filerne, og
-
gøre filindholdet mere tilgængeligt for andre, der ikke har adgang til proprietær software.
Hvis du sigter mod langtidsbevaring, skal data uploades i et åbent eller foretrukket filformat. Alle filer skal have en gyldig filendelse, f.eks. .txt, .pdf. Hvis dine data ikke kan gemmes i et foretrukket format, kan de stadig publiceres i deres oprindelige format, men i så fald forpligter DTU Data sig kun til at bevare dataene på bitniveau (dvs. adgang til filen i det format, den blev uploadet i) på lang sigt. Hvis det er relevant, kan filen også arkiveres i det oprindelige filformat ud over de foretrukne formater.
Læs mere om langtidsbevaring i DTU Data her eller kontakt datamanagement@dtu.dk for at høre nærmere.
Kontakt
Datamanagement DTU Library datamanagement@dtu.dk
| Filformater egnet til fuld bevaring (eksempler) | |
| Containere: | TAR, GZIP, ZIP |
| Databaser: | XML, CSV |
| Geodata: | GeoTIFF, NetCDF |
| Lyd: | WAVE, AIFF, MP3 |
| Statistik: | ASCII, DTA, POR, SAS, SAV |
| Video | MPEG-4 |
| Billeder: | TIFF, JPEG, PDF/A, PNG |
| Tabeldata: | CSV, tabulatorseparerede værdier |
| Tekst (slides, illustrationer): | PDF/A (samt originalfil) |
| Tekst: | Ren tekst, XML, PDF/A |
| Array-data: | NetCDF |
Fuld bevaring: For at kunne bruge filerne kræves handlinger som migration, normalisering og konvertering. Foretrukne formater er en forudsætning for sådanne handlinger.
Tabellen giver eksempler på foretrukne formater til langtidsbevaring i DTU Data. Den er hverken udtømmende eller eksklusiv.
Kontakt datamanagement@dtu.dk inden du forbereder dine forskningsdata til langtidsbevaring.
Proprietære formater er filformater, der ejes og kontrolleres af en virksomhed eller organisation. De kræver ofte specifik (og nogle gange betalt) software for at kunne åbnes og redigeres.
Når du gemmer og publicerer data i proprietære formater, bør du overveje at vedlægge en forklarende readme.txt-fil. Inkludér oplysninger om navn, version og den oprindelige anvendelse af den software, der er brugt til at generere filerne. Dette kan være nødvendigt for at kunne håndtere filerne i fremtiden.
Eksempler på proprietære formater:
- .docx (fra Microsoft Word)
.xlsx (fra Excel)
- .psd (fra Adobe Photoshop)
Alternative åbne formater (fx .txt, .csv, .pdf) kan typisk bruges på tværs af programmer og uden licens. Vi har dog forståelse for at der kan være kontekst og funktioner i proprietære formater der er essentielle indenfor specifikke forskningsdiscipliner. Kontakt os på datamanagement@dtu.dk hvis du har spørgsmål vedr. dine filformater.