FAIR-principperne

FAIR-data er levende data - til at finde, tilgængelige, brugbare, også for "genbrug" -  findable, accessible, interoperable, reusable.

DTU's forskningsdata skal stræbe efter at leve op til FAIR-principperne. Det er et væsentligt led i DTU's politik for opbevaring af primære materialer og data (pfd). FAIR-principperne er internationalt anerkendte, grundlæggende retningslinjer for, hvordan vi gør vores forskning åben, transparent og økonomisk sund.

FAIR indebærer at gøre data brugbart ved sikre, at data er findable (søgbart), accessible (tilgængeligt), interoperable (systemuafhængigt) og reusable (anvendeligt) – så både mennesker og computere kan læse det.

De fire principper uddybes af 15 facetter, der beskriver, hvordan du sørger for at gøre dine data FAIR:

Findable

  • For at forskningsdata kan kaldes FAIR, skal de kunne findes via søgemaskiner og forskningsdatakataloger. Data bliver FAIR, når det tilføjes metadata fx keywords.
  • FAIR-data kan findes ved hjælp af unikke og systematiske identifiers, gerne DOI’er (Digital Object Identifier), da data med en DOI identifier også kan blive citeret – ganske som en forskningsartikel.

Mange forskere har offentliggjort deres data på deres egne hjemmesider. Men egen-publicering henvender sig ofte kun til en lille gruppe af kolleger. Egen-publicering har desværre også den bagside, at referencerne bliver ustabile, når posten ikke bliver opdateret og/eller URL’en dør, hvis hjemmesiden flyttes eller bliver nedlagt.

Den letteste måde at gøre dine data findable er at publicere dem i forskningsdata repositories, der automatisk tildeler systematiske identifiers, standard metadata og licenser for brug af dine data. Publicerer du dine data et anerkendt sted, øger du chancen for, at andre bliver interesserede i din forskning, hvilket betyder højere impact, flere citationer og mulighed for nye samarbejder – ganske som publicering af forskningsartikler i anerkendte tidsskrifter.

Accessible

  • FAIR data skal sikres langtidsopbevaring, så data kan gøres tilgængelige ved hjælp af “standard technical procedures”.
  • Det betyder ikke, at al data skal være åben for alle. Men informationen om hvordan data kan hentes skal være tilstede f.eks. ved at underskrive en ‘terms of use’ erklæring eller ved at man skal registrere sig med en gyldig e-mail adresse for at få lov at se data.
  • Det er også muligt blot at publicere dine datasæts metadata og så kun give adgang til selve data ved personlig henvendelse.

En standard til at give adgang til datasæt kan eksempelvis være opsætning af en filsamling  (fx zip-arkiv eller BagIt folder) som så kan downloades sammen med dokumentation og tekniske specifikationer for datasættene.

Interoperable
FAIR-data skal være interoperable på tre måder:

  1. Teknisk interoperability betyder, at filer kan udveksles og bruges på tværs af applikationer og systemer – også i fremtiden. Dette kan opnås ved at bruge bredt anerkendte, langtidsholdbare åbne standarder og filformater. Metadata skal indeholde information om, hvilke software der er blevet brugt til at skabe data og hvis det er muligt, skal specielt software, der er nødvendigt for at fortolke data arkiveres sammen med data.
  2. Semantisk interoperability betyder, at data skal kunne blive fortolket og brugt i en ny kontekst til ny forskning inden for andre discipliner end deres oprindelse. Data skal også kunne kombineres med andre/nye datasæt og stadig kunne analyseres af mennesker og systemer. Dette gøres bedst ved at bruge standard metadata schemes og tilskrive så meget metadata, som gør det muligt at forstå, bearbejde og fortolke data.
  3. Juridisk interoperability betyder, at der er klare retningslinjer for, hvordan data må tilgås og genbruges. Dette opnås bedste ved at anvende standard licenser. Dette minimerer også risikoen for misbrug af data og sikrer, at de relevante personer bliver krediteret for deres arbejde med de pågældende data.

Resuable
FAIR-data hjælper med at:

  • Bygge videre på tidligere forskningsresultat
  • Øge kvaliteten af forskningen, ved at tillade andre at efterprøve resultaterne
  • Opmuntre til samarbejde og undgå dobbeltarbejde
  • Accelerere innovation ved at udnytte synergier
  • Involvere borgere og samfund
  • Optimere gennemsigtighed i forskningsprocesser.

At gøre data genanvendeligt er at tilføre værdi:

  • Tilføj den metadata og dokumentation, der skal til for, at andre kan genbruge dine data
  • Giv klare retningslinjer på terms of use gennem standard licenser
  • Giv teknisk vejledning for adgang til data og for hvordan data kan fortolkes og bruges
  • Når du genbruger andres data, skal du respektere de krav, der stilles til brug, anerkende dem, der har skabt de originale data og citere den originale kilde korrekt.

Så åbent som muligt og så lukket som nødvendigt
Det ikke er al data, der kan være fuldt åbent, sensitive data (persondata), fortrolige data (innovationer og kommercielt samarbejde), men FAIRness kan anskues i grader – fra helt åben og FAIR til helt lukket, men FAIR i sin kontekst. Det handler om at gøre data så åbne som muligt og så lukkede som nødvendigt.

Mere om FAIR