Cosa sono i principi FAIR?
Horizon Europe richiede una gestione responsabile dei dati secondo i principi FAIR. Tali principi sono stati codificati con lo scopo di aiutare a definire dei dati che possano essere resi disponibili ai ricercatori e ai cittadini “as open as possible, as closed as necessary”. Attuando una gestione dei dati che aderisca a tali principi, è possibile renderli aperti nella maggior parte dei casi, non accessibili solo in casi particolari (ad esempio sicurezza o privacy), ma nel secondo caso comunque è possibile rendere nota la struttura dei dati (non i contenuti) e la metodologia di raccolta ed elaborazione.
I principi FAIR sono i seguenti:
Findable
The first step in (re)using data is to find them. Metadata and data should be easy to find for both humans and computers. Machine-readable metadata are essential for automatic discovery of datasets and services, so this is an essential component of the FAIRification process.
F1. (Meta)data are assigned a globally unique and persistent identifier
F2. Data are described with rich metadata (defined by R1 below)
F3. Metadata clearly and explicitly include the identifier of the data they describe
F4. (Meta)data are registered or indexed in a searchable resource
Trovabile
Il primo passo per (ri)utilizzare i dati è trovarli. Metadati e dati dovrebbero essere facili da trovare sia per gli esseri umani che per i computer. I metadati leggibili dalla macchina sono essenziali per il rilevamento automatico di set di dati e servizi, quindi questo è un componente essenziale del processo di FAIRification.
F1. Ai (meta)dati viene assegnato un identificatore globale unico e persistente
F2. I dati sono descritti con metadati avanzati (definiti da R1 di seguito)
F3. I metadati includono in modo chiaro ed esplicito l'identificatore dei dati che descrivono
F4. I (meta)dati sono registrati o indicizzati in una risorsa ricercabile
Per essere reperibili, i dati devono essere conservati per almeno 10 anni in un archivio che garantisca una conservazione a lungo termine, come ad esempio Zenodo, l’archivio del CERN di Ginevra accessibile a tutti. Archivi disciplinari
possono essere trovati su Re3data-Registry of data repositories, mentre su FAIR
sharing sono presenti anche standards e policies. Dataverse, Protocols.io e Figshareconsentono di creare gruppi di ricerca per la condivisione di dati, in modalità “social”.
Accessible
Once the user finds the required data, she/he/they need to know how can they be accessed, possibly including authentication and authorisation.
A1. (Meta)data are retrievable by their identifier using a standardised communications protocol
A1.1 The protocol is open, free, and universally implementable
A1.2 The protocol allows for an authentication and authorisation procedure, where necessary
A2. Metadata are accessible, even when the data are no longer available
Accessibile
Una volta che l'utente ha trovato i dati richiesti, deve sapere come è possibile accedervi, includendo eventualmente l'autenticazione e l'autorizzazione.
A1. I (meta)dati sono recuperabili dal loro identificatore utilizzando un protocollo di comunicazione standardizzato
A1.1 Il protocollo è aperto, gratuito e universalmente implementabile
A1.2 Il protocollo prevede una procedura di autenticazione e autorizzazione, ove necessaria
A2. I metadati sono accessibili, anche quando i dati non sono più disponibili
N.B. Accessible e open non sono necessariamente sinonimi: l’importante è sapere dove sono disponibili i dati e a quali condizioni. Possono essere esposti in modalità open anche soltanto i metadati.
Interoperable
The data usually need to be integrated with other data. In addition, the data need to interoperate with applications or workflows for analysis, storage, and processing.
I1. (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.
I2. (Meta)data use vocabularies that follow FAIR principles
I3. (Meta)data include qualified references to other (meta)data
Interoperabile
I dati di solito devono essere integrati con altri dati. Inoltre, i dati devono interagire con applicazioni o flussi di lavoro per l'analisi, l'archiviazione e l'elaborazione.
I1. I (meta)dati utilizzano un linguaggio formale, accessibile, condiviso e ampiamente applicabile per la rappresentazione della conoscenza.
I2. I (meta)dati utilizzano vocabolari che seguono i principi FAIR
I3. I (meta)dati includono riferimenti qualificati ad altri (meta)dati
Reusable
The ultimate goal of FAIR is to optimise the reuse of data. To achieve this, metadata and data should be well-described so that they can be replicated and/or combined in different settings.
R1. (Meta)data are richly described with a plurality of accurate and relevant attributes
R1.1. (Meta)data are released with a clear and accessible data usage license
R1.2. (Meta)data are associated with detailed provenance
R1.3. (Meta)data meet domain-relevant community standards
The principles refer to three types of entities: data (or any digital object), metadata (information about that digital object), and infrastructure. For instance, principle F4 defines that both metadata and data are registered or indexed in a searchable resource (the infrastructure component).
Riutilizzabile
L'obiettivo finale di FAIR è ottimizzare il riutilizzo dei dati. Per ottenere ciò, i metadati e i dati dovrebbero essere ben descritti in modo che possano essere replicati e/o combinati in contesti diversi.
R1. I (meta)dati sono riccamente descritti con una pluralità di attributi accurati e rilevanti
R1.1. I (meta)dati vengono rilasciati con una licenza di utilizzo dei dati chiara e accessibile
R1.2. I (meta)dati sono associati alla provenienza dettagliata
R1.3. I (meta)dati soddisfano gli standard della comunità rilevanti per il dominio
I principi si riferiscono a tre tipi di entità: dati (o qualsiasi oggetto digitale), metadati (informazioni su quell'oggetto digitale) e infrastruttura. Ad esempio, il principio F4 definisce che sia i metadati che i dati sono registrati o indicizzati in una risorsa ricercabile (il componente dell'infrastruttura).
Non gestire i dati secondo i principi FAIR rappresenta un costo per l’economia pubblica, come descritto nel report della Commissione Europea “Cost of not having FAIR research data” (https://op.europa.eu/s/smTL).