Salta al contenuto principale
Passa alla visualizzazione normale.

I criteri di selezione

18-lug-2023

Ascolta

Uno dei pilastri della ricerca scientifica riproducibile è l’esposizione pubblica dei dati. Gli Enti finanziatori, le istituzioni, gli editori chiedono ai ricercatori di depositare i dati della ricerca in repositories dedicati. I ricercatori, quindi, hanno l’esigenza di identificare dei repository affidabili, che consentano loro di depositare i dati e renderli disponibili alla comunità scientifica e alla società. 

La maggior parte dei repositories non è certificata da un ente di certificazione accreditato, per cui identificarne uno appropriato è una grande sfida: alcuni repositories potranno offrire policy e standard specifici per la comunità scientifica di riferimento, altri potranno essere più generalisti. 

Di seguito si elencano i criteri di selezione raccomandati, come descritto nel documento : "Core Requirements for Data Management Plan", in Science Europe. (2021). Practical Guide to the International Alignment of Research Data Management - Extended Edition. https://doi.org/10.5281/zenodo.4915862, Creative Commons Attribution 4.0 International, di cui il grafico e la tabella seguenti rappresentano una traduzione e adattamento.

.

criteri-scelta-trustworthy-repository

 

Visualizza il pdf accessibile

 

Di seguito alcuni criteri guida per la selezione di repository affidabili.

 IdentificativiUniciPersistentiPID

Identificativiunicipersistenti (PIDs)

 

Un repository affidabile dovrebbe:

Consentire la «scoperta» e l’identificazione dei dati, quindi assicurati che tra i metadati siano previsti identificativi unici persistenti (PId).
Rendere possibile ricercare, citare e interrogare i dati, assegnando identificativi unici persistenti ai dati che contiene, permettendo ai dati e ai metadati corrispondenti di essere trovati, citati e interrogati anche se fisicamente dovessero cambiare collocazione.
Fornire supporto per il data versioning, cioè assicurare che la versione dei dati ospitati sia chiaramente specificata, documentata e tracciata.

Nota: non tutti i repositories usano un sistema di attribuzione del PID universalmente accettato, ma utilizzano un identificativo gestito localmente. Ciò aumenta il rischio che, in caso di loro trasferimento ad altro sistema, perché il repository non esiste più o ha cambiato organizzazione che lo gestisce, i dati non possano essere più ritrovati.

 metadati

Metadati

 

I dati dovrebbero essere descritti con numerosi metadati che documentino come sono stati generati, sotto quale licenza e come potranno essere riutilizzati; i metadati devono contenere le informazioni di contesto che consentano ad altri ricercatori di interpretarli appropriatamente.

Un repository affidabile dovrebbe:

Consentire di trovare i dati, assicurando l’interoperabilità e il riutilizzo, fornendo i dati e i metadati in un linguaggio accessibile, basato su un ben determinato formalismo. I dati e i metadati dovrebbero essere descritti utilizzando vocabolari controllati e formati che consentano di cercarli, combinarli in modo automatico e distinguere i metadati dai dati.
Consentire la referenziazione ad informazioni rilevanti correlate, assicurando che tra i metadati sia possibile dichiarare link a informazioni rilevanti o associate, inserendo un identificativo unico persistente e la relativa descrizione. Un particolare tipo di informazione riguarda i ricercatori, per cui esistono identificativi persistenti (ID) come ORCID o altri.
Fornire informazioni pubblicamente disponibili anche per dati non pubblici, assicurando la conservazione a lungo termine dei metadati e la loro ricercabilità, anche se i dati non sono disponibili per motivi di protezione dati, vincoli legali o misure di sicurezza, e assicurando che anche i dati ritrattati a causa di cattive condotte di ricerca o altro siano sempre disponibili per consentire l’esame del lavoro di ricerca.
Utilizzare per i metadati standard che siano largamente accettati dalla comunità scientifica, assicurando che i dati mantenuti nel repository siano machine-retrievable (reperibili con strumenti informatici), e assicurando che siano utilizzati standard e buone pratiche per la gestione dei dati, se esistono, facendo attenzione a standard specifici per particolari ambiti di ricerca.
Assicurare che i metadati siano machine-readable, incoraggiando l’adozione di strutture per i metadati che consentano di leggerli con strumenti informatici, ad esempio mettendo a disposizione dei form da compilare con specifici campi obbligatori.
 accesso-dati-licenze-duso

Accesso ai dati e licenze d’uso

 

Unrepository affidabile dovrebbe:

Consentire l’accesso ai dati sotto ben specificate condizioni, i cui termini di riutilizzo devono essere descritti in modo chiaro. Le informazioni sulla licenza devono essere incluse nei metadati.
Assicurare l’autenticità ed integrità dei dati, assicurando che i metadati contengano informazioni dettagliate sulla provenienza dei dati, le modalità di creazione e di elaborazione, in quale contesto possono essere riutilizzati e quanto sono affidabili.
Consentire il recupero dei dati o almeno dei metadati utilizzando un protocollo aperto e standardizzato (non un protocollo di comunicazione proprietario).
Fornire informazioni sulle licenze e i permessi (in un formato machine-readable), permettendo l’accesso alle informazioni sulle licenze in modo strutturato, perché le condizioni di utilizzo siano chiare, sia alle persone che ai computer. Ove possibile, dovrebbero essere utilizzati sistemi di licensing largamente accettati (ad esempio Creative Commons) e che possano essere referenziati tramite URL.
garantire la riservatezza e i diritti degli interessati e dei creatori dei dati, fornendo un sistema di autenticazione e profilazione sia per utenti che sistemi software, consentendo di impostare diritti di accesso che tengano conto dei dati con problemi di riservatezza e di altre restrizioni.
 conservazione

Conservazione

Unrepository affidabile dovrebbe:

Assicurare la persistenza di metadati e dati, assicurandone continuativamente disponibilità ed accesso.
Essere trasparente su missione, ambito, politiche di conservazione, pianificazioni (su governance, sostenibilità finanziaria, periodo di conservazione e piano di continuità), fornendo evidenza in maniera documentata anche di partner esterni per la gestione tecnica e fornendo informazioni su come verrebbero trasferiti i dati in caso di cessazione del repository.