Stima dei costi per la scienza aperta
I costi sono un capitolo fondamentale del Data Management Plan, perché è proprio in questo documento che viene fatta la pianificazione di costi e risorse per la gestione di licenze, repository, metadati, e per il mantenimento dell'integrità della ricerca e la riproducibilità dei risultati.
Uno dei documenti di riferimento per la valutazione dei costi della gestione dei dati nella pratica della scienza aperta è il Data Management Costing Tool, pubblicato sul sito UK Data Service, una infrastruttura di ricerca governativa del Regno Unito che ha lo scopo di raccogliere le best practices in materia di scienza aperta ed in particolare di data curation e data security. Il Data Management Costing Tool contiene una estesa checklist degli aspetti da considerare per la valutazione.
OpenAIRE, nell'articolo Costs of Research Data Management, nella sezione How to comply with Horizon Europe mandate for Research Data Management, segnala la guida Costs of data management nel sito della Utrecht University. Qui, ispirandosi al the Data Management Costing Tool del sito UK Data Service sopra menzionato, vengono esplicitati gli aspetti da tenere in considerazione in merito ai costi per raccolta, documentazione e storage dei dati; per la garanzia della sicurezza degli accessi; per i costi necessari per la conservazione a lungo termine; per l'anonimizzazione, la proprietà intellettuale, la condivisione dei dati, l'eventuale digitalizzazione e l'eliminazione a fine progetto; infine viene menzionato l'aspetto della valutazione delle risorse umane disponibili e dei relativi profili professionali necessari, che rappresentano un'altra voce di costo da considerare.
OpenAIRE inoltre segnala l'infografica dal titolo What will it cost to manage and share my data? (in Zenodo, DOI 10.5281/zenodo.3837716), che invita a riflettere sulle componenti di costo di infrastruttura (storage, licenze, sicurezza, pubblicazione, riuso, conservazione a lungo termine) e di professionalità (data wrangling, cioè "il processo eseguito per raccogliere, selezionare, ristrutturare, arricchire e infine trasformare le informazioni con l’obiettivo di rispondere a una domanda specifica" - in Pierre-Nicolas Schwab, Data Wrangling: definizione, passaggi, strumenti [guida 2021],IntoTheMinds, https://www.intotheminds.com/blog/it/data-wrangling-definizione-passaggi-strumenti/ - documentazione, strutturazione dei metadati, anonimizzazione, ecc.), sui costi diretti e quelli indiretti (ad esempio infrastrutture tecnologiche interne, che potrebbero non essere rendicontabili nel progetto). L'infografica identifica i soggetti che possono aiutare il ricercatore/capo progetto nella stima dei costi e i fattori che influiscono significativamente nei costi da sostenere per la gestione dei dati e del progetto di ricerca in generale.
Un altro tool che può essere utilizzato è il Data Wizard DSW Storage Costs Evaluator (https://storage-costs-evaluator.ds-wizard.org/), ma limitatamente agli aspetti legati allo storage, non vengono considerati tutti gli altri aspetti legati ad una gestione dei dati della ricerca che riguardi l'intero ciclo di vita dei dati.