Come organizzarsi per gli open data: a proposito di harvesting

Pubblicato il: Lunedì 05 Giugno 2017
Come organizzarsi per gli open data

La redazione del portale nazionale dati.gov.it è impegnata, tra l'altro, a promuovere la presenza e la documentazione nel catalogo nazionale dei dataset che le pubbliche amministrazioni rendono disponibili in open data. In tale contesto, sono state avviate le attività finalizzate al miglioramento della qualità delle informazioni contenute nel catalogo stesso, come recentemente avvenuto, ad esempio, con riferimento ai dati presenti nel catalogo ma che in pratica esponevano una licenza non propriamente “open”.

 

Come riportato nella news del 2 maggio scorso su “la policy di harvesting”, l’attività di pubblicazione e di aggiornamento dei dati nel catalogo nazionale è un classico esempio di processo collaborativo che deve essere svolto in raccordo con le amministrazioni. Nella stessa news, con riferimento al tema della qualità dei metadati presenti nel catalogo, veniva evidenziato l’obiettivo di “documentare (possibilmente) tutti i dati resi disponibili dalle amministrazioni, evitando la duplicazione o la ridondanza delle informazioni e assicurando una adeguata frequenza di aggiornamento.”

 

A tal fine, sono state avviate le necessarie attività di verifica della coerenza dei dati pubblicati e si sta procedendo alla eliminazione dei duplicati, con conseguente comunicazione all’amministrazione competente, in coerenza con la policy esplicitata nella citata news del 2 maggio scorso: in linea generale, dati.gov.it raccoglie i metadati dai cataloghi aggregatori (ad es. catalogo regionale) e non anche dei cataloghi “aggregati” (ad es. catalogo comunale già presente nel catalogo regionale). Naturalmente è onere del catalogo aggregatore assicurare l’aggiornamento delle informazioni anche dei cataloghi aggregati.

 

A tale proposito, salvo necessità particolari che potranno essere valutate direttamente con le amministrazioni interessate, l’aggiornamento del catalogo nazionale viene effettuato, in generale, mediante operazioni di harvesting con cadenza settimanale. Man mano che le attività di popolamento e di miglioramento della qualità delle informazioni andranno avanti saranno poi verificate altre possibilità.