Come alimentare il Catalogo nazionale degli Open Data

Data di aggiornamento
Domenica 20 Novembre 2022

Il Catalogo Nazionale viene alimentato attraverso la funzione di harvesting, che consente di importare in maniera automatica i metadati relativi ai dataset che le pubbliche amministrazioni, e le società che erogano servizi pubblici rendono disponibili come dati di tipo aperto sui propri cataloghi. Pertanto, in via generale, è possibile contribuire allo sviluppo del catalogo nazionale federando il proprio catalogo con il portale dati.gov.it. I metadati raccolti ed esposti dal catalogo nazionale dati.gov.it confluiscono poi nel Portale europeo dei dati aperti.

Un catalogo “locale” può contenere solo i metadati dei dati dell’amministrazione titolare o, in un’azione di sussidiarietà, può raccogliere anche i metadati di altre pubbliche amministrazioni fungendo in questo modo da intermediario per il catalogo nazionale.

In questo ultimo caso, i vari soggetti intermedi (che possono essere Regioni, Unioni dei Comuni, Province Autonome o Città Metropolitane) fungono da importatori (harvester) dei metadati degli Enti sotto-ordinati e contemporaneamente da importati (harvested) da parte di dati.gov.it t. Questo senza interventi manuali e senza cambiare la titolarità del Dataset che rimane sempre in capo alla PA produttrice iniziale.


Questo processo termina poi, come detto, con l’esportazione sul Portale europeo dei dati aperti.

Il portale dati.gov.it è il riferimento nazionale per la ricerca dei dati aperti come stabilito con l’art. 9 del D. Lgs. n. 36/2006. In attuazione delle disposizioni del citato decreto, la pubblicazione dei metadati sul Catalogo nazionale dei Dati Aperti, è uno specifico requisito definito nelle Linee Guida recanti regole tecniche per l’apertura dei dati e il riutilizzo dell’informazione del settore pubblico, insieme agli altri requisiti di qualità e completezza dei metadati.

Per poter essere correttamente harvestati da dati.gov.it esistono varie modalità:

  1. esporre un proprio ENDPOINT, cioè una URL da comunicare ad AGID, in cui è presente l’elenco dei metadati coerenti con lo standard DCATAP_IT. I formati possono essere TTL , RDF, JSON (esempio);
  2. implementare un catalogo che automaticamente espone il file di cui al punto 1). Per esempio, un catalogo basato sulla piattaforma CKAN con l’estensione DCATAP_IT. In tal caso l’endpoint avrà un formato RDF (esempio);
  3. esporre i propri dati e metadati costruendo manualmente il file RDF. Tale caso si verifica qualora non sia possibile implementare un proprio catalogo o perchè il numero di dataset da esporre sia alquanto limitato che non giustificherebbe lo sviluppo di un catalogo. I dataset sono esposti, quindi, sul proprio WebSite (o su piattaforme come GITHUB). Per questa casistica AGID ha messo a disposizione un configuratore su piattaforma Google SpreadSheet che compila e crea in automatico il file RDF da rendere pubblico su una URL raggiungibile. (esempio)
  4. rendere disponibile un endpoint SPARQL che espone i metadati secondo lo standard DCATAP_IT. Il formato può essere .TTL o .RDF (esempio)
  5. utilizzare le API standard del proprio CMS (esempio DKAN o CKAN). In tal caso bisogna comunicare ad AGID l’URL della radice del proprio CMS (esempio)

A prescindere dalla modalità scelta, i soggetti che intendono pubblicare i propri metadati su dati.gov.it possono utilizzare il form Scrivi alla redazione comunicando:

  1. Nome e cognome del referente del catalogo
  2. Indirizzo mail e riferimenti telefonici del referente del catalogo
  3. URL di accesso al catalogo (endpoint) o comunque ai metadati.

Nella sezione Elenco cataloghi federati (download in formato CSV) è disponibile la lista dei cataloghi che alimentano il portale dati.gov.it.


Si raccomanda di seguire in ogni caso le FAQ presenti su dati.gov.it dove vengono spiegate nel dettaglio le procedure per correggere eventuali errori nei metadati (licenze, formati) o configurare le caratteristiche di CKAN per evitare errori nella qualità dei metadati stessi.