SIMBA

Data di aggiornamento

SIMBA è il Sistema Intelligente per la ricerca di Metadati, Bonifica e Arricchimento semantico, una suite operativa progettata per superare i limiti attuali della pubblicazione degli open data nella Pubblica Amministrazione, trasformando un processo “artigianale” in un flusso strutturato, controllato e realmente interoperabile.

SIMBA, infatti, sposta l’attenzione dalla sola correttezza formale dei metadati (es. DCAT-AP_IT) alla qualità effettiva dei dati contenuti nei dataset, intervenendo su problemi diffusi come campi vuoti, formati incoerenti e codifiche miste e proponendo l’uso corretto di vocabolari controllati e ontologie (come quelle di schema.gov.it).

I quattro pilastri della suite sono:

  • Ricerca: l'IA contestualizza la richiesta in linguaggio naturale (separa "cosa" da "dove") e la traduce in query sul LOD di dati.gov.it, il grafo RDF nazionale;
  • Validazione: verifica la qualità di un file CSV secondo gli standard italiani e internazionali, controllando schema, vocabolari, codifiche, valori. Quindi non solo la conformità del metadato al profilo DCAT-AP_IT ma anche la validità dei dati veri e propri;
  • Auto-valutazione: il produttore valuta il proprio dataset in autonomia, prima di pubblicarlo, ottenendo un report leggibile con il punteggio di qualità;
  • Arricchimento: trasforma un CSV in RDF (Linked Data) sulla base delle ontologie ufficiali, mappando i campi del dataset sulle ontologie di schema.gov.it. Il dato, in questo modo, diventa interoperabile, non solo aperto.

Uno strumento utile per diversi attori: l'Ente produttore (Comuni, Regioni, Ministeri, ...), i fornitori IT (aziende che affiancano le PA), gli utenti (ricercatori, giornalisti, aziende, ...).

SIMBA, inoltre, affianca Cruscotto Italia nel rendere accessibili i dati pubblici italiani. Mentre Cruscotto Italia federa dataset istituzionali su base comunale in una vista strutturata, SIMBA offre un'interfaccia conversazionale per esplorare l'intero catalogo nazionale di open data CKAN e gli endpoint SPARQL del Linked Open Data italiano.

Accedi a SIMBA