30/10/2014

Pillola n. 13 - Il formato dei dati sui beneficiari dei Fondi Strutturali: si tratta di dati aperti?

L’importanza del formato dei dati per la trasparenza, la partecipazione e la collaborazione

Il formato di pubblicazione dei dati indicato tramite l’estensione (il suffisso, tipicamente di tre lettere, con cui termina il nome di un file) è ciò che permette a un’applicazione di interpretare i contenuti di un file in modo da poterli rappresentare. Esso assume un’importanza fondamentale nella valutazione della qualità dell’informazione fornita in quanto alcuni formati ne abilitano il riuso immediato e la rielaborazione autonoma da parte di tutti i soggetti interessati (formato aperto), mentri altri non offrono questa possibilità (formato chiuso).

La disponibilità dei dati pubblici in formato aperto, ovvero come Open Data, costituisce la materia prima per favorire il riutilizzo di informazioni legate ad una gestione sempre più trasparente della cosa pubblica e garantire ai cittadini una partecipazione informata.

Per distinguere i diversi formati utilizzabili nella codifica dei set di dati, il principale riferimento è lo schema di catalogazione proposto da Tim Berners Lee che classifica i formati in base alle loro caratteristiche su una scala di valori da 1 (una stella) a 5 (cinque stelle):

(★) Una Stella. È il livello base, costituito da file non strutturati, che indica la disponibilità dell’informazione in rete in un formato distribuito con licenza aperta che non può però essere rielaborato.

(★★) Due Stelle. Questo livello indica dati strutturati ma codificati con un formato proprietario come ad esempio Microsoft Excel. Questi dati possono essere elaborati purchè si disponga del software necessario a gestire un file codificato con un formato proprietario.

(★★★) Tre Stelle. Questo livello indica dati strutturati e codificati in un formato non proprietario. In questo caso si possono fare elaborazioni sui dati anche senza ricorrere ad un software proprietario. Si tratta del formato più semplice di dati aperti.

(★★★★) Quattro Stelle. Questo livello indica dati strutturati e codificati in un formato non proprietario dotati di un URL che li rende indirizzabili sulla rete e quindi utilizzabili direttamente online, attraverso l’inclusione in una struttura basata sul modello RDF (Resource Description Framework).

(★★★★★) Cinque Stelle. Questo livello indica quelli che vengono definiti Linked Open Data (LOD), letteralmente “dati collegati” con cui si intende un metodo di pubblicazione di dati strutturati che permette l’interconnessione dei dati stessi in modo da garantirne una maggiore fruibilità.

 

Un’analisi dei formati dei dati dei beneficiari dei Programmi Operativi (PO) 2007-2013 in Europa

Per valutare il livello di trasparenza dei Fondi Strutturali europei (FESR e FSE) da una prospettiva Open Data l’indagine effettuata sulle caratteristiche delle “liste dei beneficiari” dei Fondi Strutturali su tutti i PO europei, (Pillola n.7 - Open data sui beneficiari dei Fondi Strutturali in Europa) ha permesso di elaborare un indice relativo al formato utilizzato per la pubblicazione dei dati. Esso attribuisce un punteggio tanto più elevato quanto maggiore è il grado di apertura e la possibilità di riutilizzo delle informazioni sulla base del modello di Tim Berners Lee come riportato nella tabella. La valutazione tiene conto di quanto i formati utilizzati siano processabili automaticamente, in un formato privo di controllo esclusivo o, nel migliore dei casi, coerenti con il modello linked data che permette di incrociare informazioni da fonti diverse.

 

Legenda del punteggio assegnato al formato dei dati sui beneficiari del Fondi Strutturali  2007-2013

 

 

È importante sottolineare come i Regolamenti per la Programmazione 2007-2013 non fornivano indicazioni vincolanti rispetto al formato in cui pubblicare le informazioni relative ai beneficiari. Queste indicazioni sono invece presenti nei Regolamenti per la Programmazione 2014-2020 (cfr. Pillola n.12- Open data sui Fondi Strutturali in Europa: le iniziative della Commissione). Come evidenziato dai grafici che riportano i valori medi dell’indice in serie storica, sono osservabili nel tempo alcuni segnali positivi ma sono ancora ampi i margini di miglioramento per favorire un più elevato riuso dei dati.

Caratteristiche dei dati sui beneficiari dei Programmi Operativi dei Fondi Strutturali 2007-2013 (FESR e FSE): indice formato (anni 2010-2013)

Fonte: Rilevazione diretta via web

 

Nel 2013, i PO che utilizzano i formati più “avanzati” tra quelli considerati (XML, JSON, RDF) sono ancora molto pochi: le informazioni sui beneficiari sono, infatti, disponibili in un formato XML soltanto per 16 PO (il 3,7 per cento del totale). È il caso di Bulgaria e Finlandia che beneficiano della presenza di un sistema informativo centralizzato a livello nazionale (come Repubblica Ceca, Danimarca, Estonia, Grecia, Francia, Lettonia, Lituania, Ungheria, Polonia, Romania, Slovenia, Repubblica Slovacca e Svezia), in cui cioè sono raccolte tutte le informazioni relative ai PO nazionali e da cui è possibile accedere alle liste dei beneficiari di tutti i PO attivi nel paese, pubblicate con un criterio standard. Cresce rispetto agli anni precedenti il numero di programmi che utilizza il formato open CSV disponibile per il 11,8 per cento dei PO ma continuano ad essere estremamente diffusi come unici formati disponibili il Pdf (39,4 per cento dei programmi) e l’HTML (11 per cento). Infine, l’unico formato riutilizzabile in cui è disponibile un numero consistente di dati riferiti al 24 per cento dei PO è quello proprietario di Microsoft Excel (XLS). I risultati appena presentati si riferiscono alla pubblicazione autonoma da parte delle Amministrazioni titolari della gestione dei PO ma se consideriamo il portale unico nazionale OpenCoesione per l’Italia (come messo in luce dalle linee tratteggiate all’interno dei grafici) la situazione appare significativamente diversa.

Cosa cambia considerando OpenCoesione?

La mappa dell’Europa dei PO FESR mostra le performance a livello regionale europeo (considerando OpenCoesione per l’Italia) in base all’indice relativo al formato del file pubblicato. Per ciascuna regione è stata effettuata una media tra il valore dell’indice del Programma Operativo Regionale e, ove presenti, i Programmi Nazionali e multiregionali che impattano sul territorio. Si tratta di una media ponderata per dimensione finanziaria del programma che considera come pesi l’ammontare del co-finanziamento comunitario del PO regionale insieme al cofinanziamento comunitario dei PO nazionali o multiregionali (suddiviso equamente per il numero di regioni nelle quali il PO insiste). 

Ciò che emerge è come alcuni Stati facciano meglio rispetto ad altri dove manca ancora del tutto la disponibilità di informazioni sui beneficiari dei Fondi Strutturali in formato riutilizzabile. In particolare, i Paesi scuri che risultano che totalmente omogenei sono quelli che fanno riferimento ad un sito centralizzato. Ciò testimonia come le iniziative volte alla pubblicazione delle liste a livello nazionale tramite un unico portale di accesso favoriscono una maggiore apertura dei dati. Questo è il caso del portale OpenCoesione grazie al quale l’Italia ottiene un punteggio pari al 66,6% poiché rende disponibili i dati in formato CSV. Considerando i valori in fase di rilevazione a livello europeo, il punteggio per l’Italia raggiunge l’83% grazie alla presenza di un’interfaccia applicativa che permette la gestione dei dati in modo più avanzato.

 

Livello medio del punteggio dell’indice formato dei Programmi Operativi FESR 2007-2013, anno 2013

 

 

 

Per ulteriori informazioni di carattere generale su OpenCoesione è possibile consultare le domande frequenti (FAQ) su www.opencoesione.gov.it/FAQ/