Retour sur l’Open Data Maturity Index 2021 : Qualité des données ouvertes (4/4)

En 2021, la France a confirmé sa position de leader européen en matière d’open data, en atteste le classement de l’Open Data Maturity Report 2021 de la Commission européenne, qui a placé la France à la première place devant l’Irlande et l’Espagne.

L’Open Data Maturity Report 2021 évalue les progrès réalisés par les pays européens selon quatre critères :

  • maturité des politiques publiques relatives à l’ouverture (Policy) ;
  • qualité de la mesure de l’impact de l’open data (Impact) ;
  • maturité du portail national d’open data (Portal) ;
  • qualité des données ouvertes (Quality).

Ce rapport constate les résultats du travail accompli par Etalab et l’ensemble de la communauté open data et de mesurer le chemin qu’il reste à parcourir. Pour comprendre quels sont nos points forts et nos points faibles et identifier nos axes d’amélioration, nous proposons une série d’articles portant chacun sur une des dimensions évaluées par le rapport.

Il ne s’agit pas d’être exhaustif, mais de partager certains des aspects souvent salués en France et les axes d’améliorations les plus souvent évoqués.

Pour finir cette série d’articles, nous nous concentrons aujourd’hui sur la dimension Quality du rapport.

Que cherche-t-on à mesurer ?

Cette dimension se concentre sur la qualité des données ouvertes : utilisation de formats de données ouverts, lisibles par machine, de haute qualité et adaptés à une approche de données liées (linked-data). Elle vise également à évaluer les mesures adoptées par les gestionnaires de portails pour assurer la collecte systématique des métadonnées à partir des autres portails de données ouvertes et situées dans tout le pays, ainsi que la conformité avec la norme de métadonnées DCAT-AP.

Les bonnes pratiques françaises

Accompagner les producteurs dans la publication de données de qualité

Etalab est présent sur l’ensemble des étapes du cycle de vie de la donnée de qualité pour accompagner les producteurs de données.

D’un côté Etalab participe à l’accélération de la création et de l’usage de schémas de données et les valoriser à travers l’outil schema.data.gouv.fr car la création d’un jeu de données conforme à un schéma de données facilite l’interopérabilité, le croisement et l’agrégation des données.

De la même manière, afin de favoriser l’émergence de nouvelles données obéissant à un schéma, nous avons mis a disposition un nouvel outil  : publier. etalab. studio qui a pour ambition d’accompagner un producteur de données sur la saisie, la validation et la publication de ses données.

Une licence commune

La France dispose d’une licence ouverte élaborée pour permettre aux réutilisateurs de comprendre plus facilement leurs droits et obligations. Face à la profusion de licences, dont le contenu était parfois très hétérogène et pouvait nuire au croisement des jeux de données, la loi pour une République numérique limite le choix des licences auxquelles les administrations peuvent recourir.

Les axes d’améliorations

L’amélioration de la qualité générale des données

La qualité des données ouvertes que ce soit au niveau des formats, de la documentation, de la structure et du contenu des fichiers peut encore largement progresser. Le respect de standards, référentiels et schémas déjà établis ainsi que la présence de données et colonnes pivots pour lier les données à un référentiel doit devenir la norme sur la plateforme.

Création d’un label jeux de données de qualité

Les jeux de données de qualité entraînent naturellement une plus grande réutilisation et de nouveaux usages. Il est par conséquent nécessaire de valoriser ces données afin de favoriser leur réutilisation et inciter les autres acteurs à produire des jeux de données de qualité. Dans cette perspective, Etalab développera un « label qualité » sur la plateforme data.gouv.fr qui valorisera les jeux de données et producteurs vertueux.

La comptabilité avec DCAT peut être améliorée

DCAT est un vocabulaire RDF conçu pour faciliter l’interopérabilité entre les catalogues de données publiées sur le Web. Il s’agit de la norme mise en avant par la Commission européenne et qui est relativement peu utilisée en France. Les efforts de conformité entre Udata, la technologie derrière data.gouv.fr, et DCAT doivent être poursuivis pour faciliter interopérabilité des données à l’échelle européenne.