Service public de la donnée de référence: c’est parti

[:fr]

Six mois après la promulgation de la loi pour une République numérique, le service public de la donnée – prévu par son article 14 – fait ses débuts avec les premières bases de données de référence et le lancement d’un espace dédié sur la plateforme data.gouv.fr : www.data.gouv.fr/reference

Le service public de la donnée vise à mettre à disposition, en vue de faciliter leur réutilisation, les données de référence. Il s’agit des données qui ont le plus d’impact économique et social, et dont la qualité de mise à disposition est critique pour les utilisateurs. C’est le début d’une démarche collective et progressive qui dotera notre pays d’une nouvelle infrastructure de données au bénéfice de l’Etat, des innovateurs et de notre souveraineté.

Les premières bases de données de référence 

Le décret d’application paru le 14 mars 2017 liste neuf bases :

  • le répertoire des entreprises et des établissements (base Sirene)
  • le répertoire national des associations (RNA),
  • le plan cadastral informatisé (« Cadastre »),
  • le registre parcellaire graphique (RPG),
  • le référentiel à grande échelle (RGE),
  • la base adresse nationale (BAN),
  • le répertoire opérationnel des métiers et des emplois (ROME),
  • le référentiel de l’organisation administrative de l’Etat,
  • le code officiel géographique (COG).

La consultation menée par Etalab en octobre 2016 a permis de faire évoluer le dispositif du service public de la donnée à plusieurs niveaux :

D’une part le périmètre a évolué pour passer de 6 à 9 bases et intégrer les bases de données les plus demandées (référentiel de l’organisation administrative, code officiel géographique, ROME).

D’autre part, les répondants ont insisté sur la nécessité que les acteurs du service public de la donnée, et en premier lieu les producteurs et les diffuseurs, s’engagent. Engagements sur la disponibilité des données, leur documentation, la transparence du process de production,…

Un arrêté du Premier ministre va venir dans les prochains jours détailler les niveaux de qualité et de disponibilité attendus, et chacun des producteurs sera amené à publier en réponse ses engagements de service.

Vers une infrastructure de données

Les données de référence ont un grand potentiel d’utilisation par les entreprises et les administrations elles-mêmes, comme en témoigne le succès de la mise en ligne de la base Sirene par l’INSEE qui été téléchargée près de 6000 fois depuis le début de l’année.

Mais pour que ce potentiel puisse s’exprimer au mieux, il faut sécuriser les utilisateurs et leur garantir une qualité de service de niveau industriel. Avec le service public de la donnée, les données de référence seront progressivement traitées comme des infrastructures critiques, l’Etat s’organisant pour en garantir la qualité croissante, la qualité de diffusion, et la rétroaction effective des usagers afin d’en permettre l’amélioration continue. L’Etat reconnaît également la nécessité de leur garantir les attributs du service public : égalité, continuité, mutabilité.

Organisation et évolutions

La mission Etalab a pour rôle de piloter ce nouveau service public, d’en assurer la gouvernance et d’animer le dispositif, en relation avec les producteurs, les diffuseurs et les utilisateurs (voir le détail de l’organisation sur la page www.data.gouv.fr/reference). Nous allons aussi développer des outils et des briques mutualisables pour l’ensemble des jeux de données de référence – notamment autour de la montée en qualité des données.

L’étape franchie aujourd’hui avec la mise en ligne des premières bases de données (dont certaines n’étaient auparavant pas accessibles, comme le Répertoire national des associations) n’est qu’un début. Ce nouveau service va poursuivre sa construction par itération, en y associant l’ensemble des parties prenantes. Les engagements seront ainsi publiés sur le site dédié, et leur suivi sera lui aussi rendu public.

Un fil de discussion est ouvert sur le forum Etalab afin d’échanger sur les évolutions à venir du service public de la donnée.

 

 

 [:]