Open Data Day : les membres d’Etalab présentent leurs jeux de données préférés

image de couverture pour l’article sur la journée mondiale des données ouvertes

Nous célébrons aujourd’hui la journée de l’open data, aussi appelée Open Data Day. Pour l’occasion, nous avons demandé aux membres d’Etalab, le service en charge de l’ouverture des données publiques, de nous citer leur jeu de données préféré. Voici leurs réponses.


Laure Lucchesi

Responsable de la mission Etalab

J’ai choisi de mettre en valeur les données ouvertes dans le cadre du Grand Débat, afin de souligner l’importance de la mise à disposition en open data des données anonymisées parallèlement aux démarches de consultations. La publication de ces données permet d’analyser en profondeur les dynamiques à l’oeuvre dans les consultations, d’en favoriser la loyauté, d’y détecter des anomalies, et permet à la société civile ou aux chercheurs d’apporter des éclairages utiles.

Une première ouverture de données de consultation avait eu lieu lors de l’élaboration de la Loi pour une République, un hackathon avait même été organisé pour explorer les données ainsi recueillies.

Les données des réunions locales et de la plateforme de contribution en ligne granddebat.fr, dont l’ampleur est inédite, ont été publiées par le Service d’Information du Gouvernement, et permettent déjà de voir émerger des analyses sur la géographie des contributions par exemple, ou des outils citoyens d’annotation collaborative comme le projet « Grande Annotation ».

Voir les données du Grand Débat National

Paul-Antoine Chevalier

Data Scientist

Publiées pour la première fois en 2018, par la direction générale des finances publiques, les données du compte général de l’État donnent une vision fine de la comptabilité de l’État. Elles permettent notamment de croiser la nomenclature comptable de l’État, les ministères porteurs, et les programmes budgétaires. On y apprend pa exemple combien l’État dépense pour son électricité, son eau, ses fournitures de bureaux, et ce à l’Euro près. C’est très précis. Bien qu’elles aient fait l’objet d’un hackathon (Datafin en juin 2018), ces données gagneraient à être plus souvent exploitées selon moi.

Voir les données du compte général de l’État

Bastien Guerry

Référent logiciels libres

Mon jeu de données préféré contient une liste des dépôts de codes sources publiés par des organismes publics. Ce jeu de données me plaît car il montre que l’administration publie déjà beaucoup de code. Avec les métadonnées collectées sur ces dépôts, on peut déjà proposer des analyses intéressantes : c’est ce qu’a fait Antoine Augusti, ancien Entrepreneur d’intérêt général, dans un article publié sur son blog.

Voir la liste des codes sources

Antoine Augusti

Software Engineer (développeur)

En matière d’ouverture des données, je trouve l’initiative de la SNCF intéressante. D’abord, parce que la SNCF est un EPIC, c’est-à-dire un Établissement Public Industriel et Commercial, ensuite, parce que leur site d’open data contient des données sur le personnel de la SNCF, comme la rémunération, l’âge, ou les congés. Il y a même un jeu de données sur les objets trouvés, mis-à-jour plusieurs fois par jour. On peut compter le nombre de doudous perdus. Ça change.

Voir l’initiative de la SNCF

Romain Tales

Responsable du pôle données

Mon jeu de données préféré est le fichier de recensement des éléments d’imposition à la fiscalité directe locale (REI). Dit comme ça, c’est à peine excitant. Mais ce jeu de données offre un panorama de la fiscalité directe locale, pour plusieurs taxes (taxe d’habitation, cotisation foncière des entreprises) et pour plusieurs niveaux de collectivités bénéficiaires (commune, département, région). J’aime assez ce jeu de données car il permet de se rendre compte des impôts payés à l’échelle locale.

Voir les données de la fiscalité directe locale

Simon Chignard

Conseiller stratégique

Mon jeu de données préféré c’est celui des interventions d’assistance et de sauvetage coordonnées par les CROSS (Centres régionaux opérationnels de surveillance et de sauvetage).

J’aime ce jeu de données pour de nombreuses raisons :

  1. La première est la thématique : le secours en mer, et plus généralement l’activité maritime, un sujet qui me parle compte tenu de mes origines familiales et géographiques.
  2. La seconde est liée à la richesse et à la qualité des données et de leur mise à disposition : le jeu de données est accompagné d’une documentation complète qui indique aussi bien le contexte de production des données que le modèle de données de manière détaillée.
  3. Enfin, il me semble que ce jeu de données illustre bien l’intérêt de la démarche EIG et du travail « en mode ouvert ». Il a été construit dans le cadre du projet Prédisauvetage et est remis à disposition de chacun pour être réutilisé. La presse régionale a d’ailleurs déjà commencé à s’en saisir…
  4. Une carte permet de rendre compte visuellement des données : carte.snosan.fr.
  5. Les données sont mises à jour quotidiennement, sans intervention humaine. Concrètement, si le CROSS intervient aujourd’hui pour un sauvetage en mer, l’intervention sera indiquée dès demain dans le jeu de données.

Voir les données des opérations de sauvetage

Brice Boulesteix

Data Editor (data.gouv.fr)

J’aime bien l’histoire et les trains, je ne peux donc qu’apprécier les archives de la SNCF, puisqu’elle se situent à l’intersection des deux. On y trouve d’anciennes cartes ferroviaires, de vieilles photographies qui sentent bon la vapeur, mais aussi des affiches, des grilles de tarifs, des vidéos et même des sons. Toutes les archives sont rangées, classées, organisées par thèmes, ce qui permet d’y naviguer facilement et de faire des recherches par mots-clefs.

Voir les archives de la SNCF

Mathilde Bras

Responsable du programme EIG

J’ai un faible pour la liste des gares européennes publiée par Trainline. Ce jeu de données me plaît, car j’aime prendre le train. Je suis fascinée par ce moyen de transport, à la fois écologique et scénique, puisqu’il permet de vivre le voyage au travers de paysages et de moments toujours inédits. Au-delà des trains, les gares sont aussi pour moi des endroits fabuleux, chargés d’histoire, d’architecture, et qui réunissent des personnes tous les jours (sans qu’elles ne s’en rendent toujours compte). J’aime aussi ces données parce qu’elles montrent que des acteurs privés (Trainline n’est pas une entreprise publique) peuvent rentrer dans une démarche d’ouverture de données — et contribuer ainsi à l’intérêt général.

Voir la liste des gares européennes


Explorez plus de 30 000 jeux de données sur data.gouv.fr.