Le 19 décembre dernier, lors du Chat Express.fr, Séverin Naudet, directeur de la mission Etalab, répondait aux questions des internautes
désireux d’en savoir plus sur les fonctionnalités et les possibilités offertes par l’ouverture de Data.gouv.fr. Licence ouverte, jeux de
données, réutilisation et avenir de l’Open Data ont été au centre des débats:
Stanm: J’ai cherché des renseignements sur la licence des données open data mais je n’ai pas trouvé. Que veux dire licence libre? A-t-on le droit par exemple de créer une base de données
performante avec ces données et faire payer son accès?
Tu trouveras la « licence ouverte » sur http://www.data.gouv.fr/Licence-Ouverte-Open-Licence. Oui, toutes les réutilisations sont possibles dans les conditions
prévues par la licence.
Tdudouet: Bonjour Séverin, aucun document ne semble concerner les Marchés Publics, qui sont censés l’être par définition. Le tir sera-t-il bientôt rectifié?
Ca fait partie des jeux de données sur lesquels on travaille.
Peredom: Avez-vous des partenaires qui proposent le re-traitement, le recoupage et le partage des données ouvertes? Sinon êtes-vous favorable à une telle collaboration?
Je suis favorable à toutes les réutilisations qui créent de l’activité, comme le font déjà Data Publica ou QUNB.
Fabrice: Est-ce qu’un site open-data européen est prévu? Et un site open-data mondial?
Neelie Kroes, vice-présidente de la Commission européenne, a annoncé la mise en ligne en 2012 d’une plate-forme des données de la commission. Je crois qu’il est aussi question à terme d’une
plate-forme regroupant les données des États membres.
Topinambeur: Il semble y avoir un petit cafouillage en terme de formats de données. En Conseil des ministres, le gouvernement avait souhaité que soient utilisés des formats ouverts et non des
formats propriétaires (aujourd’hui majoritaire sur data.gouv.fr). Dans vos prises de parole publique, vous semblez faire la confusion entre ces deux concepts importants aux yeux de beaucoup de
réutilisateurs. Quel est d’après vous la différence entre formats ouverts et formats propriétaires? Quelle définition faites-vous du terme « Format Ouvert »?
Le véritable enjeu c’est de rendre accessible les informations publiques, c’est d’abord ça l’open data, c’est ce que permet data.gouv.fr. Les rendre accessible dans des formats ouverts et libres à
l’échelle de l’Etat, c’est une question d’amélioration du service et ça prend du temps, on a commencé.
Topinambeur: data.gouv.fr affirme mettre à disposition 300 000 jeux de données. Plusieurs organisation, dont Data Publica, ont analysé ce chiffre et démontré qu’il n’y avait, au maximum, que 1700
jeux de données disponibles. Comment expliquez-vous cette différence?
data.gouv.fr met à disposition 352 000 jeux de données. Voilà ce qui dit en fait l’article de Data Publica:
Citation de l’article:
« Nous avons étudié l’ensemble des données accessibles sur le portail data.gouv.fr pour les référencer. Nous avons été impressionnés par la quantité de données disponibles: avec 352 000 jeux de
données, le portail de l’administration française fait presque aussi bien que son concurrent américain en trois ans et ses 390 146 jeux de données et bien mieux que son concurrent anglais
data.gov.uk qui culmine à environ 7000 jeux de données. »
Il y a en bien 352 000 fichiers disponibles sur data.gouv.fr, qu’ils soient référencés ou hébergés. Ce qui est important c’est la qualité du service et son contenu. Auparavant, il n’y avait juste
pas de plate-forme des données publiques en France.
Stanm: Bonjour, y a-t-il un projet de mise à disposition des open-data via une API pour les développeurs. Et qu’en est-il des mises à jour?
Oui, on y travaille actuellement avec la communauté. Les données seront mises à jour régulièrement.
Louis: Aura-t-on enfin des informations plus complètes sur des sujets sensibles, par exemple les chiffres du chômage?
Tu trouves sur data.gouv.fr le nombre de demandeurs d’emploi inscrits à Pôle Emploi chaque mois, par département, par catégorie d’âge et de durée du chômage, depuis 1997.
Léa: Avant Etalab, huit collectivités territoriales ont ouvert une partie de leurs données. Envisagez-vous une centralisation de toutes les plates-formes?
Les collectivités locales sont libres de faire de l’open data, mais je les invite à nous rejoindre et data.gouv.fr est à leur disposition pour rendre accessible toutes leurs données.
Emilien: Les différents ministères sont-ils tous impliqués dans ce projet? Y a-t-il des réfractaires? Avez-vous besoin de la coopération d’autres services pour mettre le site à jour?
Oui, bien sûr! Les administrations ont fait un travail formidable pour permettre la mise en ligne de data.gouv.fr, avec énormément de données nouvelles.
Agnès: Quelles sont les données « sensibles » qui ne sont pas mises en ligne sur le site data.gouv.fr?
Les données personnelles, qui sont bien sûr protégées, les données protégées par le secret des affaires, le secret fiscal…
Sylvain: Bravo pour ce beau début avec un bon paquet de données! Sera-t-il possible à une personne lambda de réaliser des demandes d’accès à des données publiques? A priori, les données demandées
sont celles qui, potentiellement, créeront le plus de valeur, puisque au moins une personne souhaite les exploiter. Avez-vous prévu un dispositif spécial à cet effet?
Merci! 🙂 Il y aura, dans une prochaine version, des fonctionnalités collaboratives et d’échange. Nous rendrons accessibles le plus de données possibles au fur et à mesure.
Mrs. Robinson: Donnerez-vous des « clés » pour lire les data publiées? Car diffuser des données brutes manque un peu d’intérêt pour le grand public…
La documentation des données sera améliorée au fur et à mesure.
Ceecee: Bonjour, peut-on savoir quelles données vont véritablement être libérées? Et sous quelle forme?
J’ai déjà répondu 2 ou 3 fois à cette question 🙂 Budget, environnement, santé, sécurité, etc. Vous retrouvez tout sur data.gouv.fr, sous forme de fichiers bruts et réutilisables.
Léa: Bonjour, tout d’abord merci pour les efforts et l’avancée que constitue l’ouverture de cette plate-forme Ma question est la suivante: y aura-t-il un dialogue avec les utilisateurs, notamment
les développeurs, pour récolter leurs suggestions et pouvoir améliorer la plate-forme dans le futur?
Oui! Il y a eu déjà plusieurs workshop sur ces sujets, ouverts à tous (inscription sur etalab.gouv.fr), ce qui a permis de concevoir la version actuelle en répondant au mieux aux attentes des
réutilisateurs et aux contraintes des producteurs. Il y en aura beaucoup d’autres, on vous attend.
Polochon: Donner des informations, c’est bien. Mais comment être sûr que vous ne cacherez pas celles qui pourraient être gênantes pour les gouvernement?
La définition de l’information publique est donnée par la loi de 1978, révisée en 2005. Nous sommes dans un État dans de droit. La CADA permet à chaque citoyen de déposer un recours si une
administration ne répondait pas à sa demande. data.gouv.fr rendra accessible le plus de données publiques possible.
AA: L’open data est sans doute aujourd’hui ce que le e-commerce était il y a 10 ans. Nous n’en sommes qu’au début mais, avec le recul sur les initiatives de nos amis britanniques et américains,
n’êtes-vous pas déçu par la valeur ajoutée des applications sorties à l’étranger?
L’impact économique et social de la réutilisation des données sera systémique, les études commandées par la Commission européenne chiffrent cet impact à 140 milliards d’euros par an. En réalité, le
marché global des données va permettre d’enrichir des milliers de services existants avant même de permettre la création d’applications propres.
Freudon: Ouvrir les données publiques n’est-il pas dangereux? Comment allez-vous contrôler qu’elles ne sont pas mal utilisées?
La loi permet déjà l’accès aux informations publiques aux citoyens qui en font la demande. Aujourd’hui, data.gouv.fr marque le passage à une logique d’offre voulue par le gouvernement. Cela
permettra à chacun d’évaluer les politiques publiques. data.gouv.fr contribue à rendre des comptes aux citoyens. Cela participe par ailleurs à soutenir le développement de l’économie numérique.
C’est une cercle vertueux.
Boloré: Que pensez-vous de l’opération Wikileaks? Considérez-vous qu’il s’agisse là aussi open data?
L’open data est l’ouverture des données publiques, pas des données personnelles ni des données protégées pour des raisons de sûreté qui garantissent la sécurité des biens et des personnes.
Cixi: Ce site représente-il une réelle avancée ou bien se contente-t-il d’agréger des données déjà disponibles sur différents sites ministériels et administratifs?
Rendre accessible en un point identifié et facile d’accès ces données est déjà un progrès en soi. Permettre leur réutilisation gratuite est aussi une avancée. Beaucoup de données sur data.gouv.fr
n’étaient pas accessibles et encore moins réutilisables jusqu’ici. C’est un engagement inédit de transparence de l’État.
Curieuse: Qu’y a-t-il exactement dans ces bases de données?
Il y a des données sur le budget de l’État, sur l’environnement, la santé, la sécurité, la justice, l’agriculture, les transports, je vous invite à aller les découvrir sur data.gouv.fr.
Denis: Quel avenir pour ÉtaLab, data.gouv.fr et open data en France après juin 2012?
L’ouverture des données est lancée, c’est un enjeu démocratique. La mise en ligne de data.gouv.fr contribue à une plus grande transparence et constitue un impératif de toutes les grandes
démocraties. Il me semble de ce point de vue que c’est irréversible pour des Etats modernes, qui doivent répondre à de nouvelles exigences de transparence, notamment crées par Internet.
Fabien: Pourquoi avoir divisé les données de l’INSEE commune par commune (36000) et donc transformé 6 jeux de données en plus de 280 000 (sur les 350 000 de data.gouv.fr)? Pour réaliser un travail
sur les données complètes à l’échelle française, il faut télécharger un à un ces centaines de milliers de fichiers ou « scrapper » data.gouv.fr? Mais alors quel progrès par rapport au site de
l’INSEE?
Les données sont mises à disposition par collectivité, telles que l’INSEE les produit. Ca permet de trouver des données pour chaque collectivité. Par ailleurs la base de données des chiffres clés
du recensement est aussi disponible intégralement dans un seul fichier.
Fabien: Bonjour, la plupart des fichiers sur data.gouv.fr sont au format Excel et donc non-lisibles par les machines sans travail manuel préalable, avec dans le pire des cas le souci de devoir
jongler entre des feuilles, se débarrasser de la mise en forme… Lisible par le quidam, mais difficilement réutilisable et donc pas très « Open Data »… À quand des formats ouverts?
Ces données n’étaient souvent pas accessibles avant, c’est donc un progrès. Nous avons rendu accessible des données déjà produites dans ces formats par les administrations. C’est surtout ça open
data, rendre accessible des données brutes telles que les administrations les produisent. C’est aussi ça qui permet la gratuité de la réutilisation des données quelle que soit la destination, y
compris commerciale. Harmoniser la production des données et favoriser les formats ouverts est très important, mais c’est un travail de long terme. Les formats XLS ou XLSX sont lisibles notamment
par Open office et réciproquement les fichiers au format ODS sont pris en charge par Excel. Il y a aussi dans data.gouv.fr des fichiers CSV, XML, RDF…
Iv: À une réunion OpenData69, qui cherche à ouvrir les données de la ville de Lyon, on a parlé d’un coût pour data.gouv.fr qui serait de 3 millions d’euros. Confirmez vous ce chiffre? Que
répondez-vous aux critiques qui ne voient qu’une remise en forme des données déjà fournies par l’INSEE?
Nous avons précisément dépensé 900 000 euros hors taxe à ce stade, c’est le même ordre de grandeur que pour les autres projets « open-data » de pays comme les Etats-Unis ou la Grande Bretagne.
Beaucoup de chiffres fantaisistes circulent. Il y a beaucoup plus de données que les seules données de l’INSEE, sur énormément de sujets importants, comme: le budget de l’Etat, l’environnement, la
sécurité publique, la santé, la justice… et des données qui n’avaient jamais été rendues accessibles et réutilisables. Les données de l’INSEE telles qu’elles sont accessibles sur data.gouv.fr
permettent par une simple recherche à chaque citoyen d’accéder à des données sur l’emploi, le logement et la population pour chaque commune, chaque département, chaque région. Ces données sont très
importantes, notamment pour permettre de les compiler avec les autres données présentes.
C’est encore une fois un début, data.gouv.fr rendra accessible le plus de données possibles dans les mois et les années à venir.
Benoit: Ce n’est pas une question mais un compliment, j’ai enfin trouvé sur ce site une liste d’entités agréées qui était introuvable sur le site du ministère de l’Agriculture. C’est un très grand
progrès.
Merci Benoit, data.gouv.fr a déjà permis en effet de rendre accessible de nombreuses données, même s’il s’agit que d’un début. C’est une première étape, la plate-forme rendra accessible au fur et à
mesure le plus de données possibles.