La mécanique sociale de data.gouv.fr

La nouvelle version du portail data.gouv.fr a été inaugurée le 18 décembre dernier par le Premier Ministre. Parmi les principes qui ont guidé la conception du nouveau datagouv, figurait l’idée de proposer à la multitude de participer à la dynamique d’ouverture des données publiques. Deux mois après sa sortie, nous commencons à voir les premières dynamiques de cet open data social à l’oeuvre. Nous vous proposons une série de 3 billets de blog sur ce sujet. Le premier décrit la mécanique sociale, dans son ensemble.

La plateforme data.gouv.fr propose à ses visiteurs de participer à améliorer la donnée selon différents niveaux d’engagement.

La plate-forme compte aujourd’hui près de 2000 utilisateurs inscrits. L’inscription sur data.gouv est bien sûr gratuite et elle n’est pas obligatoire pour télécharger des jeux de données ou pour naviguer sur l’intégralité du site. Elle permet cependant de participer pleinement à l’amélioration de la donnée.

SafariScreenSnapz140Premier niveau d’engagement: le vote utile. Sur chaque page d’un jeu de données figure une icône en vert qui vous permet de déclarer “utile” un jeu de données. Chaque mois, on recense environ 800 votes sur la plateforme. Le nombre de vote pour chaque jeu de données est affiché entre parenthèses et constitue aussi un repère pour les visiteurs du site. Mais ce n’est pas la seule utilisation de ce vote: outre le fait qu’il vous permet de retrouver vos jeux de données favoris dans votre profil, il intervient aussi pour classer les jeux de données dans le moteur de recherche (les règles du calcul sont consultables sur le wiki).

L’icône rouge permet de signaler un jeu de données. Les signalements peuvent être de plusieurs types: contenu illicite ou tendencieux (rarement utilisé à ce jour), contenu incomplet ou inexact, lien cassé, etc… Tous les signalements sont automatiquement transmis au producteur du jeu de données, qui est invité à répondre directement à l’utilisateur. Faciliter le dialogue entre ceux qui produisent la donnée et ceux qui la réutilisent est aussi l’un des objectifs de data.gouv !

SafariScreenSnapz141Deuxième niveau d’engagement: la possibilité de référencer une réutilisation d’un jeu de données: une visualisation, un article de blog, une application mobile ou web, … Depuis son lancement fin 2013, plus de 800 réutilisations ont été publiées sur datagouv, ce qui améliore leur référencement. Les meilleures réutilsations sont mises en Une du site, sur la page d’accueil. Souvent un bon moyen pour découvrir un jeu de données, elles s’adressent à un plus large public que les seuls réutilisateurs. Elles servent aussi à montrer aux producteurs que les données qu’ils mettent en ligne sont bien utilisées par des tiers, et parfois de manière inattendue. Ainsi, le fichier des voies et lieux-dits de France (Fantoir) qui est utilisé pour révéler les inégalités femmes-hommes dans les noms donnés aux lieux !

SafariScreenSnapz144.pngTroisième niveau d’engagement: améliorer un jeu de données existant. Inspiré par la pratique du fork dans le développement Open Source, la plate-forme permet à tout utilisateur de publier une version améliorée d’un jeu de données publié. Cette fonction est directement issue du dialogue initié par Etalab avec ceux qui réutilisent les données, notamment durant la phase de Co-Design du portail. Bien souvent, les réutilisateurs commencent par nettoyer et améliorer les jeux de données avant de commencer à produire une application ou une visualisation: géocoder une adresse, mettre le fichier dans un format qui permet de le traiter automatiquement, retirer tout élément de mise en forme, … Parfois, ils enrichissent aussi les données, en croisant plusieurs jeux entre eux, à l’image des concepteurs de Musées en France qui mixent différentes sources. Nous leur proposons de re-publier, s’ils le souhaitent, le fruit de leur travail dans la partie “contributions de la communauté” de chaque jeu de données.

AperçuScreenSnapz012Enfin, la plate-forme accueille aussi des jeux de données d’intérêt général qui ne sont pas issus de producteurs du service public. Des associations comme Open Meteo Foundation ou encore Open Street Map proposent ainsi de nombreux jeux de données issus de leurs projets collaboratifs respectifs – par exemple le détail du réseau autoroutier métropolitain. Afin de permettre aux utilisateurs de bien distinguer le type de producteur, nous avons réservé aux seules administrations et collectivités le sceau “service public certifié”.

Dans un prochain billet, nous vous présenterons en détail des exemples d’amélioration de la donnée par les utilisateurs du site.