Le samedi 30 novembre, en clôture de la semaine de l’innovation publique, l’équipe d’Etalab participait au hackathon « A l’asso des données ». Objectif du hackathon : mieux comprendre le paysage associatif en exploitant les données ouvertes – ou en « open data ». Un cas d’usage passionnant à explorer, porté par le Mouvement associatif et le Comité National de Liaison des Régies de Quartier et soutenu par Latitudes.
Pourquoi faire un hackathon sur les données des associations ?
En novembre 2018, Etalab faisait une présentation à un groupe d’acteurs associatifs sur l’open data et comment cela pouvait servir l’intérêt général. Cette présentation théorique a soulevé une question très pratique : comment l’open data peut servir les associations dans l’exécution de leurs missions, concrètement ?
Pour explorer les besoins et usages, Etalab a suggéré d’organiser une journée sous un format « hackathon ». Deux acteurs associatifs se sont emparés du projet : le Mouvement associatif et le Comité National de Liaison des Régies de Quartier. Ils ont centré le projet autour d’une thématique : la vie associative (sources de financement, nombre d’associations, domaines dans lesquelles celles-ci agissent, etc.). L’objectif était d’imaginer des utilisations à partir de données ouvertes pour rendre concret l’apport de l’open data pour les associations.
« L’objectif de ce hackathon était de faire la démonstration de ce qu’est l’open data et comment cela peut être mobilisé utilement au service des projets. »
Ahmed El Khadiri – Responsable développement et animation du réseau au Mouvement associatif
Quels étaient les projets proposés ?
Les participants avaient le choix entre 3 sujets, porté chacun par un acteur du monde associatif :
- Zoom géographique sur les associations dans la région Pays de la Loire : quelles subventions reçoivent les associations ? Comment se répartissent-elles sur le territoire ? Le sujet était porté par Le Mouvement associatif et visait à exploiter les données de subventions versées par les départements des Pays de la Loire ;
- Marchés publics et associations : les associations sont de plus en plus financées par des contrats passés avec des entités publiques, qui contiennent des clauses sociales et environnementales. Quelles informations nous donnent les données existantes sur le sujet ? Le sujet était porté par le Comité National de Liaison des Régies de Quartier et de Territoire et se proposait de plonger dans les données essentielles de la commande publique ;
- Visualisation du tissu associatif en France : le tissu associatif en France est très dense. Quels évènements sont proposés et animés chaque jour par les acteurs associatifs et comment représenter ces données ? Le sujet était porté par Transiscope et tournait autour de données agrégées par l’association.
Quelles données exploiter ?
La réussite d’un hackathon est directement liée à l’apport de données, domaine dans lequel Etalab a appuyé les organisateurs de l’événement. L’équipe a ainsi recensé les jeux de données ouverts qui concernaient la vie associative. Outre les jeux de données spécifiques aux trois défis proposés, elle a rassemblé et mis à disposition sur une page spécifique de data.gouv.fr des jeux de données « socles » tels que le registre national des associations (RNA), les fichiers consolidés des données essentielles de la commande publique (DECP) ou encore la base Sirene des entreprises et de leurs établissements (SIREN, SIRET).
Etalab a également proposé un focus sur un thème et un territoire particulier : les subventions directes accordées aux associations de la région Pays de la Loire. Certains départements avaient déjà publié en open data le montant des subventions supérieures à 23 000 euros accordées aux associations, conformément à l’obligation légale de publication. Etalab a contacté et accompagné les autres départements dans leur démarche de publication. Une fois ces données mises à disposition en open data, l’équipe d’Etalab a travaillé au formatage et à l’agrégation des différents jeux de données, afin de proposer un ensemble de données cohérent et facilement exploitable.
Retrouver l’ensemble de ces données sur la page data.gouv.fr
Quelles réalisations produites et quels usages imaginés ?
Groupe 1 : vie associative en Pays de la Loire
Ce qui a été fait : Le groupe s’est posé plusieurs questions : comment rendre visible le tissu associatif pour différents publics ? est-ce que la quantité des subventions est corrélée à la densité des associations ? quel est l’impact des subventions ? Dans un premier temps, le groupe a fait un travail d’affichage des données en proposant des visualisations spatiales de la distribution des associations sur le territoire et de la localisation des associations. Il a ensuite imaginé le croisement de ces données avec des données socio-économiques pour mesurer l’impact des subventions.
L’avis du jury : Le jury a salué ce pas de côté qui a permis de constater que le croisement de données pouvait servir à enrichir et argumenter les actions de plaidoyer des associations. Les participants, eux, ont souligné le fait que les données pouvaient servir à de nombreux publics – associations, citoyens, décideurs publics, entreprises – mais qu’elles devaient encore être nettoyées et harmonisées. Les jeux de données présentaient différents niveaux de granularité, ce qui ne facilitait pas le croisement et l’exploitation des données. Par ailleurs, les participants poussent à approfondir le travail d’analyse des données.
« C’était très enrichissant de découvrir le monde associatif, et ce grâce à de belles rencontres. »
Cristian Perez Brokate – Data scientist, participant du groupe 1.
Pour en savoir plus sur les données utilisées, voir les visualisations et découvrir les usages imaginés, consultez les slides du groupe 1.
Groupe 2 : associations et commande publique
Ce qui a été fait : La commande publique est un sujet complexe que les participants se sont attelés à comprendre. Les « mentors métiers » des Régies de quartier ont joué un rôle essentiel à cette étape. Au-delà de la complexité inhérente au sujet de la commande publique, l’utilisation des données soulève également de nombreux défis, du point de vue de la qualité des données et de leur complétude. Les données de la commande publique étant complexes à exploiter, le groupe a donc imaginé ce qu’il serait possible de faire avec un peu plus de temps… et de données : trouver les plus gros financeurs d’associations ou encore trouver les associations qui bénéficient le plus de marchés publics, par exemple.
L’avis du jury : Ce défi a mis en évidence une étape essentielle pour les associations et qui s’est dessinée en creux tout au long de la journée : cartographier les données qui ne sont pas encore ouvertes et qui leur seraient utiles. Quant aux participants, ils ont particulièrement apprécié de pouvoir monter en compétence sur la question de la commande publique.
« On voit qu’il y a aussi une nécessité de faire comprendre à ceux qui produisent et ouvrent les données de la commande publique quel est l’objectif derrière le partage de données. »
Tarek Daher – Délégué général du Comité National de Liaison des Régies de Quartier
Pour en savoir plus sur usages imaginés, consultez les slides du groupe 2.
Groupe 3 : événements de la vie associative
Ce qui a été fait : le groupe a travaillé sur la manière dont on pouvait rendre visible les événements proposés par le tissu associatif français. Il s’est penché sur deux aspects :
- visuel, en imaginant l’interface qui permettrait de présenter les événements ;
- technique, en travaillant sur l’infrastructure servant de base à l’interface.
L’avis du jury : Le jury a souligné que le travail réalisé était particulièrement actionnable, puisqu’il préfigure les prochains développements de Transiscope. Il a également permis de mettre les porteurs de projets en contact avec des soutiens inestimables comme des membres d’Open Street Map sur les sujets de cartographie et d’ouverture.
Dès que nous les aurons, nous mettrons à disposition les slides du groupe 3.
Le secret de la réussite du hackathon ?
La plupart des réalisations du hackathon restent exploratoires, ce qui n’est pas étonnant : une journée de travail, même intense, reste peu pour aller au fond des sujets ambitieux abordés lors de l’événement. Cependant, la journée a permis de sensibiliser différents profils aux enjeux des associations et de l’open data. Les retours des participants confirment également qu’il est indispensable de préparer et de documenter les données à exploiter le jour J, notamment quand elles touchent à des domaines complexes.
« L’ambiance générale, l’état d’esprit étaient très agréables : tout le monde était dans un mode coopératif. Le plus intéressant c’était peut-être la diversité des profils. Les uns comme les autres ont progressé sur différents sujets : techniques, connaissance du monde associatif, de la commande publique… »
Ahmed El Khadiri – Responsable développement et animation du réseau au Mouvement associatif