En amont de l\u2019\u00e9v\u00e8nement, des jeux de donn\u00e9es portant sur des th\u00e9matiques susceptibles d\u2019inspirer les participants ont \u00e9t\u00e9 propos\u00e9s ici<\/a>, parmi lesquels des donn\u00e9es ouvertes r\u00e9cemment sur data.gouv.fr<\/a>. Dans ce cadre, des datascientists, des codeurs, des chercheurs, et des designers ont travaill\u00e9 ensemble, accompagn\u00e9s de membres de l\u2019\u00e9quipe d\u2019Etalab.<\/p>\n Voici la pr\u00e9sentation des projets issus d’une journ\u00e9e de travail \u00e0 l\u2019open data camp :<\/p>\n L’\u00e9quipe Sopra Steria, conseill\u00e9e par Mich\u00e8le Dreschsler (Inspectrice IEN et Conseill\u00e8re TICE aupr\u00e8s du recteur d’Orl\u00e9ans-Tours), a con\u00e7u et r\u00e9alis\u00e9 l’application CartoPedago<\/a>. Il s\u2019agit d\u2019une application permettant aux enseignants de d\u00e9couvrir les activit\u00e9s et les sorties en lien avec leur programme p\u00e9dagogique. L’interface, permet de s\u00e9lectionner dans un premier temps l’\u00e9tablissement scolaire et la classe de l’enseignant puis visualiser l’ensemble de l’offre de service g\u00e9o-localis\u00e9e, en raffinant la recherche \u00e0 l’aide de filtres. Un module permettant de noter les activit\u00e9s a \u00e9galement \u00e9t\u00e9 d\u00e9velopp\u00e9 pour permettre aux enseignants de partager leurs exp\u00e9riences.<\/p>\n Voici les jeux de donn\u00e9es utilis\u00e9s, disponibles sur data.gouv.fr<\/a>:<\/p>\n – Les lieux de diffusion du spectacle vivant en \u00cele-de-France<\/a> <\/a>\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/a><\/p>\n La premi\u00e8re fonctionnalit\u00e9 du projet Open-Carburants d\u00e9velopp\u00e9e lors de l’Open Data Camp a \u00e9t\u00e9 un comparateur de stations-services autour d’une adresse. Ceci a \u00e9t\u00e9 possible gr\u00e2ce au croisement de 3 sources de donn\u00e9es ouvertes :<\/p>\n – L\u2019adresse a \u00e9t\u00e9 g\u00e9o-cod\u00e9e gr\u00e2ce \u00e0 la Base Adresse Nationale<\/a> <\/a>\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 <\/a><\/p>\n Le travail autour de ces donn\u00e9es de transport a mis en \u00e9vidence des pistes d’usage possibles:<\/p>\n – Le calcul de la meilleure station-service sur un itin\u00e9raire gr\u00e2ce \u00e0 la fonction match<\/a> d’OSRM. Le Minist\u00e8re de l’Int\u00e9rieur a r\u00e9cemment publi\u00e9 les r\u00e9sultats \u00e9lectoraux par bureau de vote depuis 1999<\/a>. Pour permettre une repr\u00e9sentation cartographique de ces r\u00e9sultats et illustrer les contours des bureaux de vote, il est n\u00e9cessaire de disposer des adresses des inscrits \u00e0 chaque bureau de vote. Ces donn\u00e9es ne sont pas actuellement disponibles en open data sur l’ensemble du territoire, mais quelques collectivit\u00e9s les ont publi\u00e9es lorsqu’elles \u00e9taient disponibles sur leur portail open data.<\/p>\n Les donn\u00e9es de d\u00e9part sont donc les listes \u00e9lectorales de 4 d\u00e9partements, dans lesquelles les donn\u00e9es personnelles ont \u00e9t\u00e9 supprim\u00e9es pour ne conserver que l’adresse, le num\u00e9ro de bureau de vote, de canton et le code INSEE de la commune. Elles ont ensuite \u00e9t\u00e9 g\u00e9ocod\u00e9es \u00e0 l’aide de l’API publique de g\u00e9ocodage mise en place par Etalab sur le portail de la Base Adresse Nationale.<\/a><\/p>\n Les tentatives de dallage de chaque bureau de vote n’ont pas donn\u00e9 de r\u00e9sultat exploitable (trop de chevauchement dans les polygones g\u00e9n\u00e9r\u00e9s), c’est donc le \u00ab\u00a0centroid\u00a0\u00bb des adresses des inscrits qui a \u00e9t\u00e9 calcul\u00e9 pour symboliser leur localisation, et permettre une visualisation cartographique des r\u00e9sultats par bureau de vote. La pr\u00e9sentation des r\u00e9sultats est disponible ici<\/a>.<\/p>\n <\/a>\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 \u00a0 \u00a0 \u00a0\u00a0 \u00a0 <\/a><\/p>\n Les consultations men\u00e9es en ligne par les administrations engag\u00e9es dans une d\u00e9marche de gouvernement ouvert g\u00e9n\u00e8rent des contributions parfois massives, difficiles \u00e0 analyser rapidement par des \u00eatres humains. L\u2019objectif du projet \u00e9tait ici de tester des pistes d\u2019automatisation de cette analyse, \u00e0 partir des techniques de text-mining<\/em>.<\/p>\n Pour commencer, les contributions recueillies sur le site de la consultation du \u2018Projet de loi pour une R\u00e9publique num\u00e9rique\u2019<\/a> ont \u00e9t\u00e9 moissonn\u00e9es<\/a> en utilisant l\u2019API JSON du site. L’\u00e9volution heure par heure des contributions sur les 4 derniers jours de la consultation a ainsi \u00e9t\u00e9 rendue disponible dans un d\u00e9p\u00f4t git<\/a>, accessible \u00e0 tous.<\/p>\n Puis, des statistiques descriptives ont \u00e9t\u00e9 d\u00e9velopp\u00e9es en guise d’analyse exploratoire des donn\u00e9es. Ci-dessous, un comparatif, pour les 20 articles les plus comment\u00e9s, du score \u2018brut\u2019 en rouge ((arguments pour – arguments contre) \/ (arguments pour + arguments contre)) avec le score \u2018normalis\u00e9\u2019 en bleu (en tenant compte du nombre total de personnes ayant comment\u00e9 l\u2019article), qui permet de donner un score plus repr\u00e9sentatif.<\/p>\n <\/a><\/p>\n Par ailleurs, le module pattern<\/a> pour Python a \u00e9t\u00e9 utilis\u00e9 pour g\u00e9n\u00e9rer des nuages de noms et d\u2019adjectifs <\/a>correspondant aux arguments pour et contre les articles propos\u00e9s pour le gouvernement, l\u2019objectif \u00e9tant d\u2019identifier les th\u00e9matiques r\u00e9currentes des partisans et des opposants au projet de loi. Voici quelques exemples de r\u00e9sultats, dont il faut rappeler qu’ils d\u00e9pendent des r\u00e8gles choisies par l’\u00e9quipe dans l\u2019algorithme de filtrage des donn\u00e9es (par exemple m\u00e9thode de calcul de l’importance des mots, suppression des termes communs aux contributions favorables et d\u00e9favorables…).<\/p>\n Pour:<\/p>\n <\/a><\/p>\n Contre:<\/p>\n\n
\n– Rendez-vous aux jardins<\/a>
\n– Les Etablissements \u00ab\u00a0Tourisme & Handicap\u00a0\u00bb<\/a>
\n– Adresse et g\u00e9olocalisation des \u00e9tablissements d’enseignement du premier et second degr\u00e9<\/a><\/p>\n\n
\n– Les stations-services, leur g\u00e9olocalisation et leur prix ont \u00e9t\u00e9 r\u00e9cup\u00e9r\u00e9s de la base \u2018Prix des carburants<\/a>\u2019
\n– Les distances et temps de parcours vers les stations-services les plus proches ont \u00e9t\u00e9 calcul\u00e9s gr\u00e2ce \u00e0 Open source routing machine<\/a>, un moteur de calcul d’itin\u00e9raire open source reposant sur les donn\u00e9es OpenStreetMap<\/a>.<\/p>\n
\n– Le calcul \u00e9missions de CO2 et polluants gr\u00e2ce \u00e0 l’int\u00e9gration des donn\u00e9es de l’ADEME<\/a> sur les v\u00e9hicules commercialis\u00e9s en France.
\n– Le rendu d’informations sur l’origine, l’acheminement et le traitement des hydrocarbures contenus dans les carburants gr\u00e2ce au croisement des donn\u00e9es issues des Douanes Fran\u00e7aises<\/a>, de Marine Traffic <\/a>et du Minist\u00e8re de l’Ecologie du D\u00e9veloppement Durable et de l’Energie<\/a>.<\/p>\n\n
\n