{"id":10713,"date":"2016-06-17T17:26:18","date_gmt":"2016-06-17T15:26:18","guid":{"rendered":"https:\/\/www.etalab.gouv.fr\/?p=10713"},"modified":"2019-06-18T10:34:28","modified_gmt":"2019-06-18T08:34:28","slug":"opensolarmap-cote-data-sciences-03","status":"publish","type":"post","link":"https:\/\/preprod.etalab.gouv.fr\/opensolarmap-cote-data-sciences-03","title":{"rendered":"OpenSolarMap c\u00f4t\u00e9 data-sciences (0\/3)"},"content":{"rendered":"\n
Le projet OpenSolarMap<\/a>\nd\u00e9montre comment il est possible d\u2019am\u00e9liorer la connaissance du\nterritoire fran\u00e7ais en utilisant astucieusement les ressources de la\nmultitude et des data-sciences. Son objectif concret est de classifier\nles toitures en quatre cat\u00e9gories : orientation nord\/sud; orientation\nest\/ouest ; toit plat ; autre ou ind\u00e9termin\u00e9. Cela permet, par\nexemple, d\u2019\u00e9valuer le potentiel d\u2019installation de panneaux solaires ou\nla possibilit\u00e9 de v\u00e9g\u00e9taliser. Quelques milliers d\u2019exemples ont \u00e9t\u00e9\nrecueillis gr\u00e2ce \u00e0 une plateforme\nde crowdsourcing<\/a>. Puis, des algorithmes ont \u00e9t\u00e9 utilis\u00e9s pour\ncouvrir l\u2019ensemble du territoire. Une pr\u00e9sentation g\u00e9n\u00e9rale\ndu projet<\/a> est accessible sur le blog d\u2019Etalab.<\/strong><\/p>\n\n\n\n Cet article est le premier d\u2019une s\u00e9rie qui pr\u00e9sente la partie\ndata-science du projet. C\u2019est l\u2019occasion de brosser \u00e0 grands traits la\nd\u00e9marche du data-scientist et de faire le tour de quelques techniques\nfr\u00e9quemment utilis\u00e9es. La s\u00e9rie vise avant tout un public technique\nmais non sp\u00e9cialiste. Des r\u00e9f\u00e9rences permettent d\u2019approfondir les\nnotions survol\u00e9es.<\/strong><\/p>\n\n\n\n Le code source \u00e9crit pour le projet OpenSolarMap est accessible sur la\nplateforme GitHub<\/a>. La\npartie data-sciences est contenue dans le repository solml<\/a>.<\/p>\n\n\n\n Nous avons voulu tout d\u2019abord proc\u00e9der \u00e0 une analyse des contributions\nfaites sur l\u2019interface opensolarmap.org<\/a>. Au 21 d\u00e9cembre\n2014, nous disposions de 130.374 contributions, sur 38.553 b\u00e2timents,\npermettant de classifier avec confiance 10.771 b\u00e2timents par un\nsyst\u00e8me de vote. Ces contributions<\/a>\nsont accessibles sur la plateforme data.gouv.fr<\/a>.<\/p>\n\n\n\n L\u2019interface de contribution ne conna\u00eet le contributeur que par son\nadresse IP. Cette adresse IP est ensuite hash\u00e9e pour pr\u00e9server\nl\u2019anonymat. Les contributions proviennent de 1081 utilisateurs.<\/p>\n\n\n\n Certaines contributions portent sur des b\u00e2timents dont on ne connait\npas encore avec certitude la vraie classe. Pour faire une analyse des\nerreurs, il ne faut garder que les pr\u00e9dictions qui portent sur les\nb\u00e2timents d\u00e9j\u00e0 classifi\u00e9s. Ces contributions, dont on peut dire si\nelles sont justes ou fausses, sont au nombre de 60.436.<\/p>\n\n\n\nAnalyse des contributions<\/h1>\n\n\n\n
Mauvaises contributions<\/h2>\n\n\n\n