{"id":2891,"date":"2015-02-02T06:57:58","date_gmt":"2015-02-02T05:57:58","guid":{"rendered":"https:\/\/www.etalab.gouv.fr\/?p=2891"},"modified":"2021-10-01T11:37:21","modified_gmt":"2021-10-01T09:37:21","slug":"retour-sur-le-premier-hackathon-donnees-de-sante","status":"publish","type":"post","link":"https:\/\/preprod.etalab.gouv.fr\/retour-sur-le-premier-hackathon-donnees-de-sante","title":{"rendered":"Retour sur le premier Hackathon \u00ab\u00a0donn\u00e9es de sant\u00e9\u00a0\u00bb"},"content":{"rendered":"
<\/a><\/p>\n Le 26 janvier 2015, la Paillasse<\/a> a accueilli dans ses locaux parisiens le premier hackathon d\u00e9di\u00e9 aux donn\u00e9es de sant\u00e9, co-organis\u00e9 par l’Assurance Maladie et la mission Etalab. Retour sur cet \u00e9v\u00e8nement, les projets et les enseignements de cette journ\u00e9e.<\/em><\/p>\n En amont de cette journ\u00e9e, l’Assurance Maladie (CNAMTS<\/a>) a mis \u00e0 disposition sur data.gouv.fr une premi\u00e8re version agr\u00e9g\u00e9e de la base DAMIR<\/a> \u00a0utilis\u00e9e pour le suivi des d\u00e9penses de sant\u00e9 en France. Cette ouverture avait \u00e9t\u00e9 annonc\u00e9e dans les conclusions de la Commission Open Data sant\u00e9<\/a>.<\/p>\n La base DAMIR est l’une des composantes du syst\u00e8me national d’information inter-r\u00e9gimes de l’assurance maladie<\/a> (SNIIRAM). Ce syst\u00e8me est qualifi\u00e9 par Mr Nicolas Revel (directeur de la CNAMTS) de \u00ab\u00a0probablement la plus grande base de donn\u00e9es m\u00e9dico-\u00e9conomiques dans le monde\u00a0\u00bb. Elle est en effet aliment\u00e9e chaque ann\u00e9e par 1,2 milliard\u00a0de feuilles de soins, 500 millions d’actes m\u00e9dicaux et 11 millions d’hospitalisation.<\/p>\n Etalab s’est associ\u00e9e \u00e0 l’Assurance Maladie pour pr\u00e9parer l’organisation de ce hackathon d’un genre in\u00e9dit. En effet, la plupart des \u00e9v\u00e8nements que nous animons (Open Data Camps<\/a>) concernent des jeux de donn\u00e9es d\u00e9j\u00e0 disponibles en open data (sur l’accidentologie routi\u00e8re, par exemple<\/a>).<\/p>\n Cette fois la d\u00e9marche fut l\u00e9g\u00e8rement diff\u00e9rente, puisqu’elle s’est inscrite en amont de l’ouverture : la plupart des participants auront d\u00e9couvert les d\u00e9tails du DAMIR lors de cette journ\u00e9e. Le volume de la base (l’\u00e9quivalent d’un fichier CSV avec 1,5 milliard de lignes…) imposait aussi la mise en place d’une architecture technique d\u00e9di\u00e9e.<\/p>\n L’\u00e9quipe des data scientists rattach\u00e9e \u00e0 l’administrateur g\u00e9n\u00e9ral des donn\u00e9es<\/a>, Henri Verdier, et l’\u00e9quipe de la direction statistique de la CNAMTS ont jou\u00e9 un r\u00f4le majeur en amont et durant l’\u00e9v\u00e8nement. Elles ont\u00a0pr\u00e9par\u00e9 les donn\u00e9es du DAMIR<\/a>, les ont\u00a0document\u00e9es (notamment via un wiki<\/a>), ont\u00a0identifi\u00e9 des jeux de donn\u00e9es compl\u00e9mentaires<\/a> d\u00e9j\u00e0 ouverts (le r\u00e9pertoire partag\u00e9 des professionnels de sant\u00e9, les fichiers de population prot\u00e9g\u00e9e, les donn\u00e9es du PMSI fournies par l’ATIH, des donn\u00e9es d\u00e9mographiques, …).<\/p>\n Plus de 80 personnes ont particip\u00e9 \u00e0 cette journ\u00e9e de d\u00e9veloppement. Parmi eux, des repr\u00e9sentants d’organismes publics du secteur (CNAMTS, ANAP<\/a>, HAS<\/a>, DREES<\/a>, …), des entreprises sp\u00e9cialistes du domaine (GE Healthcare, Celtipharm, Mipih, Cap Gemini Consulting, Jalma, Epiconcept…), des assureurs (Covea), des start-ups du monde m\u00e9dical (BePatient) et des objets connect\u00e9s (Withings). Ils ont \u00e9t\u00e9 accompagn\u00e9s toute la journ\u00e9e par les experts m\u00e9tiers de l’Assurance-Maladie et l’\u00e9quipe d’Etalab.<\/p>\n Une dizaine de pitchs se sont succ\u00e9d\u00e9s en d\u00e9but de journ\u00e9e. La plupart des projets \u00e9taient formul\u00e9s sous la forme de questions. Quelques exemples [liste compl\u00e8te<\/a>]:<\/p>\n – comment \u00e9voluent les restes \u00e0 charge du patient en fonction du r\u00e9gime d’exon\u00e9ration ?<\/p>\n – peut-on \u00e9tablir un lien entre l’offre de soins (par ex. la densit\u00e9 de m\u00e9decins) et la pratique des d\u00e9passements d’honoraires ?<\/p>\n – une sous-consommation de la m\u00e9decine de ville est-elle g\u00e9ographiquement corr\u00e9l\u00e9e avec une surconsommation des urgences ?<\/p>\n – la demande de soins est-elle li\u00e9e \u00e0 l’offre ? (ou: va-t’on plus souvent chez le m\u00e9decin quand l’offre de soins est plus abondante ?)<\/p>\n – observe-t-on une corr\u00e9lation entre les d\u00e9penses m\u00e9dicales et les indicateurs de l’\u00e9tat de sant\u00e9 issus des objets connect\u00e9s comme le niveau d’activit\u00e9 et l’IMC (indice de masse corporelle)\u00a0?<\/span><\/p>\n – comment \u00e9volue g\u00e9ographiquement la permanence des soins ?<\/p>\n – peut-on comparer\u00a0les campagnes de d\u00e9pistage du cancer organis\u00e9<\/em> vs. le d\u00e9pistage individuel<\/em> ?<\/p>\n – les d\u00e9penses de sant\u00e9 sont-elles corr\u00e9l\u00e9es \u00e0 l’indice de d\u00e9veloppement humain (IDH) par r\u00e9gion ?<\/p>\n – la prise en charge et le traitement de l’alcoolisme sont-ils uniforme sur le territoire ?<\/p>\n Enfin, un dernier groupe s’\u00e9tait donn\u00e9 un d\u00e9fi : peut-on r\u00e9-identifier un patient ou un professionnel de sant\u00e9 \u00e0 l’aide des donn\u00e9es mises \u00e0 disposition ce jour-l\u00e0. \u00a0R\u00e9ponse n\u00e9gative en fin de journ\u00e9e : ils n’ont pas r\u00e9ussi \u00e0 identifier\u00a0de probl\u00e8mes d’anonymisation<\/strong>.<\/p>\n Lors de ce hackathon, plus d’un million de requ\u00eates ont \u00e9t\u00e9 trait\u00e9es par le serveur (postgresql), pr\u00e8s de 650 Go de donn\u00e9es transmis aux participants via les 200 m\u00e8tres de c\u00e2bles du r\u00e9seau local ethernet gigabit.<\/p>\n A l’issue d’une journ\u00e9e d’intenses d\u00e9veloppements, \u00e0 peine interrompus par une visite impromptue de Thierry Mandon, secr\u00e9taire d’Etat \u00e0 la modernisation de l’Etat et \u00e0 la simplification, les groupes ont \u00e9t\u00e9 invit\u00e9s \u00e0 pr\u00e9senter l’\u00e9tat d’avancement de leurs travaux devant Mme Marisol Touraine, ministre de la Sant\u00e9 et des affaires sociales, entour\u00e9e de M Nicolas Revel (CNAMTS) et Mme Laure de la Bret\u00e8che (secr\u00e9taire g\u00e9n\u00e9rale \u00e0 la modernisation de l’action publique<\/a>).<\/p>\n Certains projets ont obtenu des r\u00e9sultats tr\u00e8s concrets. Ainsi, concernant le lien entre offre de soins et consommation par d\u00e9partement [graphique ci-dessous], il a \u00e9t\u00e9 \u00e9tabli\u00a0que lorsqu’on augmente la densit\u00e9 de m\u00e9decins de 100 pour 100 000 habitants dans un d\u00e9partement, le nombre de visites chez un g\u00e9n\u00e9raliste par affili\u00e9 augmente de 0,5 par an. Cet effet prend en compte la structure par \u00e2ge de la population locale et les revenus des m\u00e9nages dans le d\u00e9partement [r\u00e9sultats d\u00e9taill\u00e9s<\/a>].<\/p>\nLe DAMIR, un outil pour suivre les d\u00e9penses de sant\u00e9<\/h3>\n
Un hackathon pas comme les autres : open data + data sciences<\/h3>\n
Des participants issus de l’ensemble de la fili\u00e8re sant\u00e9<\/h3>\n
Les r\u00e9sultats<\/h3>\n