La crise du Coronavirus a mobilisé simultanément les administrations et la société civile, le monde académique et les médias partout dans le monde autour de la collecte, de la consolidation, de la vérification et de la mise en valeur des données. Le besoin de données précises et exhaustives a été critique dès le début de l’épidémie, autour des enjeux de gestion de crise, de transparence et d’information du public. Cet article relate comment les administrations ont collaboré pour ouvrir les données relatives à l’épidémie de COVID-19 en France.
Récolter et publier les données de santé à l’échelle nationale : le défi des administrations
Pour les administrations situées en première ligne, comme le ministère des Solidarités et de la Santé, Santé publique France (SPF) et les Agences Régionales de Santé (ARS), le défi a été de parvenir à collecter et à consolider d’importants volumes de données issues de sources différentes.
Si des systèmes d’informations nationaux existaient déjà, il a cependant été nécessaire de les adapter pour réaliser un suivi spécifique des patients atteints de Covid-19. Par ailleurs, les différents acteurs de la santé (services hospitaliers, services d’appels d’urgence, équipes de SOS médecins…) s’appuient au quotidien sur des systèmes d’informations qui sont propres à leur métier. Ces derniers proposent différents modes des saisies et souvent, différentes structures de données.
L’exercice était d’autant plus difficile que ces données devaient être collectées et mises à jour à une échelle nationale dans des délais particulièrement courts.
Collecter, consolider, nettoyer et ouvrir les données relatives à l’épidémie
Pour observer la propagation de l’épidémie
L’accélération de la propagation de l’épidémie dans le monde a intensifié le besoin d’identifier le plus rapidement possible les personnes infectées au Covid-19. Très vite, de premières données ont été mises à disposition à l’échelle mondiale, européenne et nationale : les données l’université John Hopkins, les données de l’organisation mondiale de la santé ou encore celles du Centre Européen de prévention et de contrôle des maladies.
En France, les données concernant le nombre de cas, de personnes hospitalisées ainsi que de personnes décédées étaient publiées dans des point épidémiologiques par Santé publique France et consultables sur un tableau de bord pour les données nationales.
Afin d’apporter une vision à l’échelle des régions et départements de la situation, l’initiative« OpenCOVID19 », menée par la société civile, a consolidé de manière collaborative les données issues (entre autres sources) des bulletins de Santé publique France, des Agences Régionales de Santé, des préfectures et des interventions de la Direction générale de la santé (DGS).
Pour évaluer la mise en tension du système de santé
Alors que l’épidémie continuait de se propager sur le territoire, il est devenu urgent d’établir une image précise et actualisée de la mise en tension du milieu hospitalier.
Le ministère des Solidarités et de la Santé et Santé publique France ont réalisé un travail considérable de collecte et d’agrégation des données. Grâce à l’export et la consolidation de données issues de différents systèmes d’informations, Santé Publique France publie depuis le 18 mars des données relatives à l’épidémie sur Geodes, l’observatoire cartographique de Santé publique France et sur la plateforme de données publiques data.gouv.fr. Les données sont mises à jour quotidiennement et améliorées par les contributeurs. Elles comportent :
- les données hospitalières,
- les données des urgences et de SOS médecins,
- les données concernant les transferts de patients,
- les données relatives aux tests (en laboratoire de ville),
- les niveaux d’excès de mortalité standardisés durant l’épidémie de COVID19…
Etalab a collaboré directement avec Santé publique France, notamment sur l’éditorialisation et la documentation des données en vue de faciliter leur réutilisation, mais aussi sur la mise en place d’un protocole de mise à disposition automatisé des données.
Par ailleurs, la collecte et l’agrégation de données produites sur le terrain peuvent entrainer des anomalies dans certains fichiers. Afin d’identifier et de faire remonter les éventuelles anomalies, Etalab a mis en place un rapport quotidien d’analyse qualité des données. Ce rapport d’anomalie est publié sur data.gouv.fr dans le but d’accompagner les réutilisateurs dans la prise en main des données (les liens vers les rapports sont disponibles sur la page des jeux de données correspondants).
Pour observer l’implication de l’État dans le soutien de l’économie française
Le confinement des populations, la fermeture des commerces et l’arrêt de la production a impacté directement les entreprises. Afin de soutenir l’économie française, l’État a mis en place dès mars 2020 un ensemble d’aides pour les entreprises affectées par la crise.
Au-delà des montants globaux octroyés dans le cadre des aides aux entreprises, le Ministère de l’Économie et des Finances a souhaité apporter davantage de visibilité sur la répartition des sommes versées en fonction du secteur d’activité (code NAF) et des territoires. Les équipes d’Etalab ont collaboré avec les ministères économiques et financiers afin de consolider et mettre à disposition les données relatives à différentes aides :
- Données relatives au fonds de solidarité mis en place dans le cadre de l’épidémie de COVID-19
- Données relatives aux prêts garantis par l’Etat dans le cadre de l’épidémie de COVID-19
- Données relatives aux reports d’échéances fiscales accordés dans le cadre de l’épidémie de COVID-19
Faciliter la compréhension des données pour l’ensemble des citoyens
Afin de faciliter la prise en main et la compréhension des données publiées sur www.data.gouv.fr, Etalab a développé différents tableaux de bord qui apportent une première lecture des données. Ces tableaux de bord ont pour cible les publics qui ne disposent pas de compétences techniques approfondies et qui souhaitent s’informer sur l’épidémie.
Le tableau de bord de suivi de l’épidémie
Afin de poursuivre les efforts entrepris par la société civile dans le cadre de l’initiative « OpenCOVID19 », l’équipe d’Etalab a travaillé à la construction d’un tableau de bord permettant de centraliser et de visualiser l’ensemble des données officielles relatives à l’épidémie de COVID-19.
Le service de communication et d’information du gouvernement (SIG) s’est associé au projet afin que l’ensemble des citoyens puissent accéder à des informations. Suite à une collaboration étroite entre Santé publique France, le SIG et d’Etalab, le tableau de bord a pu être intégré au site du gouvernement le 28 mars 2020.
L’ouverture des données et la publication du tableau de bord ont été valorisées durant le point presse quotidien du directeur national de la santé, Jérôme Salomon, le 28 mars, qui a rappelé à cette occasion l’importance de l’open data en ces termes :
« Le libre accès aux données relatives à l’épidémie, ce qu’on appelle l’open data, assure la confiance des citoyens dans les éléments qui leur sont communiqués, favorise les actions de prévention contre la propagation du virus et facilite la prise de décision.
J. Salomon, directeur national de la santé, point presse coronavirus du 28 mars 2020
La diffusion et l’exploitation de ces données ont été rendues possibles grâce à une collaboration étroite entre plusieurs administrations et la société civile.»
Alors que le déconfinement se préparait, le gouvernement s’est appuyé sur les données publiées sur data.gouv.fr pour élaborer des indicateurs de suivi épidémique. Ces derniers ont été publiés le 30 avril 2020 sur data.gouv.fr et présentés dans un onglet dédié du tableau de bord de suivi de l’épidémie.
Le tableau de bord des données des aides aux entreprises
À partir des données mises à disposition par les ministères économiques et financiers, les équipes d’Etalab ont développé un tableau de bord permettant de consulter et de visualiser les différentes aides accordées par l’état aux entreprises.
Ce tableau de bord, dont le code source est libre, a pu être rapidement mis en place grâce à la réutilisation de briques de codes développées dans le cadre du développement du tableau de bord du suivi de l’épidémie. Valorisé par Gérald Darmanin, Ministre de l’Action et des Comptes Publics ainsi que par Bruno Le Maire, Ministre de l’Économie et des Finances, il est désormais accessible sur le site du Ministère de l’Économie et des Finances.
Comprendre l’impact de la crise du Covid-19 et se préparer à y répondre grâce aux données
Les données ont beaucoup à nous apprendre de la crise actuelle. Elles permettent d’accompagner la prise de décision, d’éclairer le débat public, de favoriser la gouvernance au sein des administrations et d’engager le dialogue avec les citoyens, de plus en plus nombreux à s’approprier les données pour produire des analyses et des visualisations.
Etalab continuera dans les semaines et les mois à venir à accompagner les administrations pour ouvrir de nouvelles données relatives au Covid-19. Ces données pourront couvrir différentes thématiques : sanitaire, économique, social, environnemental, etc. Par ailleurs, la réutilisation des données a bénéficié à des réutilisateurs aux profils et aux objectifs variés. Etalab reviendra dans les prochaines semaines sur les usages et impacts des données relatives à l’épidémie.
Pour rester informé.e.s des prochaines publications de données sur data.gouv.fr et suivre l’actualité de l’open data, n’hésitez pas à vous abonner à l’infolettre de data.gouv.fr !