A vos souhaits ! : Eternue-t-on plus à cause de la pollution ?

[:fr]

Face au non respect des réglementations appliquées aux particules fines et à l’émission de dioxyde d’azote, le Conseil d’Etat enjoignait hier le gouvernement à prendre des mesures urgentes contre la pollution (source). De notre côté, nous avons observé une multiplication soudaine des éternuements dans l’open space depuis le mois de mars. L’apparition des premières Ventolines a été le déclencheur d’une réelle discussion de fond entre nous : la pollution pourrait-elle en être la cause principale ? Nos datascientists, claviers et mouchoirs en main, ont tenté d’éclaircir cette interrogation en utilisant les données ouvertes*.

Pour ce qui est de l’impact sur les pollens, Airparif est formel  :

« La pollution atmosphérique accroît les effets des pollens :

– Elle rend les pollens plus allergènes.

– La sensibilité des individus aux pollens est accrue lors des épisodes de pollution.

– Elle peut contribuer à l’accroissement de la période de pollinisation. »

Et qu’en est-il des autres allergènes ? La pollution accentue-t-elle aussi leurs effets ?

Une façon de le vérifier par la donnée serait de calculer les corrélations entre l’évolution des pathologies allergiques et celles des polluants atmosphériques. 

1 – Trouver des données sur les pathologies allergiques et leur évolution

Chaque jour, l’IAS Allergies (l’indicateur avancé sanitaire proposé par Open Health) publie sur data.gouv.fr le niveau des pathologies allergiques en France. Cet indicateur se positionne comme un indicateur complémentaire de la surveillance des pollens, et permet de suivre l’évolution spatio-temporelle des allergies saisonnières. Le modèle utilisé pour l’IAS Allergies est basé sur le suivi d’un ensemble de médicaments indiqués dans le traitement symptomatiques des allergies en France. Les données publiées sont disponibles par région (selon l’ancien découpage) et par saison sur 10 mois glissants :

Si vous aussi vous ne sortez plus de chez vous sans un paquet de mouchoirs dans la poche, rassurez-vous, vous n’êtes pas seul : le niveau de pathologies allergiques a explosé dans toute la France entre mars et mai 2017, atteignant son paroxysme mi-avril. Seules exceptions : la région PACA, la Corse et l’Alsace ont observé des pics de pathologies allergiques dès le début du mois de février. De manière générale, la présence de pathologies allergiques évolue de façon quasi-identique entre les régions françaises.

2 – Trouver des données sur la pollution atmosphérique

Airparif étant l’organisme chargé de surveiller la qualité de l’air pour la seule région Île-de-France, nous sommes successivement entrés en contact avec la fédération des ASQAA (Atmo-France) puis le LCSQA (Laboratoire de Surveillance de la Qualité de l’Air) afin d’obtenir des données consolidées au niveau national. C’est finalement sur le site du LCSQA que nous avons pu mettre la main sur des mesures de la qualité de l’air par région.

Malheureusement, seules des données de « dépassement de seuil de pollution » sont aujourd’hui accessibles en open data (il faudra attendre 2018 pour avoir des données plus fines). Notons que ces seuils ne donnent une vue que très partielle du niveau des polluants : des polluants peuvent très bien avoir des niveaux de concentrations atmosphériques très élevés (et avoir un impact sur les allergies ?) sans pour autant que leurs seuils soient dépassés.

Les dépassements de seuils concernent en très grande majorité (88%) les particules en suspension PM10 < 10 µ/m sur la période d’octobre 2016 à juin 2017. En voici un extrait :

Nous avions remarqué sur le précédent graphique que la région PACA avait observé une hausse anticipée des pathologies allergiques par rapport aux autres régions. Peut-être que celle-ci a été la conséquence d’une hausse soudaine des particules fines dans l’air ? Regardons !

Les triangles représentent des dépassements de seuils dont la valeur est indiquée sur l’axe de droite (violet). Ainsi, plus le triangle est haut, plus le seuil de pollution dépassé est important.

En région PACA, un pic de pollution > 50 µ/m3 a été constaté fin-janvier 2017. Un bref coup d’oeil au graphique nous permet de faire 2 constats :

  1. Le pic de pollution de fin-janvier survient au même moment qu’une légère augmentation des pathologies allergiques sur le mois de janvier. 
  2. Aucun pic de pollution n’a été constaté à partir de mi-février, pourtant les pathologies allergiques ont explosé.

Ceci n’est pas très concluant. L’évolution atypique des pathologies allergiques dans la région PACA ne semble pas provenir de dépassements de seuils de polluants atmosphériques (en tous cas pas des particules fines PM10).

Regardons ce qu’il se passe dans les autres régions :

On observe tout d’abord qu’il y a eu de très nombreux dépassement de seuils depuis octobre 2016, et d’autant plus dans les régions Rhône-Alpes, Midi-Pyrénées, Bretagne et Ile-de-France.

Il est difficile d’affirmer quoi que ce soit quant à la corrélation entre la survenue de ces dépassements et la hausse des pathologies allergiques. Certes, on remarque qu’un dépassement de seuil de pollution est parfois accompagné d’une hausse soudaine des pathologies allergiques : par exemple en Languedoc-Roussillon (fin-janvier 2017) ou en Franche-Comte (décembre 2016), mais le manque de données granulaires est pénalisant pour l’étude. Nous restons sur notre faim : d’une part cette « corrélation graphique » est loin d’être évidente, et d’autre part il existe de nombreux polluants atmosphériques autres que les PM10, principalement présentes dans la base de données, qui pourraient impacter nos narines.

Faute d’avoir des données granulaires sur toutes les régions françaises, nous nous replions sur les seules données mises à disposition par Airparif, qui ne concernent que l’Île-de-France. Elles nous donnent en effet, le niveau de concentration horaire par station des principaux polluants atmosphériques en Île-de-France : Oxydes de carbone (CO), Dioxyde d’Azote (NO2), Particules fines en suspension (PM10 et PM25), Ozone (O3), Dioxyde de Souffre (SO2) et Oxyde d’Azote (NOX).

3 – Apprécier les corrélations

Commençons par tracer les courbes afin de pressentir d’éventuelles corrélations entres les pathologies allergiques (vert, pointillés) et les polluants (rose) :

Un rapide coup d’œil permet de constater que le polluant Ozone – lié aux émanations automobiles (Source) – et le niveau de pathologies allergiques semblent évoluer de façons similairesVérifions-le en calculant les corrélations globales avec les pathologies allergiques :

Polluant Corrélation avec les pathologies allergiques
CO -0.258490
NO2 -0.217785
PM25 -0.205211
PM10 -0.146558
O3 0.558341
SO2 -0.158846

Pour rappel, une corrélation proche de 1 en valeur absolue (ie 1 ou -1) traduit une relation forte entre deux indicateurs, tandis qu’une corrélation proche de 0 traduit l’absence de relation.Ainsi, le calcul des corrélations entre les polluants et les pathologies allergiques confirme notre observation : il existe une corrélation positive forte (0.55) entre l’évolution de ces deux indicateurs le même jour. Cela signifie qu’une augmentation (respectivement diminution) du niveau de l’un, s’accompagne souvent par une augmentation (respectivement diminution) du niveau de l’autre. On remarque aussi que le polluant PM10, dont était composé à 88% notre précédent jeu de données, a une corrélation proche de zéro (-0.14) avec les pathologies allergiques : il n’y a donc quasiment aucune relation entre ces deux indicateurs en Île-de-France.

Il existe peut-être un délai entre le moment où les gens commencent à ressentir les symptômes d’une pathologie allergique et le moment où ils décident d’aller chez le médecin pour se faire prescrire un traitement. Le calcul des corrélations dîtes « croisées » va nous permettre de vérifier cette hypothèse en testant les relations entre ces deux courbes dont l’une – la courbe d’Ozone – a été décalée dans le temps (retardée) :

La corrélation est donc maximale (autour de 0.67) entre le niveau de pathologies allergiques et la concentration en Ozone constatée entre 35 et 40 jours auparavant. Notre hypothèse est vérifiée : un hausse du niveau de pollution a tendance à être accompagnée d’une hausse du niveau de pathologie allergiques 1 mois plus tard.

Testons une deuxième hypothèse: Un niveau moyen élevé du polluant Ozone sur plusieurs jours consécutifs a d’autant plus d’impact sur la prescription de médicaments contre les pathologies allergiques. Sans pouvoir vérifier rigoureusement cet « impact », le calcul des corrélations roulantes pourra mettre en exergue une éventuelle relation entre ces deux phénomènes :

On remarque que plus la période considérée est grande, plus la corrélation entre les deux séries est grande. En effet, le niveau moyen d’Ozone des 30 jours précédents évolue de façon très similaire aux prescriptions de médicaments contre les pathologies allergiques (corrélation = 0.71). Graphiquement, les similarités sont flagrantes :

 

Pour conclure, les concentrations en polluant Ozone ont des variations très similaires avec l’évolution des pathologies allergiques en Île-de-France et sur la période considérée. Ainsi, lorsque de forts niveaux de concentration en Ozone sont observés, les habitants d’Île-de-France se font prescrire beaucoup plus de médicaments pour combattre leurs allergies. Nos observations vont dans le même sens que différents travaux menés sur le sujet, notamment :

Bien que tout le monde connaisse cet adage, il est toujours bon de rappeler que « la corrélation n’implique pas la causalité » (pour s’en assurer, c’est par ici). Rappelons aussi que notre étude ne porte – fort malheureusement – que sur une période de 10 mois. Il est donc tout à fait possible que les résultats soient radicalement différents sur une période plus longue.

L’ensemble de notre analyse est disponible sur le github d’Etalab.

Pour approfondir l’analyse de la corrélation entre les variations d’ozone et les épisodes allergènes, il faudra permettre l’accès à tous les jeux de données plus granulaires et portant sur une couverture temporelle plus importante. C’est le travail entamé par les acteurs de la qualité de l’air, auxquels Etalab apportera au besoin, l’ensemble de son expertise.

 


Pour aller plus loin : Pourquoi ne pas rechercher d’autres corrélations avec des données ouvertes :

D’autres idées ? Commentez !

* NB : Cet article n’a pas pour ambition d’être une complète analyse scientifique, mais de montrer comment les données ouvertes peuvent permettre de vérifier des intuitions


[:]