Le Lab IA : Présentation | Équipe | Projets | Outils | Communauté

Comment la Direction générale de l’alimentation (DGAL) cible les contrôles des restaurants à partir des commentaires d’utilisateurs sur internet.

La Direction générale de l’alimentation souhaite optimiser les contrôles des inspecteurs sanitaires. Elle veut tirer parti des commentaires et des avis présents sur les plateformes web (Trip Advisor, Google…) afin d’identifier les établissements les plus à risque. Un projet accompagné par le Lab IA et la DITP, et financé par l’appel à manifestation d’intérêt IA 1.

Date – Durée
2019 – 10 mois
Administration
DGAL
Statut actuel
Outil mis en production depuis novembre 2019
Porteurs
Pierre Guillet (DGAL)
Christian Bastien (DGAL)
Sébastien Remy (DGAL)
Amélie de Nonancourt (DGAL)
Domaine IA
Traitement automatique du langage
Politique publique
Agriculture et alimentation
Code source
Pas encore ouvert
Typologie métier
Inspection et contrôle

Contexte initial

475 inspecteurs de la DGAL effectuent chaque année quelque 15 000 inspections au sein d’un parc de plus de 400 000 établissements de restauration sur le territoire français. Le choix des établissements à contrôler est aujourd’hui réalisé à partir des inspections passées et de la connaissance du terrain mais pourrait être optimisé en s’appuyant sur de nouvelles informations et des technologies d’IA.

Bénéfices attendus

Pour les
politiques publiques

Améliorer l’hygiène des établissements de restauration sur l’ensemble du territoire.

Pour les
usagers

Se prémunir des risques sanitaires liés à la restauration.

Pour les
agents

Augmenter l’efficacité des contrôles et optimiser les tournées des inspecteurs.

Démarche

Le projet a consisté à …

1. Identifier les données les plus utiles sur les plateformes web pour détecter les établissements à risque (note, mots-clés, critiques récurrentes, date de l’avis…).

2. Acquérir ces données par web scraping pour tous les établissements en métropole.

3. Développer des algorithmes suivant 2 approches

• Par « fouille de texte » : sémantique uniquement à partir d’un thésaurus de mots catégorisés : hygiène (« saleté »…), intoxication (« gastro »…), nuisible (« blatte »…) conduisant à définir un « score sémantique de non-conformité ».

• Par « machine learning / modèle supervisé » : se basant sur l’historique des inspections et le score sémantique de non-conformité précédemment construit.

4. Construire une interface web pour l’utilisation de la solution par les agents de la DGAL lors de leurs inspections.

Interface de restitution des résultats
avec géolocalisation pour mieux organiser les contrôles

Résultats

L’utilisation de l’IA permet de doubler l’efficacité des contrôles effectués par les agents. Sur 100 établissements de restauration inspectés sans outil d’IA, 18 en moyenne conduisaient à qualifier l’établissement comme non conforme aux règles d’hygiène. L’approche par « fouille de texte » permet d’atteindre un résultat de 25%. L’approche par « machine learning / modèle supervisé » permet d’atteindre un résultat de 36%.

X2

– L’IA permet de doubler l’efficacité des contrôles effectués par les agents de la DGAL

Ce qu’il faut en retenir


Cadrer en amont le livrable final pour atteindre un objectif réaliste dans les délais du projet.


Équilibrer les différents rendus du projet (scraping, développement de l’algorithme, interface web) afin d’atteindre un résultat utilisable rapidement par les agents.

 


Miser sur la simplicité de l’outil pour obtenir l’adhésion des agents et du management.

 

Et la suite ?

L’outil est désormais utilisé quotidiennement par les 475 inspecteurs de la DGAL sur l’ensemble du territoire. Il pourrait être mutualisé avec d’autres services réalisant des activités d’inspection et de contrôle. Le scraping de données sur de nouvelles plateformes et l’amélioration de l’algorithme sont à prévoir.

« 475 agents de la DGAL vont pouvoir utiliser quotidiennement une solution IA sur le terrain des 2020 »

Porteurs de projets DGAL

Découvrez le Lab IA : Présentation | Équipe | Projets | Outils | Communauté