Pour accélérer l’ouverture des décisions de justice, la mission Etalab et le groupe Lefebvre-Sarrut viennent de signer un partenariat. Ce contrat concerne le partage d’algorithmes d’intelligence artificielle qui permettent d’occulter des éléments identifiants, en masquant par exemple automatiquement les noms et les prénoms qui figurent dans les décisions de justice.
Pourquoi rendre publiques les décisions de justice ?
Parce que c’est une obligation légale. Dans la continuité de la loi pour une République numérique (loi n°2016-1321 du 7 octobre 2016), la loi de programmation 2018-2022 et de réforme pour la justice (loi n°2019-222 du 23 mars 2019) a réaffirmé le principe d’ouverture des décisions de justice en insistant sur l’importance d’y masquer les éléments identifiants qui peuvent s’y trouver.
Comment occulter les éléments identifiants ?
L’opération qui consiste à retirer les éléments directement identifiants comme le nom, le prénom, l’adresse, ou la date de naissance, s’appelle pseudonymisation. Elle peut être réalisée :
- à la main en modifiant chaque décision de justice pour retirer les noms et prénoms des parties ;
- au moyen d’un moteur de règles déterministes détectant des éléments comme la présence de majuscules ou les mots précédés de « M. » ou « Mme » ;
- à l’aide de méthodes de traitement automatique du langage naturel capables de prédire s’il s’agit du nom d’une personne.
Modifier à la main l’ensemble des décisions de justice est particulièrement chronophage. Le coût pour relire les 180 000 décisions annuelles des cours d’appel et à terme des 3,9 millions de décisions de première instance risque d’être très important. L’utilisation d’un moteur de règles permet d’automatiser une partie du travail mais le taux d’erreur reste important et il est nécessaire d’effectuer une relecture humaine des décisions avant publication. Les méthodes de traitement automatique du langage naturel sont aujourd’hui les plus prometteuses pour pouvoir diffuser les 180 000 décisions des cours d’appel et à terme les décision des tribunaux de première instance.
Pour développer ces méthodes, la mission Etalab accompagne la Cour de cassation, notamment à travers le recrutement d’une équipe de spécialistes dans le cadre du défi Openjustice du programme entrepreneur d’intérêt général.
Parallèlement, le groupe Lefebvre-Sarrut, qui regroupent différents éditeurs juridiques européens dont les éditions Francis Lefebvre et les éditons Dalloz, a développé une méthode de pseudonymisation pour ses besoins propres.
Les bénéfices d’un partenariat
Afin de favoriser la diffusion massive des décisions de justice, le groupeLefebvre-Sarrut et la mission Etalab ont signé une convention de partenariat pour partager et combiner leurs méthodes.
Concrètement, Lefebvre-Sarrut publient le code source de leur algorithme de pseudonymisation sous une licence libre. Les data scientists de la mission Etalab font le lien entre les travaux effectués par les data scientists de Lefebvre Sarrut et ceux de la Cour de cassation afin d’identifier les meilleures pratiques et d’améliorer l’état de l’art. Ces échanges permettront notamment de tester le code source de Lefebvre-Sarrut sur les données de la Cour de cassation, d’évaluer la pertinence statistique de cette approche, de la comparer avec celle développée par les entrepreneurs d’intérêt général et le cas échéant de combiner les deux méthodes pour améliorer les performances des algorithmes de la Cour de cassation.
Etalab et Lefebvre-Sarrut communiqueront à l’automne sur les résultats de cette collaboration.
Au-delà du cas de l’ouverture des décisions de justice, d’autres administrations auront besoin à l’avenir de pseudonymiser des documents pour favoriser leur ouverture et leur circulation. Les outils et l’expertise développés avec cette collaboration permettront d’accompagner d’autres administrations à l’avenir.