Le Lab IA propose aux administrations des outils mutualisés (briques technologiques, jeux de données) réutilisables dans différents projets IA.
LirIA
Outil d’OCR et d’extraction d’informations de documents administratifs
Les administrations ont régulièrement besoin d’exploiter en masse des documents administratifs sous des formats non directement exploitables (PDF scannés, images, etc.). LirIA vise à développer un outil accessible via API ou webapp afin de – Convertir en texte des documents au format image – Extraire des informations ciblées de documents standard (cartes d’identité, fiches de paye, documents juridiques)
Le premier jeu de données ouvert de questions-réponses francophones
Le Lab IA construit le premier jeu de données ouvert de questions-réponses francophones. Cliquez pour découvrir la méthode, participer aux séances d’annotation, proposer des cas d’usage et utiliser cette brique technologique dans vos projets.
Un outil et un guide pour pseudonymiser des documents administratifs
Le Lab IA met à la disposition des administrations un outil et un guide pour pseudonymiser les documents administratives. Cette méthode s’appuie sur les travaux du Lab IA au Conseil d’État sur les décisions de justice et le travaux menées par l’équipe Entrepreneurs d’intérêt général à la Cour de cassation et les travaux .
Un catalogue des données ouvertes prêtes pour le Machine Learning
Sur DGML vous trouvez 50 jeux de données pour le Machine Learning accompagnés d’un dictionnaire des variables, un profil statistique détaillé, une table des résultats de l’Auto Machine Learning, des exemples de code et des réutilisations sur data.gouv.fr