L’une des missions importantes de l’Administrateur général des données est de soutenir la diffusion dans l’Etat des datasciences au service de l’action publique. Complétant l’ouverture des données publiques, des modèles et des codes source, certains des algorithmes développés par l’AGD sont ainsi des ressources mises à disposition de tous, permettant à des innovateurs d’inventer de nouveaux services ou aux administrations de les réutiliser.
Engagé comme toute la DINSIC dans la transformation numérique de l’action publique, l’AGD soutient le développement de solutions concrètes (La Bonne Boîte, La Bonne Formation, projets de l’incubateur de services numériques), et les démarches d’open innovation.
À ce titre, l’équipe collabore depuis plusieurs semaines avec Bayes Impact France, qui a lancé Bob Emploi, un service permettant d’accompagner le demandeur d’emploi dans ses recherches, en lui faisant des recommandations d’actions à engager.
Grâce à la stratégie d’Etat-plateforme, Bob Emploi a
pu utiliser certaines API développées par la DINSIC, notamment pour la
Bonne Boîte, et des algorithmes ont été développés en collaboration avec
les équipes de Bayes Impact.
Trois actions ont ainsi été identifiées permettant d’élargir le périmètre de recherche d’un demandeur d’emploi :
- Changer de métier
- Modifier son salaire de recherche
- Changer de département
Deux algorithmes ont été développés par l’AGD : un algorithme de recommandation pour ajuster son salaire de recherche et un algorithme de recommandation pour explorer d’autres métiers. Le premier est déjà en production dans l’application Bob Emploi et le second y sera intégré prochainement.
Comment fonctionne l’algorithme de recommandation salariale ?
Lorsque l’on recherche une offre d’emploi, le choix d’une revendication salariale n’est pas toujours évident. Si ce salaire recherché est trop élevé, il peut cacher une grande partie des offres. L’algorithme confronte le salaire de recherche du demandeur d’emploi à la distribution des salaires dans la base des offres d’emploi et permet d’envoyer un signal à un demandeur d’emploi qui se couperait d’une partie trop importante du marché.
L’algorithme repose sur l’idée qu’il y a un arbitrage entre la baisse de salaire que l’on est prèt à accepter et le nombre d’offres auxquelles on a accès. L’objectif est de pouvoir envoyer un signal à l’utilisateur du type : En baissant de 4,5% votre salaire de recherche, vous aurez accès à 150% d’offres supplémentaires.
Cette recommandation s’appuie sur la maximisation d’un score qui dépend positivement du nombre d’offres d’emploi supplémentaires auxquelles donne accès une baisse du salaire de recherche et négativement de la baisse de salaire engendrée. Après plusieurs essais, c’est la fonction suivante qui a été retenue [Voir notebook sur les scores] :
[latex]\Large{\mathbf{score(\Delta O)=\frac{\sqrt(\Delta S)}{\Delta O}}}[/latex]
avec [latex]\mathbf{\Delta O} = [/latex] Taux d’offres d’emploi accessibles supplémentaires.
et [latex]\mathbf{\Delta S} = [/latex]Taux de baisse de salaire.
L’algorithme est calculé à partir de l’ensemble des offres d’emploi collectées par Pôle Emploi sur les six derniers mois. Il est calculé en fonction du métier, en utilisant le référentiel ROME de Pèle Emploi, et par niveau d’expérience.
Exemple sur Bob Emploi
Comment fonctionne l’algorithme de recommandation des métiers ?
Pour définir un algorithme de recommandation de métiers, il faut trois éléments :
- une métrique qui permette de mesurer ce que l’on veut maximiser ou minimiser.
- un graphe qui indique les transitions potentielles entre les métiers
- un modèle qui permette d’indiquer l’espérance de la métrique en fonction des différents scénarios envisagés.
À partir d’un échantillon du Fichier historique des demandeurs d’emploi de Pèle Emploi recensant l’ensemble des épisodes d’inscription à Pôle Emploi, une métrique mesure le pourcentage de temps moyen passé en catégorie A par demandeur d’emploi sur une période donnée.
Pour le graphe des métiers, les métiers connexes définis dans le référentiel ROME de Pèle Emploi sont utilisés. Ce référentiel permet de connaître les transitions possibles entre les métiers répertoriés dans le référentiel.
À partir de lé, on peut calculer pour chaque métier dans chaque région et pour chaque catégorie d’ège, le pourcentage de temps passé en catégorie A au cours de cette période.
Exemple de recommandations-métiers pour une région française, tous èges confondus.
Prenons l’exemple d’un demandeur d’emploi pour un poste en Stratégie commerciale. Sans prendre en compte l’ège de l’individu, voici le tableau renvoyé par l’algorithme :
Chaque ligne correspond à une option potentielle générée à partir du graphe des ROME. Ainsi, un demandeur d’emploi capable d’occuper un poste en « Stratégie commerciale » devrait supposément ètre capable de postuler pour des postes en Marketing, Promotion des ventes ou en Management relation clientèle. éEn comparant le temps passé au chèmage au cours des 6 derniers mois, l’algorithme a détecté que les demandeurs d’emploi en Marketing ont passé 20.6% de temps en moins au chèmage que ceux cherchant un poste en Stratégie commerciale. Si le demandeur d’emploi est prèt à considérer d’autres métiers, c’est donc vers un poste en Marketing que l’algorithme l’oriente.
Exemple de recommandations-métiers pour une région franéaise et par tranche d’âge.
Lorsque suffisamment de données sont disponibles, l’algorithme affine la recommandation par tranche d’âge. C’est le cas ici pour un demandeur d’emploi en Pâtisserie, confiserie, chocolaterie et glacerie de 26 ans dans une région franéaise. L’algorithme explore quatre options potentielles données par le graphe des ROME : Vente en gros de produits frais, Boulangerie-viennoiserie, Personnel de cuisine et Conduite d’équipement de production alimentaire.
Au regard du tableau, les demandeurs d’emploi ayant entre 25 et 35 ans en Ventes en gros de produits frais ainsi qu’en oulangerie-viennoiserie ont passé 44.62% (resp. 10.28%) de temps en moins au chômage que ceux en Pâtisserie, confiserie, chocolaterie et glacerie. Ces deux métiers seront donc recommandés par notre algorithme pour les demandeurs d’emploi de cette tranche d’âge, dans cette région spécifique.
Les algorithmes ainsi que les notebooks sont disponibles sur GitHub.