Neolink : Modèle de recommandation de parcours de vie

Illustration du chemin d'Alice

Vous trouverez des informations sur les défis du projet en suivant les indications suivantes ce lien.

Neolink est une entreprise créée en 2012 qui a développé des solutions pour favoriser l'internet qui rassemble. Son objectif principal est d'unifier l'activité économique et l'utilité sociale dans ses solutions. La société a été rachetée par Berger-Levrault en 2019.

Les services sociaux sont notoirement complexes à modéliser et à gérer. Il est essentiel de se tourner vers des systèmes mutualisés et adaptés aux acteurs de ces services. Si les exemples d'outils grand public sont aujourd'hui légion, il existe encore très peu de solutions dédiées dans le secteur du travail social et de la santé, et encore moins offrant une prise en charge pérenne des usagers. L'objectif de ce projet est de proposer un système de recommandation multi-acteurs et interactif permettant de recommander des projets sociaux sous forme d'un ensemble ordonné d'actions, que nous qualifions de parcours de vie.
Cette deuxième partie d'article est consacrée aux modèles de recommandation de parcours de vie.

Un recommandeur d'articles composites en chaîne pour les parcours de vie

Dans la partie suivante, nous apportons une première approche qui pose les bases de la recommandation de parcours de vie. Nous modélisons le problème, étudions sa complexité, proposons une résolution et des optimisations, ainsi que des critères d'évaluation. Nous considérons que la recommandation de tels éléments composites nécessite des approches de recommandation non traditionnelles. Plus précisément, nous considérons les parcours de vie comme des éléments composites de chaîne (CCI) particuliers, qui doivent satisfaire les propriétés classiques des CCI, à savoir la maximisation (en termes de pertinence), la validité (en termes de budget du bénéficiaire) et la compatibilité (en termes de composition des actions). Le problème de recommandation est formalisé comme une forme de problème d'orientation, pour lequel nous avons mis en œuvre deux approches pour trouver des solutions exactes et approximatives. Nous adaptons des critères d'évaluation classiques pour mesurer la qualité des chemins recommandés. Nous expérimentons avec des ensembles de données artificielles et réelles, montrant que notre approche est une composante prometteuse d'un système interactif de recommandation de parcours de vie.

Concepts de notre problématique pour la recommandation de parcours de vie aux bénéficiaires.

Système de recommandation de parcours
Figure 1 : Système de recommandation de parcours

Nous considérons un ensemble d'actions représentant diverses démarches personnelles, professionnelles ou de santé qui peuvent être entreprises par un bénéficiaire pour atteindre son objectif de vie. Chaque action est associée à un coût qui représente la difficulté de l'action. Pour deux actions données, nous considérons une distance entre elles, qui représente la fluidité de la progression du bénéficiaire en associant ces deux actions dans un parcours.
Notre problème de recommandation a les entrées suivantes : un ensemble d'actions pour former des parcours, un ensemble d'anciens bénéficiaires représentés par leurs diagnostics et l'ensemble des parcours qu'ils ont entrepris, formés par des actions, un nouveau bénéficiaire avec un diagnostic. Le problème consiste à recommander aux bénéficiaires un parcours avec des actions, basé sur les diagnostics, l'ensemble des parcours et le diagnostic.
Nous décomposons notre problème de recommandation en trois sous-problèmes :

  • P1 compute fichiers d'action pro en termes de coût d'action et de distance entre les actions. Le problème consiste à calculer un profil pour chaque action.
  • P2 calcule un dossier pro utilisateur en termes de pertinence dans les actions. Le problème consiste à calculer un profil pour le bénéficiaire avec un score de pertinence pour chaque action.
  • P3 compute recommandations de parcours. Le problème consiste à trouver une séquence d'actions sans répétition.

Résolution des problèmes

P1 et P2 sont principalement traités comme des problèmes d'apprentissage, où les distances entre les actions et la pertinence d'une action pour le bénéficiaire sont apprises à partir de l'ensemble des diagnostics et des parcours existants, qui ont été conçus par des acteurs sociaux professionnels. Le coût d'une action peut être extrait de manière plus triviale des données disponibles sur les parcours antérieurs.

Calcul des profils d'action (P1)

Nous modélisons chaque action comme un vecteur de caractéristiques, calculé comme la moyenne des diagnostics des anciens bénéficiaires à qui l'action a été recommandée. Le coût des actions est fixé au temps médian passé pour chaque action, tel que rapporté dans l'ensemble des parcours passés. La médiane est utilisée pour sa robustesse aux valeurs extrêmes. Notez que, si cette information n'est pas disponible, une approche basée sur l'apprentissage automatique, similaire à celles décrites ci-dessous pour le calcul des distances et de la pertinence, devrait être appliquée.
L'apprentissage des distances entre les actions correspond à un problème traditionnel d'apprentissage métrique. Les approches classiques de ce problème comprennent (1) la transformation en tâche de classification, ou (2) l'apprentissage métrique supervisé par semaine.
En ce qui concerne (1), les distances sont généralement des combinaisons linéaires de distances entre objets, obtenues par l'ajustement d'un classificateur linéaire (par exemple, SVM) sur des paires d'objets étiquetés positivement si les objets doivent être dans le même groupe et négativement sinon.
En ce qui concerne (2), les approches d'apprentissage métrique supervisé hebdomadaire visent à définir un nouvel espace basé sur des contraintes d'entrée de type Must-Link ou Cannot-Link qui spécifient respectivement si deux points doivent être proches ou éloignés dans l'espace de sortie.
Enfin, dans le cas général, il peut exprimer des échelles et des relations plus complexes entre les caractéristiques.

Calculer le profil du bénéficiaire (P2)

Comme vous pouvez le voir dans Figure 1l'ensemble des anciens parcours peut être considéré comme un graphe des actions entreprises par le passé. Alors que ce graphe aurait pu être utilisé pour extraire les scores de popularité des actions, qui peuvent être utiles pour recommander des actions populaires, notre objectif est de calculer un profil différent pour chaque nouveau bénéficiaire. En tant que tel, notre problème est proche d'un problème de démarrage à froid pour un nouvel utilisateur, pour lequel nous utilisons une approche hybride, en exploitant à la fois le diagnostic du bénéficiaire et les anciens diagnostics et parcours.
Précisément, nous définissons la pertinence collaborative d'une action pour un bénéficiaire par la probabilité qu'il entreprenne cette action. Nous exprimons ce problème comme une tâche de classification visant à prédire "Vrai" si l'action est pertinente ou "Faux" si ce n'est pas le cas, en fonction du diagnostic du bénéficiaire. Nous utilisons une approche Bayes naïve pour obtenir les valeurs de probabilité attendues. En généralisant la prédiction pour un bénéficiaire sur la base des observations sur les bénéficiaires passés, ce score rend compte d'un score collaboratif de pertinence.

Recommandation de parcours (P3)

Nous avons choisi d'utiliser le modèle de programmation mathématique en nombres entiers (MIP), car nous nous attendons à ce que la plupart des instances soient suffisamment petites pour qu'une solution exacte puisse être trouvée de manière simple par des solveurs de pointe tels que CPLEX. Un tel modèle permet d'ajouter trivialement des contraintes linéaires au cas par cas, chaque fois que nécessaire. Pour des raisons d'efficacité, la résolution de tels problèmes reformule classiquement le problème multi-objectif initial en un problème à un seul objectif (la maximisation de la pertinence) et réécrit les deux derniers objectifs restants (minimisation du budget temps et de la distance) en tant que contraintes dites epsilon avec une limite supérieure sur le budget temps et la distance. Cette reformulation bénéficie des mécanismes d'optimisation à objectif unique disponibles dans CPLEX.
Pour les plus grandes instances du problème qui ne pouvaient pas être traitées par CPLEX, nous avons implémenté un algorithme simple de type "greedy" pour calculer efficacement des solutions approximatives de P3. Son principe est le suivant. Il commence par choisir l'action la plus pertinente, puis ajoute les actions suivantes en calculant un score par
en divisant la pertinence par la distance, et en choisissant les actions qui obtiennent le meilleur score.
Un système de fenêtrage est utilisé pour limiter le nombre de comparaisons (plus la fenêtre est grande, plus le nombre d'actions les plus pertinentes est élevé). De plus, à chaque itération, les actions coûteuses ne respectant pas le budget restant sont élaguées.

Évaluation de l'approche

En testant notre approche, nous voulions répondre à deux questions principales : Dans quelle mesure notre approche PRS est-elle efficace pour recommander des parcours de vie ? Et dans quelle mesure la PRS s'adapte-t-elle à des instances plus importantes du problème, c'est-à-dire à une plus grande population d'actions possibles ?

Pour tester l'efficacité du SRP, nous avons utilisé un jeu de données réel composé de 2812 diagnostics d'utilisateurs et de 56 actions, avec 14 caractéristiques descriptives qui représentent des informations contextuelles telles que "besoin de garde d'enfants", "recherche d'emploi", etc.
Notre système d'évaluation utilise les mesures d'évaluation classiques des systèmes de recommandation, à savoir la précision et le rappel des éléments composites découverts par rapport aux parcours réels effectués par les bénéficiaires. Cependant, comme la tâche de recommandation est complexe, nous considérons la précision et le rappel à un certain seuil de similarité. Nous considérons qu'il y a une correspondance entre une action recommandée et une action attendue du parcours si leur similarité dépasse un seuil qui est un paramètre des mesures de précision et de rappel.
Comme expliqué précédemment, P3 est traité en reformulant les objectifs comme des contraintes epsilon pour lesquelles une limite supérieure doit être fournie. Pour mener notre test, nous expérimentons plusieurs valeurs pour ces limites. Notamment, nous considérons 3 seuils pour les contraintes de coût exprimées en temps d'exécution des actions, respectivement 207, 364 et 601 jours, car il s'agit de la durée moyenne observée pour les personnes âgées de moins de 25 ans, entre 25 et 55 ans et plus.
55 ans pour reprendre le travail après une période de chômage. De même, pour la contrainte de distance, nous considérons 3 seuils de distance : 3, 4, et 5 qui permettent d'exécuter plusieurs actions dans un seul parcours recommandé. Les figures ci-dessous fournissent des histogrammes des distributions des coûts de temps d'exécution et des distances qui évaluent les choix pour les seuils susmentionnés. Afin d'évaluer la précision de notre apprentissage métrique, nous effectuons une comparaison avec une simple distance euclidienne sur tous les scénarios précédents. Enfin, une validation croisée triple est mise en place pour s'assurer que les ensembles de formation et de test sont bien séparés et pour produire des valeurs moyennes.

Histogrammes du coût du temps d'exécution observé pour les actions du jeu de données français RSA
Figure 2 : Histogramme du coût du temps d'exécution observé pour les actions de l'ensemble de données.
Histogramme des distances entre les actions
Figure 3 : Histogramme des distances entre les actions

Figures 4, 5 et 6 résume les principaux résultats de nos expériences en termes de F-Measure à un seuil de similarité donné. Notez que Figures 5 et 6 représentent différents regroupements des mêmes données, en faisant la moyenne de la distance et du temps, respectivement. Les résultats présentés sont moyennés par le processus de validation croisée 3-fois.
et l'écart-type autour de chaque moyenne est représenté par des zones de couleur claire autour des graphiques. Il est important de noter que la similarité est exprimée en fonction de la distance entre les actions.
Figures 4 et 5 montrent l'importance de la distance entre les actions dans notre méthode. En effet, Figure 4 présente des résultats avec une distance euclidienne traditionnelle entre les actions, qui ne bénéficie pas de connaissances externes sur les actions qui devraient être regroupées pour mieux correspondre aux parcours observés. De plus, plus le seuil de similarité de ces figures est bas, plus il est facile de trouver une correspondance entre un recommandeur et une action observée, et plus le score de la F-measure est susceptible d'être élevé. En accord avec cette observation, les deux Figures 4 et 5 montrent un score F-Measure décroissant avec l'augmentation du seuil de similarité. Cependant, notre distance apprise entre les actions permet un score F-Measure très élevé jusqu'à ce que le score de similarité soit proche de 1, alors que la distance euclidienne traditionnelle tombe pour des seuils de similarité plus petits. Il est intéressant de noter que dans les deux cas, le score de F-Mesure lors de la recherche d'une correspondance parfaite (seuil de similarité = 1) est proche de 0,3 mais avec des performances légèrement meilleures pour la métrique ajustée. Enfin, le score F-Measure est plus élevé dans le cas des voies à court terme, ce qui est normal car il est plus facile de prédire pour une courte période de temps et des séquences plus courtes pour lesquelles il est plus facile d'améliorer le rappel.
Figures 5 et 6 montrent que le problème P3 peut être résolu aussi efficacement si nous considérons des contraintes sur le budget temps comme dans Figure 5 ou la distance maximale comme dans Figure 6. Au total, la formulation de la résolution du problème P3 avec des contraintes epsilon ne semble pas être le facteur limitant des résultats observés de F-Measure. Dans le paragraphe suivant, nous étudions l'influence du nombre d'actions sur la résolution du problème P3.

Les scores de mesure F calculés pour différents seuils de similarité pour 3 seuils de coûts de temps d'exécution. La distance entre les actions est définie comme une distance euclidienne.
Figure 4 : scores de F-mesure calculés pour différents seuils de similarité pour 3 temps d'exécution
les seuils de coûts. La distance entre les actions est définie comme une distance euclidienne.
Les scores de mesure F calculés pour différents seuils de similarité pour 3 seuils de coûts d'exécution. La distance entre les actions est apprise comme expliqué
Figure 5 : scores de F-mesure calculés pour différents seuils de similarité pour 3 temps d'exécution
les seuils de coûts. La distance entre les actions est apprise comme expliqué
Les scores de F-mesure calculés pour différents seuils de similarité pour 3 seuils de distance. La distance entre les actions est apprise comme expliqué
Figure 6 : scores de F-mesure calculés pour différents modèles de seuils de similarité pour 3 distances
seuils. La distance entre les actions est apprise comme expliqué

Pour notre test d'évolutivité, afin de comprendre quel est le nombre maximal d'actions que PRS peut gérer, nous avons généré huit ensembles de données artificielles comme suit. Nous avons d'abord utilisé un noyau gaussien KDE pour ajuster les distributions de pertinence, de coût et de distance, respectivement, avec les échantillons obtenus à partir de l'ensemble de données réel utilisé pour les tests d'efficacité. Nous avons ensuite généré des ensembles de données de hauteur de tailles croissantes (100, 200, 300, 400, 500, 1000, 5000, 10 000), représentant les entrées de P3 en tirant la pertinence, le coût et la distance suivant les distributions obtenues avec l'estimateur.
Nous exécutons CPLEX sur chaque ensemble de données, en fixant un délai d'une heure. Les résultats, représentés dans Figure 7sont conformes aux attentes et illustrent la difficulté du problème. Pour les tailles supérieures à 500 actions, le délai d'une heure a été atteint.
Nous exécutons également greedyPRS sur les ensembles de données de hauteur, en variant le budget (de 100 à 1000). Pour les tests d'évolutivité, nous ne présentons que les résultats pour le jeu de données 10 000. Comme indiqué dans Figure 8Contrairement à la résolution exacte par CPLEX, greedyPRS résout des instances beaucoup plus grandes du problème en quelques millisecondes. Bien sûr, en raison de la simplicité de l'algorithme greedy, les solutions peuvent ne pas être réalisables puisque la contrainte de distance d'espilon n'est pas vérifiée.
Pour comprendre la qualité des solutions trouvées par greedyPRS, nous l'avons également exécuté sur le jeu de données français RSA. Comme illustré dans Figure 9L'approche avide maintient une mesure F raisonnable dans la recommandation, bien qu'elle ne soit pas aussi bonne que PRS dans nos tests préliminaires.

Figure 7 : Scalabilité de P3 (exact)
Résolution de P3 avec GreedyPRS (solution approximative) : scalabilité.
Figure 8 : Résolution de P3 avec GreedyPRS (solution approximative) : scalabilité
Résolution de P3 avec GreedyPRS (solution approximative) : F-mesure
Figure 9 : Résolution de P3 avec GreedyPRS (solution approximative) : F-mesure

En conclusion

Cet article présente un système de recommandation de parcours de vie. Nous modélisons les parcours de vie comme des éléments composites de chaînes particulières qui sont construites à partir d'actions atomiques, et dont la recherche est formalisée comme une forme de problème d'orientation. Nous expérimentons avec des ensembles de données artificielles et réelles, montrant que notre approche
est une composante prometteuse d'un système interactif de recommandation de parcours de vie.
Nos perspectives à court terme consistent à inclure dans notre modèle un contexte multi-acteurs, pour concilier les objectifs ou les contraintes des bénéficiaires, des acteurs sociaux et des prestataires de services, ainsi que des mécanismes d'exploration des parcours, afin que les utilisateurs puissent interagir avec le recommandeur. A plus long terme, nous prévoyons d'ajouter un mécanisme d'explication des recommandations afin d'augmenter la confiance des parties prenantes dans les parcours proposés et d'améliorer leur acceptation.

Plus ...

Retour en haut