Neolink: Modelo de recomendación de itinerarios a lo largo de la vida

Ilustración del camino de Alicia

Encuentre información sobre los retos del proyecto siguiendo este enlace.

Neolink es una empresa creada en 2012 que desarrolla soluciones para fomentar el internet que une. Su principal objetivo es unificar la actividad económica y la utilidad social en sus soluciones. La empresa ha sido comprada por Berger-Levrault en 2019.

Los servicios sociales son notoriamente complejos de modelar y gestionar. Es indispensable recurrir a sistemas mutualizados y adaptados a los actores de estos servicios. Si bien los ejemplos de herramientas para el público en general son legión hoy en día, todavía hay muy pocas soluciones dedicadas al sector de la asistencia social y la salud, y aún menos que ofrezcan una atención a largo plazo para los usuarios. El objetivo de este proyecto es proponer un sistema de recomendación interactivo y multipartito que permita recomendar proyectos sociales en forma de conjunto ordenado de acciones, que calificamos de camino de la vida.
Este artículo de la segunda parte está dedicado a los modelos de recomendación de vías de acceso a lo largo de la vida.

Un recomendador de artículos compuestos en cadena para los itinerarios de toda la vida

En la siguiente parte, aportamos una primera aproximación que sienta las bases de la recomendación de rutas a lo largo de la vida. Modelamos el problema, estudiamos su complejidad, proponemos una resolución y optimizaciones, así como criterios de evaluación. Consideramos que la recomendación de este tipo de artículos compuestos requiere enfoques de recomendación no tradicionales. Más concretamente, consideramos los itinerarios de toda la vida como elementos compuestos en cadena (CCI) particulares, que tienen que satisfacer las propiedades clásicas de los CCI de maximalidad (en términos de relevancia), validez (en términos de presupuesto del beneficiario) y compatibilidad (en términos de composición de acciones). El problema de la recomendación se formaliza como una forma de problema de orientación, para el que implementamos dos enfoques para encontrar soluciones exactas y aproximadas. Adaptamos los criterios de evaluación clásicos para medir la calidad de los caminos recomendados. Experimentamos con conjuntos de datos artificiales y reales, demostrando que nuestro enfoque es un prometedor bloque de construcción de un sistema interactivo de recomendación de rutas para toda la vida.

Conceptos de nuestro planteamiento del problema para la recomendación de itinerarios vitales a los beneficiarios

Sistema de recomendación de rutas
Figura 1: Sistema de recomendación de rutas

Consideramos un conjunto de acciones que representan varios pasos personales, profesionales o de salud que puede emprender un beneficiario para avanzar en su objetivo vital. Cada acción está asociada a un coste que representa la dificultad de la acción. Dadas dos acciones, consideramos una distancia entre ellas, que representa lo suave que sería la progresión del beneficiario al emparejar estas dos acciones en un camino.
Nuestro problema de recomendación tiene las siguientes entradas: un conjunto de acciones para formar itinerarios, un conjunto de antiguos beneficiarios representados por sus diagnósticos y el conjunto de itinerarios que han realizado, formados por acciones, un nuevo beneficiario con diagnóstico. El problema consiste en recomendar a los beneficiarios un itinerario con acciones, basado en los diagnósticos, el conjunto de itinerarios y el diagnóstico.
Descomponemos nuestro problema de recomendación en tres subproblemas:

  • P1 calcular archivos action pro en términos de coste de la acción y distancia entre acciones. El problema consiste en calcular un perfil para cada acción.
  • P2 calcula un archivo pro usuario en términos de relevancia en las acciones. El problema consiste en calcular un perfil para el beneficiario con una puntuación de relevancia para cada acción.
  • P3 computarizado recomendaciones de las vías. El problema consiste en encontrar una secuencia de acciones sin repetición.

Resolución de problemas

P1 y P2 se tratan principalmente como problemas de aprendizaje, en los que las distancias entre las acciones y la relevancia de una acción para el beneficiario se aprenden a partir del conjunto de diagnósticos y vías existentes, que fueron ideados por actores sociales profesionales. El coste de una acción puede extraerse de forma más trivial a partir de los datos disponibles de las vías anteriores.

Cálculo de los perfiles de acción (P1)

Modelamos cada acción como un vector de características, calculado como la media de los diagnósticos de los antiguos beneficiarios a los que se recomendó la acción. El coste de las acciones se fija en la mediana del tiempo invertido en cada acción, tal y como se indica en el conjunto de trayectorias anteriores. Se utiliza la mediana por su solidez frente a los valores extremos. Obsérvese que, en caso de no disponer de esta información, debería aplicarse un enfoque basado en el aprendizaje automático, similar a los descritos a continuación para el cálculo de las distancias y la relevancia.
El aprendizaje de distancias entre acciones corresponde a un problema de aprendizaje métrico tradicional. Los enfoques clásicos que abordan este problema incluyen (1) la transformación a tarea de clasificación, o (2) el aprendizaje métrico supervisado por semanas.
En cuanto a (1), las distancias suelen ser combinaciones lineales de distancias entre objetos en función de las características, obtenidas al ajustar un clasificador lineal (por ejemplo, SVM) sobre pares de objetos etiquetados positivamente si los objetos deben estar en el mismo grupo y negativamente en caso contrario.
En cuanto a (2), los enfoques de aprendizaje métrico supervisado semanalmente tienen como objetivo definir un nuevo espacio basado en las restricciones de par de entrada Must-Link o Cannot-Link que especifican, respectivamente, si dos puntos deben estar cerca o distantes en el espacio de salida.
Por último, en el caso general, puede expresar escalas y relaciones más complejas entre las características.

Cálculo del perfil del beneficiario (P2)

Como puede ver en Figura 1El conjunto de trayectorias anteriores puede verse como un gráfico de acciones realizadas en el pasado. Aunque este gráfico podría utilizarse para extraer puntuaciones de popularidad de las acciones, que pueden ser útiles para recomendar acciones populares, nuestro objetivo es calcular un perfil diferente para cada nuevo beneficiario. Como tal, nuestro problema se aproxima a un problema de arranque en frío para un nuevo usuario, para el que utilizamos un enfoque híbrido, aprovechando tanto el diagnóstico del beneficiario como los diagnósticos y rutas anteriores.
Precisamente, definimos la relevancia colaborativa de una acción para un beneficiario por la probabilidad de que emprenda la acción. Expresamos este problema como una tarea de clasificación cuyo objetivo es predecir "Verdadero" si la acción es relevante o "Falso" si no lo es, en función del diagnóstico del beneficiario. Utilizamos un enfoque de Bayes ingenuo para obtener los valores de probabilidad esperados. Al generalizar la predicción para un beneficiario basada en las observaciones sobre beneficiarios anteriores, esta puntuación da cuenta de una puntuación colaborativa de relevancia.

Recomendación de itinerario (P3)

Hemos optado por utilizar el modelo de Programación Matemática Entera (PEM), ya que esperamos que la mayoría de los casos sean lo suficientemente pequeños como para encontrar una solución exacta con un solucionador de última generación como CPLEX. Este modelo permite añadir trivialmente restricciones lineales caso por caso, siempre que sea necesario. Por razones de eficiencia, la resolución de estos problemas reformula clásicamente el problema multiobjetivo inicial en un problema de un solo objetivo (la maximización de la relevancia) y reescribe los dos últimos objetivos restantes (minimizar el presupuesto de tiempo y la distancia) como las llamadas restricciones épsilon con límite superior en el presupuesto de tiempo y la distancia. Esta reformulación se beneficia de los mecanismos de optimización de un solo objetivo disponibles en CPLEX.
Para aquellas instancias más grandes del problema que no pudieron ser manejadas por CPLEX, implementamos un simple algoritmo codicioso para calcular eficientemente soluciones aproximadas a P3. Su principio es el siguiente. Comienza eligiendo la acción más relevante, y luego añade las acciones posteriores calculando una puntuación por
dividiendo la relevancia por la distancia, y eligiendo las acciones que obtienen la mejor puntuación.
Se utiliza un sistema de ventanas para limitar el número de comparaciones (cuanto mayor sea la ventana, mayor será el número de acciones más relevantes que se consideren). Además, en cada iteración se podan las acciones costosas que no respetan el presupuesto restante.

Evaluación del enfoque

Al poner a prueba nuestro enfoque, queríamos responder a dos preguntas principales: ¿hasta qué punto es eficaz nuestro enfoque de la PRS para recomendar vías de actuación a lo largo de la vida? ¿Y en qué medida la PRS se amplía a instancias más grandes del problema, es decir, a una población mayor de posibles acciones?

Para probar la eficacia del PRS, utilizamos un conjunto de datos reales compuesto por 2.812 diagnósticos de usuarios y 56 acciones, con 14 características descriptivas que representan información contextual, como "necesidad de cuidado de niños", "búsqueda de empleo", etc.
Nuestro esquema de evaluación utiliza las métricas de evaluación clásicas para los sistemas de recomendación, es decir, la precisión y el recuerdo de los elementos compuestos descubiertos cuando se comparan con los recorridos reales que realizaron los beneficiarios. Sin embargo, como la tarea de recomendación es compleja, consideramos la precisión y el recuerdo en un determinado umbral de similitud. Consideramos que hay una coincidencia entre una acción recomendada y una acción esperada del itinerario si su similitud supera un umbral que es un parámetro de las medidas de precisión y recuerdo.
Como ya se ha explicado, P3 se maneja reformulando los objetivos como restricciones épsilon para las que hay que proporcionar un límite superior. Para llevar a cabo nuestra prueba, experimentamos con varios valores para estos límites. En particular, consideramos 3 umbrales para las restricciones de coste expresadas como el tiempo de ejecución de las acciones, respectivamente 207, 364 y 601 días, ya que son el periodo medio observado para, respectivamente, menores de 25 años, entre 25 y 55 años y mayores de
55 años para volver a trabajar después de un periodo de desempleo. Del mismo modo, para la restricción de distancia consideramos 3 umbrales de distancia: 3, 4 y 5 que permiten ejecutar varias acciones en una ruta recomendada. Las figuras siguientes muestran los histogramas de las distribuciones de los costes de tiempo de ejecución y de las distancias que evalúan las elecciones de los umbrales mencionados. Para evaluar la precisión de nuestro aprendizaje métrico, realizamos una comparación con una distancia euclidiana simple en todos los escenarios anteriores. Por último, se establece una validación cruzada triple para garantizar que los conjuntos de entrenamiento y de prueba estén bien separados y para producir valores medios.

Histogramas del coste del tiempo de ejecución observado para las acciones del conjunto de datos francés RSA
Figura 2: Histograma del coste del tiempo de ejecución observado para las acciones del conjunto de datos
Histograma de distancias entre acciones
Figura 3: Histograma de distancias entre acciones

Figuras 4, 5 y 6 resumen los principales resultados de nuestros experimentos en términos de la medida F para un umbral de similitud determinado. Obsérvese que Figuras 5 y 6 representan diferentes agrupaciones de los mismos datos, promediando la distancia y el tiempo, respectivamente. Los resultados presentados se promedian mediante el proceso de validación cruzada de tres veces
y la desviación estándar alrededor de cada media se representa como áreas de color claro alrededor de los gráficos. Cabe destacar que la similitud se expresa en función de la distancia entre las acciones.
Figuras 4 y 5 muestran la importancia de la distancia entre acciones en nuestro método. En efecto, Figura 4 presenta resultados con una distancia euclidiana tradicional entre acciones, que no se beneficia del conocimiento externo de qué acciones deberían agruparse para ajustarse mejor a las rutas observadas. Además, cuanto más bajo sea el umbral de similitud en estas cifras, más fácil será encontrar una coincidencia entre un recomendador y una acción observada, y más probable será que la puntuación de la medida F sea alta. En consonancia con esta observación, tanto Figuras 4 y 5 muestran una puntuación F-Measure decreciente con el aumento del umbral de similitud. Sin embargo, nuestra distancia aprendida entre acciones permite una medida F muy alta hasta que la puntuación de similitud se acerca a 1, mientras que la distancia euclidiana tradicional cae para umbrales de similitud más pequeños. Curiosamente, en ambos casos, la puntuación F-Measure cuando se busca una coincidencia perfecta (umbral de similitud = 1) se aproxima a 0:3, pero con un rendimiento ligeramente mejor para la métrica ajustada. Por último, la puntuación de la medida F es más alta en el caso de las vías de corto plazo, lo cual es normal, ya que es más fácil predecir un periodo de tiempo corto y secuencias más cortas para las que es más fácil mejorar el recuerdo.
Figuras 5 y 6 muestran que el problema P3 puede resolverse con la misma eficiencia si consideramos las restricciones del presupuesto de tiempo como en Figura 5 o la distancia máxima como en Figura 6. En definitiva, la formulación de la resolución de P3 con restricciones épsilon no parece ser el factor limitante en los resultados observados de F-Measure. En el siguiente apartado, estudiamos la influencia del número de acciones en la resolución del problema P3.

Puntuaciones de la medida F calculadas para diferentes umbrales de similitud para 3 umbrales de costes de tiempo de ejecución. La distancia entre las acciones se establece como una distancia euclidiana.
Figura 4: Puntuaciones de la medida F calculadas para diferentes umbrales de similitud para 3 tiempos de ejecución
umbrales de costes. La distancia entre las acciones se establece como una distancia euclidiana.
Puntuaciones de la medida F calculadas para diferentes umbrales de similitud para 3 umbrales de costes de tiempo de ejecución. La distancia entre las acciones se aprende como se explica
Figura 5: Puntuaciones de la medida F calculadas para diferentes umbrales de similitud para 3 tiempos de ejecución
umbrales de costes. La distancia entre las acciones se aprende como se explica
Puntuaciones de la medida F calculadas para diferentes umbrales de similitud para 3 umbrales de distancia. La distancia entre las acciones se aprende como se explica
Figura 6: Puntuaciones de la medida F calculadas para diferentes umbrales de similitud para 3 distancias
umbrales. La distancia entre las acciones se aprende como se explica

Para nuestra prueba de escalabilidad, con el fin de comprender cuál es el número máximo de acciones que puede manejar PRS, generamos conjuntos de datos artificiales de altura de la siguiente manera. Primero utilizamos un kernel KDE-gaussiano para ajustar las distribuciones de relevancia, coste y distancia, respectivamente, con las muestras obtenidas del conjunto de datos real utilizado para las pruebas de eficacia. A continuación, generamos conjuntos de datos de altura de tamaños crecientes (100, 200, 300, 400, 500, 1.000, 5.000, 10.000), que representaban las entradas de P3 dibujando la relevancia, el coste y la distancia siguiendo las distribuciones obtenidas con el estimador.
Ejecutamos CPLEX en cada conjunto de datos, estableciendo un tiempo de espera de una hora. Los resultados, representados en Figura 7son los esperados e ilustran la dureza del problema. Para tamaños superiores a 500 acciones, se alcanzó el tiempo de espera de una hora.
También ejecutamos greedyPRS en los conjuntos de datos de altura, variando el presupuesto (de 100 a 1000). Para las pruebas de escalabilidad, informamos sólo de los resultados del conjunto de datos 10.000. Como se muestra en Figura 8Al contrario que la resolución exacta por CPLEX, greedyPRS resuelve instancias mucho más grandes del problema en milisegundos. Por supuesto, debido a la simplicidad del algoritmo greedy, las soluciones pueden no ser factibles, ya que no se comprueba la restricción de distancia espilon.
Para entender la calidad de las soluciones encontradas por greedyPRS, también lo ejecutamos en el conjunto de datos RSA francés. Como se ilustra en Figura 9El enfoque codicioso mantiene una medida F razonable en la recomendación, aunque no tan buena como la PRS en nuestras pruebas preliminares.

Figura 7: Escalabilidad de P3 (exacta)
Resolución de P3 con GreedyPRS (solución aproximada): escalabilidad.
Figura 8: Resolución de P3 con GreedyPRS (solución aproximada): escalabilidad
Resolución de P3 con GreedyPRS (solución aproximada): Medida F
Figura 9: Resolución de P3 con GreedyPRS (solución aproximada): Medida F

Para concluir

Este artículo presenta un sistema de recomendación de itinerarios vitales. Modelamos los itinerarios de toda la vida como elementos compuestos en cadena particulares que se construyen a partir de acciones atómicas, y cuya recuperación se formaliza como una forma de problema de orientación. Experimentamos con conjuntos de datos artificiales y reales, y demostramos que nuestro enfoque
es un prometedor bloque de construcción de un sistema interactivo de recomendación de itinerarios a lo largo de la vida.
Nuestras perspectivas a corto plazo consisten en incluir en nuestro modelo un contexto de múltiples partes interesadas, para conciliar los objetivos o las limitaciones de los beneficiarios, los actores sociales y los proveedores de servicios, así como mecanismos de exploración de itinerarios, para que los usuarios puedan interactuar con el recomendador. A más largo plazo, tenemos previsto añadir un mecanismo de explicación de las recomendaciones para aumentar la confianza de las partes interesadas en los itinerarios propuestos y mejorar su aceptación.

Más ...

Ir arriba