Detección automática de anomalías en el comportamiento de los sistemas

Compartir por correo electrónico

Hoy en día, el mantenimiento de los sistemas industriales utiliza el principio de Digital Twin para predecir problemas futuros. Los sensores colocados en las diferentes partes del sistema emiten una señal que caracteriza su comportamiento. El estudio de estas señales temporales en tiempo real permite detectar comportamientos inusuales que preceden a una avería. Sin embargo, las señales de los sensores pueden ser poco fiables debido a una colocación incorrecta del sensor, a su mal funcionamiento o a un problema durante la transmisión de la señal. En consecuencia, el estudio puede estar sesgado y las conclusiones pueden ser erróneas. Por lo tanto, es importante poder puntuar la fiabilidad de la señal antes de estudiarla.

En este trabajo queremos desarrollar una solución utilizando el estado del arte del Machine Learning en el campo de la detección de valores atípicos para poder detectar las anomalías en las señales de los sensores. Nuestro método debe ser no supervisado, lo que significa que no podemos entrenar modelos con comportamientos etiquetados conocidos (normales o anormales) porque requeriría que un experto mirara meticulosamente todos los datos generados, y generalizable, lo que implica poder tratar con muchos tipos de señales muy diferentes. Además, hay que saber distinguir entre las anomalías "normales" del sistema (que pueden considerarse causas de averías) y las anomalías de los sensores. Esta última limitación debe resolverse con el estudio conjunto de las distintas señales de todo el sistema.

Un estudio sobre el campo de la detección de valores atípicos

Un valor atípico suele describirse como "una observación que se desvía tanto de las demás observaciones como para despertar sospechas de que se ha generado por un mecanismo diferente" [Hawkins, 1980]. [Chandola, Banerjee, Kumar, 2007] definió tres tipos de valores atípicos:

[Chandola, Banerjee, Kumar, 2007] definido tres tipos de los valores atípicos:

Anomalías puntuales, como una instancia individual de datos que es anómala con respecto al resto del conjunto de datos.

Anomalías contextuales, como una instancia de datos individual que es anómala con respecto al contexto de su observación.

Anomalías colectivas, como un grupo de instancias de datos que son anómalos entre sí.

El documento también describe tres tipos de métodos de detección de valores atípicos, con respecto al conocimiento de la etiqueta de los datos:

  • Los métodos supervisados cuando las técnicas aprenden modelos utilizando la etiqueta de cada instancia de datos (normal o anormal al menos).
  • Los métodos semisupervisados cuando las técnicas aprenden el modelo normal utilizando sólo instancias normales, o a veces modelos anormales utilizando sólo instancias anormales.
  • Métodos no supervisados cuando no se proporcionan las etiquetas, y las técnicas necesitan aprender de la observación del conjunto de datos.

El resultado de estos métodos podría ser:

  • Una puntuación del grado de anormalidad para cada instancia.
  • Una etiqueta (normal o anómala) que se puede dar, por ejemplo, con un umbral en la puntuación.

Trabajo realizado hasta ahora

Hasta ahora, hemos trabajado principalmente con datos de un caso industrial (un transportador de equipaje de Automatización ALSTEF y el caso de gestión de instalaciones (uno de nuestros edificios inteligentes).

  • La velocidad de la cinta
  • La intensidad del motor
  • La temperatura del aceite
  • La temperatura del motor

La detección de anomalías puntuales puede realizarse mediante métodos estadísticos o basados en la densidad de los valores de la señal. Sin embargo, la forma de la señal depende principalmente del modo de funcionamiento del transportador, que no se da.
Nuestra solución debe ser capaz de aprender los patrones normales para poder detectar las anomalías contextuales. Para ello, intentamos entrenar modelos que aprendan a predecir los valores utilizando datos contextuales temporales calculados localmente como la media, la desviación estándar, la mediana, etc.
Para poder detectar anomalías colectivas, aprendimos a predecir secuencias de datos mediante redes neuronales recurrentes.

Como queremos dar una puntuación de fiabilidad a cada sensor en cada momento, hemos optado por utilizar una puntuación como salida de nuestro método.

En el ejemplo, se considera el contexto que lleva a una puntuación alta al principio y al final de la fase de funcionamiento y a la detección del valor bajo.
Finalmente, desarrollamos un algoritmo que aprende a aislar sucesivamente los tres tipos de valores atípicos hasta que el conjunto de datos es teóricamente normal. A partir de ahora, queremos evaluar las prestaciones de nuestros modelos.

Más ...

Scroll al inicio