Détection automatique d'anomalies dans les comportements des systèmes

Aujourd'hui, la maintenance des systèmes industriels utilise le principe du jumeau numérique pour prévoir les problèmes futurs. Des capteurs placés sur les différentes parties du système émettent un signal qui caractérise son comportement. L'étude de ces signaux temporels en temps réel permet de détecter des comportements inhabituels précédant une panne. Cependant, les signaux des capteurs peuvent être peu fiables en raison d'un mauvais placement du capteur, de son mauvais fonctionnement ou d'un problème lors de la transmission du signal. Par conséquent, l'étude peut être biaisée et les conclusions peuvent être fausses. Il est donc important de pouvoir évaluer la fiabilité du signal avant de l'étudier.

Dans ce travail, nous voulons développer une solution utilisant l'état de l'art de l'apprentissage automatique dans le domaine de la détection des aberrations pour pouvoir détecter les anomalies dans les signaux des capteurs. Notre méthode doit être non supervisée, ce qui signifie que nous ne pouvons pas former des modèles avec des comportements étiquetés connus (normaux ou anormaux) car cela nécessiterait qu'un expert examine méticuleusement toutes les données générées, et généralisable, ce qui implique d'être capable de traiter un grand nombre de types de signaux très différents. De plus, il faut être capable de faire la différence entre les anomalies "normales" du système (qui peuvent être vues comme des causes de pannes) et les anomalies des capteurs. Cette dernière contrainte doit être réglée par l'étude conjointe des différents signaux de l'ensemble du système.

Une étude du domaine de la détection des valeurs aberrantes

Une valeur aberrante est généralement décrite comme "une observation qui s'écarte tellement des autres observations que l'on peut soupçonner qu'elle a été générée par un mécanisme différent" [Hawkins, 1980]. [Chandola, Banerjee, Kumar, 2007] ont défini trois types de valeurs aberrantes :

[Chandola, Banerjee, Kumar, 2007] définis trois types de valeurs aberrantes :

Anomalies ponctuelles, comme une instance de données individuelle qui est anormale par rapport au reste de l'ensemble de données.

Anomalies contextuelles, comme une instance individuelle de données qui est anormale par rapport au contexte de son observation.

Anomalies collectives, comme un groupe d'instances de données qui sont anormales les unes par rapport aux autres.

L'article décrit également trois types de méthodes de détection des valeurs aberrantes, en fonction des connaissances sur l'étiquette des données :

  • Les méthodes supervisées lorsque les techniques apprennent des modèles en utilisant l'étiquette de chaque instance de données (normale ou anormale au moins).
  • Les méthodes semi-supervisées lorsque les techniques apprennent le modèle normal en utilisant uniquement les instances normales, ou parfois les modèles anormaux en utilisant uniquement les instances anormales.
  • Méthodes non supervisées lorsque les étiquettes ne sont pas fournies, et que les techniques doivent apprendre à partir de l'observation de l'ensemble de données.

Le résultat de ces méthodes pourrait être :

  • Un score du degré d'anomalie pour chaque instance.
  • Une étiquette (normale ou anormale) qui peut être donnée par exemple avec un seuil sur le score.

Travail effectué jusqu'à présent

Jusqu'à présent, nous avons principalement travaillé sur des données issues d'un cas industriel (un convoyeur à bagages de ALSTEF Automation et de gestion des installations (l'un de nos bâtiments intelligents).

  • La vitesse de la bande
  • L'intensité du moteur
  • La température de l'huile
  • La température du moteur

La détection d'anomalies ponctuelles peut se faire par des méthodes statistiques ou basées sur la densité des valeurs du signal. Cependant, la forme du signal dépend principalement du mode de fonctionnement du convoyeur qui n'est pas donné.
Notre solution doit être capable d'apprendre les modèles normaux pour pouvoir détecter les anomalies contextuelles. Dans ce but, nous avons essayé d'entraîner des modèles qui apprennent à prédire les valeurs en utilisant des données contextuelles temporelles calculées localement telles que la moyenne, l'écart-type, la médiane, etc.
Pour pouvoir détecter les anomalies collectives, nous avons appris à prédire des séquences de données à l'aide de réseaux neuronaux récurrents.

Comme nous voulons donner un score de fiabilité pour chaque capteur à chaque instant, nous avons choisi d'utiliser un score comme sortie de notre méthode.

Sur l'exemple, on tient compte du contexte qui conduit à un score élevé au début et à la fin de la phase d'exploitation et à la détection de la valeur basse.
Finalement, nous avons développé un algorithme qui apprend à isoler successivement les trois types de valeurs aberrantes jusqu'à ce que le jeu de données soit théoriquement normal. A partir de maintenant, nous voulons évaluer les performances de nos modèles.

Plus ...

Retour haut de page