Détection d’anomalies dans les réseaux intelligents

Article écrit par Maël Chiapino, data scientist chez DCbrain

 

Le déploiement des compteurs intelligents dans le secteur de l’énergie a fait d’énormes progrès ces dernières années. Par exemple, le contrôle automatique, l’optimisation, etc. sont de plus en plus industrialisés. Les équipements et composants des réseaux tels que les réseaux intelligents, les réseaux de chauffage, les réseaux de gaz peuvent désormais être surveillés et gérés en temps réel à des fréquences élevées (de chaque heure à chaque minute).

L’un des principaux problèmes liés à la gestion de ces réseaux est le coût de la maintenance. Effectuer la maintenance trop tôt sera trop coûteux au fil du temps bien qu’une défaillance d’un des composants soit inacceptable. Le défi consiste donc à avoir une bonne estimation du moment où un moteur particulier doit être révisé. Sur la base de données, une façon de procéder consiste à détecter les écarts de comportement du moteur. La première étape de l’analyse consiste à identifier le comportement normal de la machine, ce qui peut être fait avec ou sans l’aide des techniciens du réseau. Les anomalies sont ensuite simplement définies comme des écarts par rapport à ce comportement.

La majeure partie du temps, la quantité de données enregistrées est trop importante pour être surveillée et lue par les humains. Traditionnellement, la surveillance des composants se fait par le déclenchement d’une alerte lorsqu’une quantité spécifique surveillée dépasse un certain seuil fixé, par exemple une alerte lorsque la température de sortie d’un refroidisseur dépasse 15°C dans un réseau de refroidissement. Cette méthode présente deux limites. Premièrement, le composant évolue avec le temps, ce qui signifie que le seuil doit être ajusté manuellement. Deuxièmement, la méthode ne permet pas de détecter les anomalies les plus critiques, car la plupart du temps, un comportement anormal ne peut pas être caractérisé par un seul facteur (par exemple, un comportement anormal pourrait se produire lorsque le débit et la température se situent simultanément dans une certaine plage critique alors que, prises individuellement, ces mesures ne sont pas anormales).

Notre logiciel INES est équipé d’un module de détection automatique des anomalies. Ce module met en œuvre des algorithmes basés sur des méthodes de détection d’anomalies par apprentissage automatique de pointe telles que HDBSCAN, Random Forest, etc. Cela nous permet de faire une analyse impliquant de multiples variables (débit, pression, température, etc.). Il tire le meilleur parti de la modélisation statistique traditionnelle et de la capacité à traiter des flux de données, ainsi que du raffinement dynamique des modèles. La méthode générale est simple, elle rassemble les données en quelques groupes représentant les différents régimes de fonctionnement du composant (comme indiqué ci-dessus, elle peut être réalisée automatiquement ou avec l’aide des techniciens). Par défaut, la méthode est agnostique en ce qui concerne chaque cas particulier, ce qui signifie qu’aucun a priori n’est nécessaire et que les anomalies correspondent à des écarts par rapport aux niveaux statistiques classiques. Cependant, le client peut toujours ajuster la sensibilité de détection à ce qu’il considère comme anormal pour son contexte particulier et son cas d’utilisation.

Voici un cas d’utilisation d’un réseau de refroidissement sur lequel nous avons travaillé avec un acteur du secteur de l’énergie. L’analyse porte sur un refroidisseur, une composante du réseau. La figure ci-dessous montre les enregistrements du flux passant par le refroidisseur et la différence entre la température d’entrée et de sortie pendant une journée de fonctionnement avec des mesures toutes les 15 minutes.

Deux clusters apparaissent sur la figure, ils représentent deux régimes de fonctionnement distincts du réseau. Le groupe de gauche représente le régime bas, lorsqu’une seule pompe est activée, celui de droite représente le régime haut lorsque deux ou trois pompes sont activées (cela peut arriver par exemple pendant les heures d’ouverture d’un centre commercial).

Notre logiciel INES algorithme de détection automatique des anomalies, a été appliqué, et les anomalies résultantes sont représentées en rouge. Sur ce petit sous-ensemble de données, l’algorithme a détecté deux anomalies. Celle du centre provient d’une étape de transition du régime bas au régime haut qui a duré plus longtemps que d’habitude. Celle du bas à droite représente un delta de température anormal pour le régime de fonctionnement élevé. Après une analyse plus approfondie, nous avons découvert que la seconde anomalie était due à un dysfonctionnement de l’échangeur de chaleur d’un client. Ce dysfonctionnement a entraîné un saut de la température d’entrée du refroidisseur qui est ici caractérisé par ce delta de température anormalement bas.

Cet exemple illustre les lacunes d’une méthode simple de seuil, car aucune de ces anomalies n’aurait pu être détectée. En effet, la mesure caractérisant la première anomalie est tout à fait normale car elle est très proche de la moyenne globale du débit et de la température. En outre, la mesure du delta de température de la deuxième anomalie se situe également dans la plage normale (globale) du système. Cela nécessite des méthodes qui prennent en compte de multiples variables et qui sont capables de détecter des relations complexes entre ces variables. Il ne s’agit pas d’une méthode magique permettant d’alerter exclusivement et juste avant qu’une défaillance ne survienne, mais il s’agit d’une première étape pour effectuer des analyses plus approfondies sur des périodes précises et des indicateurs clés, qui donneront de précieuses indications aux techniciens du réseau sur la manière d’éventuellement éviter une défaillance.

 

Téléchargez notre livre blanc sur les mythes de l’optimisation :