UTILISATION ET INTERPRÉTATION DE T² DE HOTELLING ET DE L’ERREUR DE PRÉDICTION AU CARRÉ Q DANS LES SYSTÈMES DE DÉTECTION D’ANOMALIES
Introduction à la PCA
La PCA (Analyse des Composantes Principales), une technique de réduction de données, est utilisée dans de nombreux domaines pour détecter les anomalies dans les processus de contrôle. Cette technique permet de prendre en compte l’ensemble des variables qui entrent en jeu dans un processus, pour redistribuer les informations et former des nouvelles variables linéairement indépendantes appelées “composants principaux”.
Centre et échelle de données
Avant de réaliser une PCA, il est nécessaire de centrer et d’échelonner les données observées pour obtenir un ensemble d’entraînement où chaque variable a une moyenne de 0 et un écart-type de 1. Pour ce faire, un objet “scale” est utilisé pour stocker les paramètres de centre et d’échelle, afin de transformer les données d’entraînement et obtenir des données mises à l’échelle.
Encoding-decoding system
La PCA peut être comprise comme un système de codage-décodage formé sur un jeu de données représentant un processus de contrôle en équilibre. Pendant l’entraînement, le système apprend les règles de liaison entre les variables surveillées. Par la suite, sur la base de ces règles, le système peut évaluer de nouvelles données et déterminer si un processus est en équilibre.
La détection d’anomalies par PCA
La PCA permet d’identifier les anomalies en évaluant les erreurs de prédiction des données observées, soit l’erreur de prédiction au carré Q et la mesure de T² de Hotelling. Quand la détection d’anomalies de type Q se produit, quelque chose a cassé la structure de corrélation ; une ou plusieurs variables ne varient plus en harmonie avec les autres.
Interprétation de T² et Q
T² de Hotelling est un indicateur qui mesure la distance entre un point et le centre d’un ensemble de points. Plus le T² de Hotelling est élevé, plus la distance est grande et donc, plus il y a de raisons de penser qu’il s’agit d’une anomalie.
L’erreur de prédiction au carré Q mesure la différence entre les données observées et les données prédites. Si une variable a une erreur de prédiction plus élevée que les autres, cela peut indiquer une anomalie.
Conclusion
La PCA est une technique utile pour détecter les anomalies dans les processus de contrôle. La détection d’anomalies par T² et Q nécessite une compréhension précise de ces mesures et de leur interprétation. En centre et en échelonnant les données, puis en utilisant la PCA pour détecter les anomalies, il est possible de maintenir un processus en équilibre à long terme.