Le 13 décembre à 13h30 à l’Isep, Maurass TOGBE, soutiendra sa thèse. Cette soutenance, en français, sera suivie d’un pot.
Directeur de thèse : Mme. Raja CHIKY
Composition du jury :
- Mme Amel BOUZEGHOUB Rapportrice
- Eric GRESSIER-SOUDAN Rapporteur
- Mme Christine FRICKER Examinatrice
- Mustapha LEBBAH Examinateur
- Mme. Yousra CHABCHOUB Co-encadrante
- Aliou BOLY Co-encadrant
Résumé de la thèse
La détection d’anomalies est une problématique importante dans de nombreux domaines d’application comme la santé, le transport, l’industrie etc. Il s’agit d’un sujet d’actualité qui tente de répondre à la demande toujours croissante dans différents domaines tels que la détection d’intrusion, de fraude, etc. Dans cette thèse, après un état de l’art général complet, la méthode non supervisée Isolation Forest (IForest) a été étudiée en profondeur en présentant ses limites qui n’ont pas été abordées dans la littérature. Notre nouvelle version de IForest appelée Majority Voting IForest permet d’améliorer son temps d’exécution. Nos méthodes ADWIN-based IForest ASD et NDKSWIN-based IForest ASD permettent la détection d’anomalies dans les flux de données avec une meilleure gestion du concept drift. Enfin, la détection distribuée d’anomalies en utilisant IForest et Spark a été étudiée et évaluée. Toutes nos propositions ont été validées avec des expérimentations sur différents jeux de données.
Abstract
Anomaly detection is an important issue in many application fiels such as healthcare, transportation, industry etc. It is a current topic that tries to meet the ever increasing demand in different areas such as intrusion detection, fraud detection, etc. In this thesis, after a general complet state of the art, the unsupervised method Isolation Forest (IForest) has been studied in depth by presenting its limitations that have not been addressed in the literature. Our new version of IForest called Majority Voting IForest improves its execution time. Our ADWIN-based IForest ASD and NDKSWIN-based IForest ASD methods allow the detection of anomalies in data stream with a better management of the concept drift. Finally, distributed anomaly detection using IForest and Spark has been studied and evaluated. All our proposals have been validated with experiments on different datasets.