Le présent travail concerne l’optimisation de la décision par les méthodes ensemblistes pour le traitement des bases de données déséquilibrées. Pour y arriver nous avons utilisé les méthodes ensemblistes qui sont basées sur la combinaison homogène des prédictions ou classifieurs pour une meilleure généralisation.Dans notre projet, nous nous sommes basés sur la base de données de Credit Card Fraud Detection pour générer et évaluer le modèle proposé. Nous avons aussi choisi la méthode de combinaison forêt aléatoire (random forest) qui combine plusieurs arbres de décisions et applique la stratégie de vote majoritaire afin de dégager une prédiction optimale.Notre étude vise à construire un modèle de prédiction avec les méthodes ensemblistes pour améliorer les performances d’un classifieur individuel afin traiter les jeux de données déséquilibrées. Pour atteindre notre objectif, hormis la méthode de combinaison forêt aléatoire utilisée, nous aussi utilisé les méthodes de sous-échantillonnage et de sur-échantillonnage pour aboutir aux mêmes résultats et enfin tirer une conclusion sur les trois méthodes utilisées et cela nous l’avons implémenté avec le langage de programmation phyton.

Détails du livre:

ISBN-13:

978-620-6-70636-6

ISBN-10:

6206706362

EAN:

9786206706366

Langue du Livre:

Français

de (auteur) :

Fiston Tshianyi wa Tshianyi

Nombre de pages:

68

Publié le:

20.02.2024

Catégorie:

Informatique