Recherche & Développement Toutes les publications Méthodes de rééquilibrage des classes en classification supervisée

Méthodes de rééquilibrage des classes en classification supervisée


ETUDE INTERNE
AUTEUR : MERWAN CHELOUAH

 

Prédire le défaut d’un emprunteur, le caractère frauduleux d’une transaction ou l’attrition d’un client à partir d’observations du phénomène revient à résoudre un problème de classification supervisé.

Bien souvent, les données disponibles pour résoudre ce problème présentent un déséquilibre : la modalité cible – par exemple, le défaut de l’emprunteur – est sous-représentée dans l’échantillon.

Un tel déséquilibre peut affecter le pouvoir prédictif de notre modèle d’apprentissage car il sera biaisé vers la population majoritaire et produira des prédictions potentiellement moins robustes qu’en l’absence de déséquilibre. Après une revue des principales méthodes de rééquilibrage de classes, nous comparons les performances de ces dernières sur différentes bases de données et pour différents algorithmes de classification.

Télécharger le PDF

Publications récentes

#news

13/03/2024

Second exercice de stress test climatique pour les entreprises

Lire plus

12/03/2024

Stress test climatique de la Perte en cas de défaut (LGD)

Lire plus

11/03/2024

Stress-test climatique : Estimation de la perte attendue sur un portefeuille de crédit corporate

Lire plus