Regroupements pour la construction d'arbres de classification
Zacharie Alès  1, 2@  , Valentine Huré  3@  , Amélie Lambert  4@  
1 : Laboratoire Mathématique de l'INSA  (LMI)
Institut National des Sciences Appliquées [INSA] - Rouen : EA3226
2 : Laboratoire d'Informatique, de Traitement de l'Information et des Systèmes  (LITIS)
Institut National des Sciences Appliquées [INSA] - Rouen : EA4108
Avenue de l'Université UFR des Sciences et Techniques 76800 Saint-Etienne du Rouvray -  France
3 : Centre d'études et de recherche en informatique et communications
Ecole Nationale Supérieure d'Informatique pour l'Industrie et l'Entreprise : EA4629, Conservatoire National des Arts et Métiers [CNAM] : EA4629, Ecole Nationale Supérieure d'Informatique pour l'Industrie et l'Entreprise
4 : Centre d\'études et de recherche en informatique et communications
Conservatoire National des Arts et Métiers [CNAM] : EA4629

L'intérêt croissant de l'interprétabilité pour les algorithmes de Machine Learning rend d'autant plus pertinent l'utilisation des arbres de décision comme modèles de classification supervisée. Les algorithmes heuristiques sont encore très utilisés mais de plus en plus de méthodes exactes, basées sur des formulations en nombres entiers, se développent afin d'obtenir des arbres fournissant de meilleures performances. Le plus grand challenge pour ces approches est le passage à l'échelle. C'est pourquoi dans ce papier nous proposons plusieurs algorithmes de regroupements des données visant à réduire la taille des formulations tout en garantissant l'optimalité de la solution obtenue.classification supervisée ; arbre de classification ; clustering ; programmation mathématique


Personnes connectées : 1 Vie privée
Chargement...