Decision Tree (DT) – Machine learning

L’apprentissage par arbre de décision est une technique d’apprentissage supervisé qui permet aussi bien la régression que la classification.

C’est une méthode non paramétrique.

Références :

Bs / Cs

Les avantages de DT sont nombreux (facile à comprendre et à interpréter, peu de préparation sur les données, nécessite peu de puissance de calcul, fonctionne aussi bien sur les données numériques que sur les catégories, …) et les inconvénients sont minimes (risque d’overfitting, instables car très sensibles à des petites variations,  …

Algorithmes

Il existe plusieurs algorithmes qui ne sont pas décrits ici.

L’algorithme CART est celui utilisé par défaut par sklearn.

  • ID3 (Iterative Dichotomiser 3)
  • C4.5
  • C5.0.
  • CART (Classification and Regression Trees)

Attributs discriminants

Gini

Entropie

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *