top of page

Les grandes étapes de l'application d'un algorithme de Machine Learning

  • Writer: MYPE SAS
    MYPE SAS
  • May 7
  • 2 min read

Updated: Jun 24

Vous trouverez dans cet article les cinq étapes d’application d’un algorithme de Machine Learning. L’objectif de notre démarche sera de créer et d’utiliser un algorithme de machine learning permettant de faire une prédiction sur des données inconnues. Cette démarche en cinq étapes est la même pour les cas de régression et de classification. Grâce à la bibliothèque Python Scikit-learn, les cinq étapes s’enchaînent rapidement et simplement.


Etape 1


On choisit un algorithme de machine learning, et on crée un modèle d’apprentissage avec cet algorithme. Tous les algorithmes les plus utilisés sont pré-codés dans la bibliothèque Scikit-learn de Python.


Pour ce qui est du choix de l’algorithme, les critères suivants sont à prendre en compte :

  • S’agit-il d’apprentissage supervisé ou non-supervisé ?

  • S’il s’agit d’un problème de classification, les classes sont-elles linéairement séparables ? Certains algorithmes ne fonctionnent que dans le cas de classes linéairement séparables. D’autres fonctionnent naturellement même avec des classes non-linéairement séparables. Il est en général possible d’adapter un algorithme qui ne marcherait pas dans le cas non-linéairement séparable, pour qu’il fonctionne même dans le cas non-linéairement séparable, grâce à « l’astuce du noyau ».

  • A-t-on une grande quantité de données ?

  • A-t-on une grande capacité de calcul, en mémoire et en temps ?


Exemple :


On choisit ici de créer un modèle de classification en utilisant l’algorithme SVM (Machine à Vecteurs Supports) avec C=1, et en choisissant un noyau RBF avec gamma calculé automatiquement à partir de la répartition des données.

ree

Etape 2


On sépare notre base de données en deux jeux de données : le jeu d’apprentissage (ou d’entraînement) et le jeu de test. On conserve en général 20% des données dans le jeu de test.


On peut aussi éventuellement normaliser les données, si elles ne sont pas déjà normalisées. Ceci permet de transposer les valeurs de tous les attributs, dans le même ordre de grandeur, pour éviter l’influence disproportionnée d’un attribut.


Exemple :


ree

Etape 3


On entraîne notre modèle sur le jeu de données d’apprentissage.


Exemple :


ree

Etape 4


A l’aide du modèle entraîné, on fait des prédictions sur le jeu de données test.


Exemple :


ree

Etape 5


On évalue les performances du modèle sur le jeu de données test, à l’aide de métriques de performance, d’une analyse des résidus et d’une courbe d’apprentissage par exemple.


Exemple :


On choisit ici d’afficher le rapport de classification, calculé automatiquement grâce à la bibliothèque Scikit-learn. Il contient plusieurs métriques de performance.

ree


Retrouvez d'autres contenus, et toutes nos formations sur : https://www.expertpython.fr/

 

 
 
 

Comments


Un formateur vous rappelle dans les 24h

Contact Expert Python

Laissez-nous vos coordonnées pour être rappelé dans les 24h.

bottom of page