Les grandes étapes de l'application d'un algorithme de Machine Learning
- MYPE SAS
- May 7
- 2 min read
Updated: May 9
Vous trouverez dans cet article les cinq étapes d’application d’un algorithme de Machine Learning. L’objectif de notre démarche sera de créer et d’utiliser un algorithme de machine learning permettant de faire une prédiction sur des données inconnues. Cette démarche en cinq étapes est la même pour les cas de régression et de classification. Grâce à la bibliothèque Python Scikit-learn, les cinq étapes s’enchaînent rapidement et simplement.
Etape 1
On choisit un algorithme de machine learning, et on crée un modèle d’apprentissage avec cet algorithme. Tous les algorithmes les plus utilisés sont pré-codés dans la bibliothèque Scikit-learn de Python.
Pour ce qui est du choix de l’algorithme, les critères suivants sont à prendre en compte :
S’agit-il d’apprentissage supervisé ou non-supervisé ?
S’il s’agit d’un problème de classification, les classes sont-elles linéairement séparables ? Certains algorithmes ne fonctionnent que dans le cas de classes linéairement séparables. D’autres fonctionnent naturellement même avec des classes non-linéairement séparables. Il est en général possible d’adapter un algorithme qui ne marcherait pas dans le cas non-linéairement séparable, pour qu’il fonctionne même dans le cas non-linéairement séparable, grâce à « l’astuce du noyau ».
A-t-on une grande quantité de données ?
A-t-on une grande capacité de calcul, en mémoire et en temps ?
Exemple :
On choisit ici de créer un modèle de classification en utilisant l’algorithme SVM (Machine à Vecteurs Supports) avec C=1, et en choisissant un noyau RBF avec gamma calculé automatiquement à partir de la répartition des données.

Etape 2
On sépare notre base de données en deux jeux de données : le jeu d’apprentissage (ou d’entraînement) et le jeu de test. On conserve en général 20% des données dans le jeu de test.
On peut aussi éventuellement normaliser les données, si elles ne sont pas déjà normalisées. Ceci permet de transposer les valeurs de tous les attributs, dans le même ordre de grandeur, pour éviter l’influence disproportionnée d’un attribut.
Exemple :

Etape 3
On entraîne notre modèle sur le jeu de données d’apprentissage.
Exemple :

Etape 4
A l’aide du modèle entraîné, on fait des prédictions sur le jeu de données test.
Exemple :

Etape 5
On évalue les performances du modèle sur le jeu de données test, à l’aide de métriques de performance, d’une analyse des résidus et d’une courbe d’apprentissage par exemple.
Exemple :
On choisit ici d’afficher le rapport de classification, calculé automatiquement grâce à la bibliothèque Scikit-learn. Il contient plusieurs métriques de performance.

Retrouvez d'autres contenus, et toutes nos formations sur : https://www.expertpython.fr/
Comentarios