top of page

Différentes méthodes de filtrage avec la librairie Pandas de Python

  • Writer: MYPE SAS
    MYPE SAS
  • Nov 29, 2022
  • 2 min read

Updated: Jun 24

Aujourd’hui nous allons voir différentes manières de filtrer un DataFrame avec Pandas. Nous allons apprendre à faire des filtres précis sur des lignes et des colonnes.

Pour commencer, voilà notre DataFrame :


ree

1ère méthode : Filtrer avec un opérateur logique.


Dans cet exemple nous cherchons la valeur « Z1 » dans la colonne « Zone » de notre DataFrame. On respecte bien les crochets.


ree

2ème méthode : Filtrer avec plusieurs opérateurs logiques.


Il s’agit de la même méthode que la précédente sauf que l’on rajoute un autre filtre. Chaque filtre est contenu dans des parenthèses. Les filtres sont ajoutés grâce au « & ». Les crochets sont respectés.


ree

3ème méthode : Filtrer avec la méthode « query ».


Cette méthode prend en paramètre les filtres que l’on souhaite appliquer. La syntaxe est bien plus simple que la méthode précédente.


ree

4ème méthode : Filtrer avec la méthode « isin ».


Cette méthode permet de filtrer sur plusieurs éléments à l’intérieur d’une colonne.


ree

5ème méthode :


Dans l’exemple suivant, la fonction « filter » prend deux

paramètres. Le premier récupère les lignes qui correspondent aux numéros d’index. Le deuxième indique que l’on souhaite conserver les lignes entière.


ree

6ème méthode : Filtrer avec « startwith ».


Les fonctions « startswith » ou « contains » génèrent une série. En fonction de la valeur entrée en paramètre, on aura une colonne de sortie qui indiquera pour chaque ligne si l’opération est vraie ou fausse.


ree

7ème méthode : faire un top n.


Les fonctions « nlargest » et nsmallest » permettent de ressortir les lignes des éléments ayant les n meilleurs ou pire valeur. Dans cet exemple, les deux fonctions prennent 2 paramètres. Le premier le nombre de lignes à conserver. Le deuxième sur quelle colonne travailler.


ree

8ème méthode : filtrer des colonnes.


Dans l’exemple suivant, la fonction « filter » prend qu’un seul paramètre. Il s’agit de la liste des colonnes que l’on souhaite conserver.


ree

9ème méthode Loc et Iloc :


La méthode « loc » permet de filtrer une partie du DataFrame. En premier paramètre nous avons « 1 :3 » qui va filtrer de la ligne 1 à la ligne 3. Puis en deuxième paramètre le nom des colonnes sur lesquelles on souhaite filtrer.


ree

La méthode « Iloc » permet aussi de filtrer une partie du DataFrame. En premier paramètre de la ligne 0 à la ligne 2. Puis en deuxième paramètre de la première colonne à la deuxième. Pour rappel les index commencent à 0.


ree

Vous pouvez consulter nos articles comme celui-ci qui sont là pour vous aider.


Pour un tutoriel complet sur la librairie Pandas, visionnez notre vidéo dédiée à cette librairie.


N'hésitez pas à consulter nos formations également.


 
 
 

Un formateur vous rappelle dans les 24h

Contact Expert Python

Laissez-nous vos coordonnées pour être rappelé dans les 24h.

bottom of page