top of page

Différentes méthodes de filtrage avec la librairie Pandas de Python

Updated: Feb 23, 2023

Aujourd’hui nous allons voir différentes manières de filtrer un DataFrame avec Pandas. Nous allons apprendre à faire des filtres précis sur des lignes et des colonnes.

Pour commencer, voilà notre DataFrame :



1ère méthode : Filtrer avec un opérateur logique.

Dans cet exemple nous cherchons la valeur « Z1 » dans la colonne « Zone » de notre DataFrame. On respecte bien les crochets.



2ème méthode : Filtrer avec plusieurs opérateurs logiques.

Il s’agit de la même méthode que la précédente sauf que l’on rajoute un autre filtre. Chaque filtre est contenu dans des parenthèses. Les filtres sont ajoutés grâce au « & ». Les crochets sont respectés.



3ème méthode : Filtrer avec la méthode « query ».

Cette méthode prend en paramètre les filtres que l’on souhaite appliquer. La syntaxe est bien plus simple que la méthode précédente.



4ème méthode : Filtrer avec la méthode « isin ».

Cette méthode permet de filtrer sur plusieurs éléments à l’intérieur d’une colonne.



5ème méthode : Dans l’exemple suivant, la fonction « filter » prend deux paramètres. Le premier récupère les lignes qui correspondent aux numéros d’index. Le deuxième indique que l’on souhaite conserver les lignes entière.



6ème méthode : Filtrer avec « startwith ».

Les fonctions « startswith » ou « contains » génèrent une série. En fonction de la valeur entrée en paramètre, on aura une colonne de sortie qui indiquera pour chaque ligne si l’opération est vraie ou fausse.



7ème méthode : faire un top n.

Les fonctions « nlargest » et nsmallest » permettent de ressortir les lignes des éléments ayant les n meilleurs ou pire valeur. Dans cet exemple, les deux fonctions prennent 2 paramètres. Le premier le nombre de lignes à conserver. Le deuxième sur quelle colonne travailler.



8ème méthode : filtrer des colonnes.

Dans l’exemple suivant, la fonction « filter » prend qu’un seul paramètre. Il s’agit de la liste des colonnes que l’on souhaite conserver.


9ème méthode Loc et Iloc : La méthode « loc » permet de filtrer une partie du DataFrame. En premier paramètre nous avons « 1 :3 » qui va filtrer de la ligne 1 à la ligne 3. Puis en deuxième paramètre le nom des colonnes sur lesquelles on souhaite filtrer.



La méthode « Iloc » permet aussi de filtrer une partie du DataFrame. En premier paramètre de la ligne 0 à la ligne 2. Puis en deuxième paramètre de la première colonne à la deuxième. Pour rappel les index commencent à 0.



Vous pouvez consulter nos articles comme celui-ci qui sont là pour vous aider.


N'hésitez pas à consulter nos formations également.


Kommentarer


bottom of page