La bibliothèque Numpy est un outil indispensable le calcul scientifique. C’est une bibliothèque incontournable de la data science. Cela fait partie des outils courant des data scientist et data analyst. Parmi ses nombreuses fonctionnalités on retrouve la filtration des données. Dans cet article, nous explorerons trois méthodes clés de Numpy : "where()", "logical_and()", "logical_or()" et "select()" en mettant l'accent sur leurs fonctionnalités et en illustrant leur utilisation à travers des exemples concrets.
La méthode « where() »
La méthode where() de Numpy permet de vérifier si les éléments d’un tableau répondent à une condition donnée. Elle prend trois paramètres : la condition, la valeur à retourner lorsque la condition est vraie, et la valeur à retourner lorsque la condition est fausse.
La méthode « logical_and() »
La méthode « logical_and() » de Numpy est une fonction logique qui effectue une opération "ET" élément par élément entre deux tableaux. Elle renvoie un tableau de booléens indiquant si la condition "ET" est vraie ou fausse pour chaque paire d'éléments correspondants dans les tableaux d'entrée.
La méthode permet la comparaison de deux matrices. Dans cet exemple, on cherche à savoir si chaque élément de « mat » et « exp » sont conjointement supérieur ou égal à 5.
Les méthodes « where() » et « logical_and() » peuvent être utilisées ensemble et ainsi obtenir des filtres plus précis.
La méthode « logical_or() » :
À l'inverse de « logical_and() », la méthode logical_or() de NumPy effectue une opération "OU" élément par élément entre deux tableaux. Elle renvoie un tableau de booléens indiquant si la condition "OU" est vraie ou fausse pour chaque paire d'éléments correspondants dans les tableaux d'entrée.
De même qu’avec la méthode « logical_and() », la fonction « logical_or() » s’utilise très bien avec la méthode « where() ».
La méthode « np.select() » :
Cette méthode prend en paramètre une liste de conditions, une liste de valeurs correspondantes et une valeur par défaut. La méthode test chaque condition et sélectionne la valeur correspondante à la première condition vraie. Si aucune condition n'est vraie, elle sélectionne une valeur par défaut.
Dans cet exemple les conditions sont une valeur supérieure à 10 ou divisible par 2. Pour chaque élément de « vec » la méthode vérifie si la première condition est vraie, si c’est le cas alors « sup_10 » est retournée. Si la première condition est fausse alors on passe à la suivante, si la suivante est vraie la méthode retourne « divisible_2 ». Si aucune condition est respectée alors c’est la valeur par défaut qui s’applique.
« np.select() » est particulièrement utile lorsque vous devez appliquer des transformations conditionnelles complexes à un tableau en une seule opération. Elle vous permet de combiner plusieurs conditions et valeurs de manière élégante et efficace.
En conclusion, les méthodes « where() », « logical_and() », « logical_or() » et « select() » de NumPy sont des outils puissants pour filtrer, sélectionner et traiter des données de manière efficace.
N’hésitez pas à vous renseigner auprès de nous si vous avez besoin de formation.
Comments