concat()
concat()
Concat() est une fonction utilisé par ce qu'elle permet de regrouper deux ou plusieurs objets de données (DataFrames ou Series) le long d'un axe spécifié.
Syntaxe de concat()
Dans l'exemple suivant, nous allons utiliser cette fonction pour regrouper les données de ventes mensuelles de deux magasins distincts en un seul DataFrame, en explorant différents paramètres pour adapter le processus de fusion selon nos besoins.
Les données de ventes mensuelles sont stockées dans trois DataFrames : sales_product1_source1 et sales_product2_source1, qui regroupent les colonnes 'Mois' et 'Ventes' pour le premier et le deuxième produit, tandis que sales_product1_source2 regroupe les données de ventes mensuelles du premier produit provenant d'une source différente.
Paramètres de concat()
keys=['Produit 1 - Source 1', 'Produit 2 - Source 1', 'Produit 1 - Source 2']: Ce sont des étiquettes utilisées pour identifier chaque ensemble de données.
axis=0: C'est l'axe le long duquel les DataFrames sont concaténés. Ici, 0 indique que les concaténations se font le long de l'axe des lignes.
Là par exemple on a changer 0 par 1 pour pour concaténer horizontalement.
join='outer': C'est le type de jointure utilisé lors de la concaténation. Dans cet exemple, une jointure externe est effectuée. Contrairement à cela, utiliser join='inner' n'aura aucun effet car les index des DataFrames d'entrée ne se croisent pas.
ignore_index=True: Cela permet de réinitialiser les index des DataFrames concaténés pour éviter les index en double.
levels=[['Produit', 'Source'], ['Source 1', 'Source 2']]: Ce sont les niveaux d'index hiérarchiques spécifiés pour les index. Ici, nous avons deux niveaux d'index, "Produit" et "Source".
names=['Type', 'Source']: Ce sont les noms attribués aux niveaux d'index hiérarchiques. Ces noms sont utilisés pour identifier chaque niveau d'index.
verify_integrity=True: Cela vérifie l'intégrité des index pour s'assurer qu'il n'y a pas de intersection entre les index des DataFrames concaténés.
Voir aussi : all(), any(), append(), count(), enumerate(), extend(), filter(), float() format() input(), int(), isdigit(), isinstance(), items(), join(), endswith(), list(), map(), max(), mean(), min(), pop(), range(), len(), startswith(), zip(), type(), get(), symmetric_difference(), keys(), difference()
Numpy : arange(), array(), delete(), hsplit(), hstack(), linspace(), logical_and(), logical_or(), polyfit()
Pandas : concat(), concatenate(), describe(), dict(), drop_duplicates(), dropna(), fillna(), from_dict(), groupby(), head(), iloc, info(), insert(), isin(), melt(), merge(), pivot_table(), read_csv(), read_excel(), rename(), where()
N'hésitez pas à consulter nos formations sur cette page.