LES FONCTIONNALITÉS CACHÉES DE PANDAS À DÉCOUVRIR
Dans cet article, nous allons explorer certaines fonctionnalités cachées de pandas qui pourraient vous être utiles. Nous allons utiliser des exemples simples pour illustrer chaque fonctionnalité.
IMPORTATION ET PRÉPARATION DU MODULE
Avant de commencer, nous devons importer les bibliothèques pandas et numpy utiles pour réaliser les exemples dans cet article.
import pandas as pd
import numpy as np
FONCTIONNALITÉS CACHÉES DE PANDAS
1. nth
Cette méthode retourne la n-ième ligne (ou lignes). L’argument numpy de la fonction python, nth(0) retourne la première ligne.
Cette méthode permet de sélectionner facilement des lignes spécifiques pour des groupes de données. Ceci est différent des méthodes head () et tail (), qui sélectionnent des lignes selon leur position. Elle peut être utilisée si l’on doit accéder à la première et la troisième ligne d’un groupe. Cette méthode est également différente des fonctionnalités first () et last() qui renvoient les premières et dernières valeurs non nulles de chaque groupe.
2. pop
Cette méthode supprime une colonne d’un DataFrame pour la stocker dans un objet Series.
3. compare
La méthode compare permet d’identifier les différences entre deux DataFrames. Elle renvoie les différences identifiées. Si les deux DataFrames ne contiennent aucune différence, alors la méthode compare ne renvoie rien.
Il existe également plusieurs arguments de comparaison qui ajustent le comportement de la méthode compare.
4. align
La méthode align permet d’aligner deux DataFrames sur leurs axes à l’aide d’un type de jointure spécifié.
5. to_markdown
Cette méthode permet de transformer un DataFrame en un format de type markdown. Pour choisir un format spécifique, il suffit d’utiliser l’argument tablefmt.
6. convert_dtypes
Cette méthode permet de convertir les colonnes d’un DataFrame dans leur type de données le plus approprié.
7. ordered CategoricalDtype
Les DataFrames peuvent facilement stocker les valeurs répétitives en utilisant le type de données category. Cela permet notamment de réduire l’utilisation de mémoire.
8. SparseDtype
Le type de données Sparse permet de stocker les colonnes numériques qui contiennent principalement des valeurs nulles. Cela permet de réduire la consommation de mémoire en comprimant les valeurs nulles.
9. crosstab
Cette méthode permet d’agrégé des données en se concentrant sur les occurrences de certaines combinaisons de valeurs dans les colonnes d’un DataFrame.
CONCLUSION
Dans cet article, nous avons exploré certaines fonctionnalités cachées de pandas. Ces fonctionnalités sont très utiles pour manipuler les grands ensembles de données. Nous espérons que cet article vous a donné les outils nécessaires pour améliorer votre utilisation de pandas et pour en explorer les fonctionnalités cachées.