in

11 fonctionnalités Pandas utiles que vous avez peut-être ignorées | par Eryk Lewinson | avril 2023


LES FONCTIONNALITÉS CACHÉES DE PANDAS À DÉCOUVRIR

Dans cet article, nous allons explorer certaines fonctionnalités cachées de pandas qui pourraient vous être utiles. Nous allons utiliser des exemples simples pour illustrer chaque fonctionnalité.

IMPORTATION ET PRÉPARATION DU MODULE

Avant de commencer, nous devons importer les bibliothèques pandas et numpy utiles pour réaliser les exemples dans cet article.

import pandas as pd
import numpy as np

FONCTIONNALITÉS CACHÉES DE PANDAS

1. nth

Cette méthode retourne la n-ième ligne (ou lignes). L’argument numpy de la fonction python, nth(0) retourne la première ligne.

Cette méthode permet de sélectionner facilement des lignes spécifiques pour des groupes de données. Ceci est différent des méthodes head () et tail (), qui sélectionnent des lignes selon leur position. Elle peut être utilisée si l’on doit accéder à la première et la troisième ligne d’un groupe. Cette méthode est également différente des fonctionnalités first () et last() qui renvoient les premières et dernières valeurs non nulles de chaque groupe.

2. pop

Cette méthode supprime une colonne d’un DataFrame pour la stocker dans un objet Series.

3. compare

La méthode compare permet d’identifier les différences entre deux DataFrames. Elle renvoie les différences identifiées. Si les deux DataFrames ne contiennent aucune différence, alors la méthode compare ne renvoie rien.

Il existe également plusieurs arguments de comparaison qui ajustent le comportement de la méthode compare.

4. align

La méthode align permet d’aligner deux DataFrames sur leurs axes à l’aide d’un type de jointure spécifié.

5. to_markdown

Cette méthode permet de transformer un DataFrame en un format de type markdown. Pour choisir un format spécifique, il suffit d’utiliser l’argument tablefmt.

6. convert_dtypes

Cette méthode permet de convertir les colonnes d’un DataFrame dans leur type de données le plus approprié.

7. ordered CategoricalDtype

Les DataFrames peuvent facilement stocker les valeurs répétitives en utilisant le type de données category. Cela permet notamment de réduire l’utilisation de mémoire.

8. SparseDtype

Le type de données Sparse permet de stocker les colonnes numériques qui contiennent principalement des valeurs nulles. Cela permet de réduire la consommation de mémoire en comprimant les valeurs nulles.

9. crosstab

Cette méthode permet d’agrégé des données en se concentrant sur les occurrences de certaines combinaisons de valeurs dans les colonnes d’un DataFrame.

CONCLUSION

Dans cet article, nous avons exploré certaines fonctionnalités cachées de pandas. Ces fonctionnalités sont très utiles pour manipuler les grands ensembles de données. Nous espérons que cet article vous a donné les outils nécessaires pour améliorer votre utilisation de pandas et pour en explorer les fonctionnalités cachées.

What do you think?

Written by Pierre T.

Leave a Reply

Your email address will not be published. Required fields are marked *

CreativeOS – Transformez votre façon de gérer et d’organiser votre entreprise.

Modélisation des moteurs électriques et des systèmes de transmission.