GEOSPATIAL DATA ANALYSIS AVEC GEOPANDAS : APPRENEZ À MANIPULER ET VISUALISER DES DONNÉES VECTORIELLES AVEC PYTHON
Introduction
Cet article est une suite des histoires sur l’analyse de données géospatiales avec QGIS et un guide complet pour débuter avec OpenStreetMap. Dans les tutoriels précédents, une vue d’ensemble de l’analyse de données géospatiales a été donnée, une sous-discipline omniprésente pouvant être appliquée dans de nombreux domaines, tels que la logistique, le transport et l’assurance. Cette discipline se concentre sur l’analyse d’un type de données particulier, les données géospatiales, caractérisées par une localisation, décrite par une ou plusieurs paires de coordonnées.
Les données géospatiales
Les exemples comprennent des restaurants, des routes et des frontières entre pays. Pour afficher une surface continue, comme une image satellite, une table géographique n’est plus suffisante et il est nécessaire d’avoir un tableau avec un ou plusieurs canaux. Dans cet article, le focus sera sur le cas le plus simple, la table géographique, également appelée données vectorielles. Pour cette tâche, la bibliothèque Python GeoPandas sera utilisée pour manipuler et visualiser ce type de données géospatiales. GeoPandas est une extension de Pandas, un package Python populaire, qui permet de travailler facilement et rapidement avec des données géospatiales.
Importation de données de recensement
Le meilleur moyen de commencer le voyage avec l’analyse de données géospatiales est de s’entraîner avec des données de recensement, qui donnent une image de toutes les personnes et de tous les ménages dans les pays du monde, au niveau granulaire. Dans ce tutoriel, nous allons utiliser un ensemble de données qui fournit le nombre de voitures ou de fourgonnettes au Royaume-Uni et provient du “UK Data Service”.
Ajout de géométrie aux données de recensement
Pour visualiser nos données de recensement, nous avons besoin d’ajouter une colonne qui stocke les informations géographiques. Dans ce cas, ce n’est pas seulement une paire de coordonnées, mais il y a différentes paires de coordonnées qui sont connectées et fermées, formant les frontières des zones de sortie. Pour créer notre carte avec GeoPandas, nous avons besoin d’ajouter la colonne de géométrie de fichier de forme pour chaque zone de sortie.
Créer une carte avec GeoPandas
Maintenant, nous avons tous les ingrédients pour visualiser la carte avec GeoPandas. Depuis l’un des inconvénients de GeoPandas est le fait qu’il a du mal avec de grandes quantités de données et nous avons plus de 200 mille lignes, nous allons nous concentrer uniquement sur les données de recensement de l’Irlande du Nord. Pour créer une carte, il suffit de faire appel à la méthode plot() sur le Geodataframe. En outre, nous aimerions également voir comment le nombre de voitures/fourgonnettes est réparti en Irlande du Nord.
Conclusion
C’était un tutoriel d’introduction pour commencer à pratiquer avec des données géospatiales en utilisant Python. GeoPandas est une bibliothèque Python spécialisée dans la manipulation de données vectorielles. Il est très facile et intuitif à utiliser car il possède des propriétés et des méthodes similaires à celles de Pandas, mais il devient très lent dès que la quantité de données augmente, en particulier lorsqu’il s’agit de représenter les données.
En outre, il dépend de la bibliothèque Fiona pour la lecture et l’écriture de formats de données vectorielles. Dans le cas où Fiona ne prend pas en charge certains formats, même GeoPandas ne sera pas en mesure de les prendre en charge. Une solution peut être d’utiliser en combinaison GeoPandas pour manipuler les données et QGIS pour visualiser la carte. Ou en essayant d’autres bibliothèques Python pour visualiser les données, comme Folium. Tu connais d’autres alternatives ? Suggère-les dans les commentaires si tu as d’autres idées.