GUIDE POUR PRESENTER CORRECTEMENT VOS OBSERVATIONS ET INSIGHTS À VOTRE PUBLIC
Dans le domaine de la science des données, on a tendance à mettre l’accent sur la préparation des données et sur les aspects liés à l’apprentissage automatique. Les discussions tournent autour de la meilleure façon de préparer le jeu de données pour le modèle, de déterminer les fonctionnalités à inclure dans l’entraînement, de choisir la première technique d’apprentissage automatique à utiliser et de savoir comment l’évaluer. Bien que ces questions soient importantes, les professionnels de la science des données oublient souvent de privilégier un des aspects les plus importants, à savoir la visualisation des données.
La visualisation des données peut aider à découvrir des idées, à identifier des tendances et à communiquer des idées complexes. Toutefois, cet aspect représente pour de nombreux professionnels une difficulté qu’ils ont du mal à résoudre, en particulier ceux qui occupent des postes juniors. Dans cet article, nous discuterons de huit conseils pour générer des visualisations de données efficaces, interprétables et esthétiques.
BIEN CHOISIR LE TYPE DE GRAPHIQUE
L’aptitude à choisir le bon type de graphique est la compétence la plus difficile à maîtriser. Il existe plusieurs types de graphiques comme les histogrammes, les graphiques en courbes, les graphiques de dispersion, les cartes thermiques et les graphiques de violon. Il est facile de se perdre et de se sentir dépassé. C’est probablement l’erreur la plus courante que je rencontre régulièrement. Le choix de la charte de visualisation des données est essentiel et doit être directement lié au type de données que nous présentons et au message que nous voulons communiquer.
UTILISER LA COULEUR
La couleur est notre meilleure alliée dans la visualisation des données. Elle permet de mettre en évidence les points forts ou les points intéressants. Elle permet également de séparer les groupes et de focaliser l’attention du public sur une zone que l’on souhaite mettre en avant. Il est important de choisir une palette de couleurs agréable qui complète les données et le public. Cette palette doit être cohérente avec les fruits que l’on montre ; les oranges doivent être de couleur orange et les bananes jaunes. Cette attention aux détails permet de faire la différence entre un simple bon graphique et un excellent graphique.
SIMPLIFIER
Dans la mesure du possible, il faut éviter d’intégrer des éléments inutiles et un style excessif à notre graphique. Il est important de présenter des résultats clairs et le plus efficacement possible. Le but est de clarifier les résultats pour le public. En général, personne ne s’intéresse aux graphiques élaborés.
FAIRE PREUVE DE CLARTÉ
Il ne faut jamais oublier de fournir un contexte sur notre graphique. Il est indispensable de donner des titres, de légender les axes et les sources de données, et d’ajouter toute information supplémentaire si nécessaire. Cela permet de faciliter l’accès à l’information pour le public.
UTILISER DES SCALES COMPARABLES
Lorsqu’on visualise plusieurs jeux de données avec différentes échelles ou plages, il est indispensable de s’assurer que tous les paramètres sont comparés sur une même échelle. Cela aide à éviter les distorsions qui pourraient fausser l’interprétation.
VEILLER À NE PAS TRAVAILLER AVEC DES DONNÉES FAUSSÉES
Il est important d’utiliser des graphiques qui représentent fidèlement les données. À défaut, nous pourrions être tentés de déformer les résultats pour donner une image théâtrale de notre travail. Cela peut affecter négativement l’interprétation de nos résultats.
EXEMPLE DE GRAPHIQUE
Pour mieux comprendre les points précédents, voici un exemple de graphique pour illustrer les différents conseils évoqués.
Nous avons un petit jeu de données qui montre les ventes de pommes, de bananes et d’oranges dans un magasin. Nous avons appliqué différentes types de graphiques à ces données pour montrer comment ils changent l’interprétation des données. Nous avons créé un modèle de vignette en Python, en utilisant Matplotlib.
Conclusion
Si nous voulons présenter des résultats de façon claire et efficace, nous devons accorder une importance particulière à la visualisation des données. Cela donnera aux parties prenantes la possibilité de découvrir les tendances, les idées et les innovations. Avec les bons outils et un peu de pratique, il est possible de simplifier les données, d’organiser les graphiques et de les adapter aux besoins de notre public.