L’écosystème Google

L’éthique dans la visualisation de données : gare aux biais et à la transparence !

17 juin 2024

Laetitia Deken

L’éthique dans la visualisation de données : gare aux biais et à la transparence !

La data visualisation, ce n’est pas que lire une photographie de ses données à l’instant T. Ce n’est plus non plus qu’un simple outil de représentation graphique ; elle est désormais une passerelle entre l’information brute et sa compréhension par le public cible. 

Cependant, avec cette puissance vient une grande responsabilité pour les analystes. L’éthique dans la visualisation des données, particulièrement en ce qui concerne les biais et la transparence, devient donc un sujet majeur à explorer.

Voyons dans cet article quels sont les défis liés à l’éthique dans la visualisation des données.

Quelles sont les bonnes pratiques à adopter pour une visualisation des données éthique ?

La visualisation des données transforme les données brutes (comme des nombres, par exemple) en graphiques et tableaux qui permettent aux lecteurs de voir des patterns, des relations et des tendances grâce aux données. Cette discipline permet de rendre l’information plus accessible, mais peut aussi, involontairement ou non, orienter la perception du public. En effet, les choix en matière de design, de sélection de données, et de méthodologie de présentation peuvent tous introduire des biais.

Image illustrant la data

Source : Freepik

Les biais potentiels dans la visualisation de données

Les biais dans la visualisation des données peuvent provenir de plusieurs sources :

  • sélection des données : avant de créer un dashboard, vous devez comprendre d’où les données proviennent, comment elles ont été collectées et ce qu’elles représentent. Les données incluses ou exclues peuvent changer radicalement la narration d’un graphique ;
  • choix des échelles et des axes : des axes non proportionnels ou des échelles modifiées peuvent exagérer ou minimiser certaines tendances ;
  • couleurs et formes : les couleurs et les formes utilisées peuvent évoquer différentes émotions ou perceptions, influençant ainsi la manière dont les informations sont interprétées par le lecteur. Aussi, l’utilisation excessive d’effets visuels comme les ombres, les dégradés et autres animations, ainsi que des couleurs peuvent nuire à la lisibilité d’un graphique, voire même du tableau de bord en général. Ces éléments de design ne doivent pas faire disparaître le message !
exemple de deux graphiques de série temporelle créés dans Looker Studio

Voici un exemple de deux graphiques de série temporelle créés dans Looker Studio, l’outil de dataviz créé par Google que nous utilisons régulièrement chez Numericoach. Ces derniers affichent les sessions d’un site web entre les mois d’avril et de juin d’une même année.

Ces deux graphiques affichent exactement les mêmes données, mais la lecture est différente à cause d’une utilisation subtile des échelles. En effet, à gauche, nous observons des fluctuations majeures causées par une échelle restreinte, tandis qu’à droite, en revanche, les fluctuations semblent plus modérées.

La transparence comme principe directeur dans la visualisation de données

La transparence dans la visualisation des données est un principe vital pour assurer l’intégrité et la confiance dans la manière dont les informations sont restituées. 

En France, c’est la Commission Nationale de l’Informatique et des Libertés (CNIL) qui joue le rôle de garant de la transparence, surtout en ce qui concerne le traitement des données personnelles. En effet, la CNIL veille à ce que les données soient collectées et utilisées de manière transparente, éthique et conforme aux lois sur la protection de la vie privée, telles qu’énoncées dans le RGPD (Règlement Général sur la Protection des Données), en place depuis mai 2018 dans l’Union européenne.

Cette transparence se manifeste donc à plusieurs niveaux du processus d’exploitation des données, de la collecte jusqu’à la publication des résultats : 

Image illustrant la transparence des données

Source : Freepik

Divulgation des sources de données

La transparence commence par la divulgation complète des sources d’où proviennent les données. Par exemple, si une visualisation montre les tendances du changement climatique, il est crucial de préciser si les données proviennent d’organismes réputés comme la NASA ou encore l’Agence Européenne pour l’Environnement (AEE). Cette transparence aide les utilisateurs à évaluer la fiabilité et la crédibilité (ou non) des informations qui lui sont présentées.

Méthodologie claire de traitement des données

Expliquer comment les données ont été traitées avant de les visualiser est également primordial. Par exemple, si certaines données ont été éliminées ou modifiées pour des raisons de confidentialité ou de non pertinence, ces informations doivent être clairement indiquées. Supposons qu’une étude sur les salaires annuels ait exclu les extrêmes pour éviter les distorsions dues aux valeurs aberrantes. Cette décision doit être explicitement mentionnée pour éviter de donner une image incorrecte de la situation.

Justification des choix de visualisation

Les décisions sur le type de graphique à utiliser doivent aussi être transparentes. Par exemple, choisir un diagramme à barres plutôt qu’une courbe peut influencer la perception de la croissance ou de la décroissance des valeurs. Expliquer pourquoi un type de graphique a été choisi aide à comprendre comment interpréter correctement les données visualisées.

Annotation des limites et incertitudes des données

Annoter les visualisations pour signaler les incertitudes ou les limites de vos données, c’est également hyper important. Par exemple, une carte de la pollution de l’air pourrait montrer des niveaux élevés dans certaines régions mais avec une note indiquant que la précision des capteurs dans ces zones est inférieure en raison de conditions météorologiques défavorables. Grâce à cela, les utilisateurs comprennent que les données peuvent ne pas être parfaitement précises.

Gestion des conflits d’intérêts et autres biais

Enfin, il est vital de divulguer tout conflit d’intérêt qui pourrait influencer la manière dont les données sont présentées. Si une entreprise de tabac finance une étude sur les effets du tabagisme sur les individus fumeurs et non fumeurs, ce lien doit être clairement indiqué, car il pourrait influencer la manière dont les données sont interprétées ou présentées.

Lecture simple des visualisations

Assurer que les visualisations sont accessibles à tous les utilisateurs, y compris ceux qui ont des handicaps visuels. L’utilisation de contrastes adéquats, de légendes descriptives, et de fonctionnalités d’accessibilité sont primordiales pour assurer une lecture des données au plus grand nombre.

Développement de l’esprit critique et de la révision

Un tableau de bord se construit en équipe. Permettre et encourager les feedbacks des utilisateurs sur les visualisations est également une bonne pratique à adopter. Les critiques peuvent aider à identifier et à corriger les biais inaperçus et améliorer la transparence car il est toujours bon d’avoir un regard extérieur sur le travail effectué et sur les résultats obtenus.

Conclusion

L’éthique dans la visualisation des données ne se limite pas qu’à éviter les erreurs flagrantes ; elle englobe la responsabilité de fournir une représentation honnête et transparente des données. 

La transparence, quant à elle, ne consiste pas simplement à montrer les données mais à expliquer de manière ouverte et honnête tout ce qui a influencé leur collecte, leur traitement et leur présentation, pour éviter les fameux biais cognitifs.

Les analystes s’engagent à maintenir des normes élevées de précision et d’intégrité pour renforcer la confiance du public dans les données présentées. Adopter une approche éthique est essentiel non seulement pour la précision de l’information, mais aussi pour maintenir la confiance et l’engagement du public dans une époque que l’on qualifie de “surcharge informationnelle”.

Pour en savoir plus et monter en compétences sur Looker, nous vous invitons à consulter nos Webinaires à ce sujet ainsi que notre catalogue de formations. Nos experts sont là pour vous accompagner sur les outils Google Workspace ! Pour plus d’informations, n’hésitez pas à nous contacter.

Tenté par l’autoformation sur Google Workspace ?

Avec plus de 4.000 articles, Numeriblog est le blog Google Workspace de référence. Idéal pour monter en compétences gratuitement et rapidement !

Vous avez aimé cet article ?
Partagez-le !

Un article écrit par

Photo de Laetitia Deken

Laetitia Deken