Note: à l’origine, nous avons écrit cet article suite à une invitation de Survey Magazine. Il a d’abord été publié dans ce magazine trimestriel dédié à l’univers des études et de la recherche marketing en novembre 2019 avant de vous être présenté sur notre site.

Quand on parle de DataViz ou de visualisation de données, on pense d’abord à la sélection d’un graphique adéquat pour représenter ses données. Il n’est pas simple de faire son choix sans se perdre dans l’infini des possibilités visuelles.

Diagrammes en bâtons ou circulaires, courbes, nuages de points, radars, boîtes à moustaches et autres blocs de proportion. Comment choisir le graphique parfait pour raconter son histoire?  Nous vous dévoilons les secrets de la perception et des biais cognitifs de notre cerveau en appliquant ce savoir à notre domaine de prédilection: les études de marché et les sondages.

Si vous ne savez pas ce qu’est la DataViz ni pourquoi elle est importante, nous vous invitons à lire notre premier article. Si par contre vous êtes plutôt à la recherche de conseils concrets pour les construire en choisissant les meilleurs éléments visuels à chaque fois, alors vous êtes au bon endroit.

Encoder les données pour optimiser leur perception

Le principe est simple, une bonne DataViz doit permettre de lire les données de façon juste, précise et rapide. Pour celà, il faut s’intéresser à la façon dont nous percevons les différentes composantes visuelles afin des les utiliser au mieux pour transmettre l’information derrière les données.

Old but Gold: positions, longueurs, surfaces et angles

C’est en 1967 que paraît la première édition du livre: Sémiologie graphique. Les diagrammes, les réseaux, les cartes de Jacques Bertin. Cet ouvrage reste une référence dans le domaine, ce sont un peu tous les concepts utilisés dans la DataViz avant l’heure. Tous les visuels ci-dessous proviennent de son live.

Les variables visuelles de Jacques Bertin: Taille, Valeur, Grain, Couleur, Orientation et Forme.

Un peu plus tard en 1986, Jock MacKinley publie une autre référence qui vient enrichir les travaux de Bertin sur les aspects de perception cognitive de cet encodage visuel. Les visuels ci-dessous proviennent de son livre Automating the Design of Graphical Presentations of Relational Information. Dans ce dernier, il ordonne et classifie les variables visuelles en fonction de leur précision selon le type de variable: quantitative, qualitative ordinale et qualitative nominale.

Pour les anglophobes, voici une traduction française du second visuel issu des travaux de Jock MacKinley:

OrdreDonnées QuantitativesDonnées OrdinalesDonnées Nominales
1PositionPositionPosition
2LongueurDensitéTeintes de couleurs
3AngleDégradé de couleursTexture
4PenteTeintes de couleursConnexion
5Surface (2D)TextureConfinement
6Volume (3D)ConnexionDensité
7DensitéConfinementDégradé de couleurs
8Dégradé de couleursLongueurForme
9Teintes de couleursAngleLongueur
10TexturePenteAngle
11ConnexionSurface (2D)Pente
12ConfinementVolume (3D)Surface (2D)
13FormeDensitéVolume (3D)

 

Précisions sur le choix des couleurs

Si on trouve déjà les couleurs dans les travaux de Bertin et de MacKinley, leur rôle particulier nécessite quelques précisions. Il y a trois grandes façons d’utiliser les couleurs pour faire parler les données dans une DataViz:

  • Nuancer avec un dégradé de couleurs similaires
  • Contraster avec des teintes de couleurs très différentes voir opposées
  • Contextualiser en reflétant la réalité pour catégoriser

Concernant la contextualisation, elle peut souvent être utilisées conjointement avec les nuances ou le contraste. Par exemple, pour visualiser les résultats d’une simple question dichotomique, avec Oui et Non comme modalités, on pourra contextualiser en partie le non par un rouge et le oui par un vert tout en utilisant deux couleurs pratiquement opposées sur la roue chromatique.

Raconter l’histoire en images et en graphiques

Afin que les données nous parlent et nous marquent, elles doivent être simples mais aussi raconter une histoire. Sans réellement parler d’encodage de la donnée par l’image, on peut parler d’un usage qui sert la contextualisation. Certaines infographies en usent abondamment mais pour une DataViz, il faut savoir les employer avec parcimonie afin qu’elles ne volent pas la vedette à la data. Ces éléments de storytelling font partie intégrante de la réalisation d’une DataViz mais choisir son histoire peut aussi être utile lors de la sélection du bon graphique.

Pour choisir la représentation graphique idéale des données, la question centrale c’est: qu’est ce qu’on veut mettre en valeur dans les données? La réponse à cette question peut être : une comparaison, une tendance, une distribution, une hiérarchie, une évolution temporelle et ainsi de suite. C’est le point de départ pour amorcer la réflexion sur le type de graphique choisi par le site Extreme Presentation et son brillant Chart Chooser.

Il faut enfin aussi s’interroger sur la dimension storytelling qui sera toujours présente dans la DataViz.:

  • Quel est le message que vous voulez transmettre?
  • Quelle est l’histoire que vous voulez raconter?

Cependant, un autre point de départ pour la visualisation des résultats d’un sondage serait tout simplement: quel est le type de la question qui a été posée? Car oui, le type de question et donc de modalités donne beaucoup d’informations sur les résultats et donc sur la meilleure façon de les encoder efficacement.

Le cas de la DataViz pour les études de marché et les sondages

Pour illustrer les données issues d’une étude de marché, on s’intéresse d’abord à l’exploitation des résultats d’une seule question, autrement dit d’un sondage. Dans ce cas, voici l’ensemble des paramètres à considérer:

  • le type de question : dichotomiques, choix multiples, échelle likert …
  • le type de modalités et donc de données : quantitative discrète, quantitative continue, qualitative nominales ou qualitative ordinales
  • le nombre de modalités
  • les écarts entre les données et ordres de grandeur
  • ce que l’on veut montrer : comparaison, distribution, (dé)composition, relation, tendance, évolution, etc.

À partir du type de question et de l’ensembles des informations compilées sur l’encodage visuel, on peut en déduire le tableau récapitulatif suivant:

# de modalités habituellesType de modalitésVariables visuelles préféréesGraphique préférés
Dichotomique2-3Nominales OpposéesTeintes de couleurs, angles, surfaces 2DSecteurs
Choix multiple, réponse unique3-10NominalesPosition, teintes de couleurs, longueurs, angles, surfacesBarres, secteurs, blocs
Choix multiple, réponse multiple3-10NominalesPosition, teintes de couleurs, longueurs, surfacesBarres, blocs

Échelles sémantiques différentielles

 

Échelles likert, fréquences, nuances

4-6OrdinalesPosition, dégradés de couleurs, teintes de couleurs, angles, longueurs, surfaces

Secteurs, barres, barres empilées 100%

 

 

Échelles numérique (NPS)3-100NumériquesPosition, dégradés de couleurs, teintes de couleurs, longueurs, surfaces

Nombres, barres empilées 100%, barres

 

Hiérarchisation3-5OrdinalesPosition, position, position, teintes de couleurs, images, dégradés de couleurs, longueurs, surfacesBarres, blocs, nuages de points à 1 ou 2 axes
OuverteTextuellesPosition, surface et volumes, teintes de couleursNuages de mots

On pourrait s’arrêter là, mais entrons davantage dans les détails avec des exemples concrets accompagnés des choix visuels expliqués pour ces questions de sondage simples.

Choisir un graphique pour chacun des 7 types de sondages simples

Il existe une quantité infinie de graphiques et de visuels qui peuvent être utilisés pour représenter les résultats d’un sondage. Le récapitulatif ci-dessous ne se veut en aucun cas exhaustif ni même figé. Toutefois, c’est une façon comme une autre de démarrer sa réflexion, une forme de thought starter pour la visualisation des données de sondages.

Dans le doute, n’allez pas chercher le plus compliqué. D’ailleurs, dans une DataViz interactive, les données varient, il vaut donc mieux sélectionner un graphique qui supporte bien les écarts et variations.

Voici donc notre thought starter pour visualiser les résultats d’une question de sondage.

1 – Questions dichotomiques (QD)

Les questions dichotomiques ont la particularité d’avoir deux modalités généralement opposées. Quels que soient les résultats, il y a rarement mieux qu’un bon vieux camembert pour les visualiser.

Pour les couleurs, optez pour des choix qui reflètent les modalités tout en créant suffisamment de contraste pour les distinguer clairement.

Exemple de question: Utilisez-vous Facebook?
Modalités: Oui / Non / NSP

Cliquez sur l’image pour aggrandir!

2 – Questions à choix multiples et à réponse unique (QCRU)

Ces questions ont des modalités qui sont généralement nominales. On en compte généralement entre 3 et 6 ce qui rend l’utilisation des graphiques ci-contre assez pratique.

Exemple de question: Si un petit équipement public de proximité devait ouvrir demain près de chez vous, parmi les suivants lequel serait le mieux adapté à vos besoins?
Modalités : Parcs / Éléments sportifs / Jeux pour enfants / Jeux pour senior

Si l’écart entre les données est très grand, on préférera les blocs de proportions qui permettent de mieux juger l’ordre de grandeur. À l’inverse, on les évitera lorsque les proportions sont proches comme dans cet exemple.

Entre un camembert un graphique en barres, il est intéressant de noter si l’écart entre les données est faible comme ici, on préférera le graphique en barres qui permet de mieux apprécier les différences.

Au vu de l’importance de la position dans la perception, lorsqu’une utilise un graphique en barre, il vaut mieux l’ordonner de façon croissante.

 

Cliquez sur l’image pour aggrandir!

Il est parfois intéressant de choisir quand même un camembert, si on veut représenter les parts d’un marché oligopolistique ou plus généralement si on veut montrer que toutes les réponses font partie d’un tout (pourcentage).

3 – Questions à choix multiples et à réponses multiples (QCRM)

Très similaires aux QCRU, ces questions ont aussi souvent des modalités nominales qu’on compte entre 3 et 6.

La seule différence, toutefois importante, avec le type QCRU c’est que l’ensemble des réponses ne représente pas un tout. Certains répondant pourront opter pour 4 réponses et d’autres pour une 1 seule. Ce qui fait que la somme totale des réponses est biaisées par le nombre de choix faits par chaque participant.

Exemple: Pour quelles raisons ne souhaitez-vous pas installer un TPE dans votre commerce?

Cliquez sur l’image pour aggrandir!

Par conséquent, un camembert présentera rarement de l’intérêt pour ces questions. On choisira plutôt les barres ou les blocs selon les écarts entre les résultats. S’ils sont grands, on préfèrera les blocs et s’ils sont petits, les barres pour plus de précision.

Cliquez sur l’image pour aggrandir!

4 – Questions à échelles sémantiques différentielles (QESD)

Ce type de question inclut les échelles likert, ces questions dont les réponses vont par exemple de pas du tout d’accord à tout à fait d’accord.

On y retrouve en général 4 à 7 modalités ordonnées, c’est pourquoi l’utilisation d’un dégradé de couleur est souvent très parlant. Quand il s’agit de fréquence par exemple, on peut choisir un dégradé de couleur et le contextualiser pour le choix de la couleur principale.

En ce qui concerne le type de graphique, les barres et les barres empilées 100% fonctionnent plutôt bien pour ce type de questions.

Exemple: À quelle fréquence diriez-vous que vous consommez de la viande?
Modalités:

  • Au moins une fois par jour
  • Plusieurs fois par semaines
  • Au moins 1 fois par semaine
  • Moins souvent
  • Ne consomme pas de viande

Exemple de question: À propos de la phrase suivante : “La musique est un élément important dans ma vie”. Diriez-vous que vous êtes …?

Modalités type échelle de likert:

  • Pas d’accord
  • Plutôt pas d’accord
  • Plutôt d’accord
  • D’accord

Lorsque les extrêmes de l’échelles s’opposent avec un progression, par exemple pour une échelle likert, on peut utiliser des dégradés de couleur divergentes comme dans les visuels ci-dessus.

5 – Questions à échelles numériques (QEN)

Pour une simple question numérique, une bonne façon de visualiser les résultats c’est parfois simplement d’afficher des chiffres. On utilisera au besoin les calculs statistiques simples comme la  somme, la moyenne ou encore la médiane. Les chiffres eux-mêmes attirent beaucoup l’attention. Par conséquent, il vaut mieux en choisir peu et les choisir bien. S’il y’en a trop, ils rendront la DataViz confuse.

Pour un NPS (Net Promoter Score) ou même pour d’autres scores que l’on veut catégoriser, on pourra utiliser les astuces des échelles sémantiques en profitant de la classification Détracteurs / Passifs / Promoteurs.

Exemple de question: quelle note sur 20 attribueriez-vous à ce service/produit?

Moyenne
11,65 / 20

Exemple de question: Sur une échelle de 0 à 10, quelle est la probabilité que vous recommandiez marque/produit à un ami ou un collègue?

Cliquez sur les mages pour aggrandir!

6 – Questions de hiérarchisation (QH)

Pour ces questions, on demande au répondant de hiérarchiser plusieurs éléments selon un critère. Les données sont ordonnées mais ont souvent un caractère nominal. On encodera l’aspect nominal avec des teintes de couleurs différentes et l’aspect ordonné avec un graphique en bar par exemple, en prenant soin d’afficher en premier l’élément le plus important.

On pourra aussi utiliser un graphique plus classique à deux axes en gardant à l’esprit que lorsqu’il s’agit de hiérarchisation, c’est la position la plus élevée qui sera immédiatement perçue comme la plus importante.

Exemple de question: classez ces 3 Fast Food par ordre de préférence
Modalités:
– Burger King
– McDonald’s
– Quick

Cliquez sur les mages pour aggrandir!

Exemple de question: citez les 3 premières marques qui vous viennent à l’esprit

7 – Questions ouvertes (QO)

Enfin, le dernier type de questions traité dans cet article sont les questions ouvertes. Elles ont une spécificité par rapport aux précédentes: elle sont 100% textuelles.

L’analyse d’une question ouverte n’est pas une chose aisée que l’on peut visualiser simplement sans prendre le temps d’en saisir la substance. Il existe maintenant des outils qui permettent l’analyse avancées de l’intention. Cependant, une façon simple de visualiser le contenu d’une question ouverte sans en analyser le sens qui s’y trouve, c’est l’utilisation d’un nuage de mots comme celui qui se trouve ici.

L’exemple de nuage de mots ci-dessus est basé sur une version de l’article que vous lisez.

Notons que tous ces choix conviennent aux résultats d’une question simple. Cependant, lorsqu’il s’agit de croiser les données entre questions ou d’ajouter une composante temporelle ou cartographique, les choix seront évidemment différents bien que les principes utilisés resteront applicables. On utilisera alors d’autres types graphiques: les courbes pour montrer une évolution, les nuages de points pour une tendance ou encore une carte pour des données géographiques.

Précisions que tous ces éléments s’appliquent entièrement aux infographies. Ces dernières ont aussi beaucoup d’intérêt pour communiquer des données complexes visuellement. Mais alors, quelle différence avec la DataViz? La différence c’est l’interactivité, c’est elle qui bouleverse la donne.

Riad Mawlawi, Directeur Digital & Business Development chez Sunergia

Exemple de DataViz

La plupart des articles de Market Insights proposent des DataViz accessibles sur simple inscription. Si vous le souhaitez, vous pourrez ensuite facilement consulter celles qui ont été développées par nos chargés d’études et qui se trouvent à la fin de nos articles.

Pour finir, voici en clair l’une des dernières DataViz publiée pour notre top des marques les plus connues au Maroc en 2020. Cliquez sur les images qui représentent les critères sociodémographiques (sexe, âge, revenus, zone d’habitation, région) ou encore sur les catégories (Automobile, Cosmétique, etc.) pour voir le bloc de proportion évoluer en fonction de votre sélection.

Exemple de DataViz

La plupart des articles de Market Insights proposent des DataViz accessibles sur simple inscription. Si vous le souhaitez, vous pourrez ensuite facilement consulter celles qui ont été développées par nos chargés d’études et qui se trouvent à la fin de nos articles.

Pour finir, voici en clair l’une des dernières DataViz publiée pour notre top des marques les plus connues au Maroc en 2020. Cliquez sur les images qui représentent les critères socioéconomiques comme le sexe, les tranches d’âge ou la zone d’habitation pour voir le bloc de proportion évoluer en fonction de votre sélection.

Si vous le voulez, vous pouvez visiter cette page sur un écran plus grand et avoir accès à une plus grande DataViz et donc à plus de critères comme les revenus ou les catégories des marques (Automobile, Cosmétique, etc.)

Share This