Que signifient les graphiques statistiques ?
Les données sont généralement rassemblées sous forme de chiffres, de mots ou de caractères, qui peuvent être organisés en tableaux selon le contexte. Mais jeter un coup d'œil à un tableau massif ne te dit pas grand-chose, il faudrait que tu prêtes une attention particulière à chaque enquête. Tu devras peut-être même faire des calculs pour comparer deux enquêtes ! Ce n'est pas très pratique.
Une façon de mieux comprendre ce que les données te disent est de les organiser en graphiques statistiques.
Un graphique statistique est un graphique qui organise les données, permettant une visualisation plus claire.
Cette définition est assez générale, car il existe de nombreuses façons d'organiser les données, et donc de nombreux graphiques statistiques différents que tu peux utiliser. Selon le contexte, tu pourras en choisir un plutôt qu'un autre pour afficher tes données.
Ici, tu pourras jeter un coup d'œil aux différents types de graphiques statistiques, afin de choisir celui qui correspond le mieux à tes besoins en matière d'affichage de données !
Importance des graphiques statistiques
Avant de parler des différents types de graphiques statistiques, tu dois comprendre pourquoi il est important d'afficher les données dans des graphiques statistiques. Il y a trois avantages principaux que tu peux tirer d'un affichage adéquat de tes données :
- Les données brutes peuvent contenir des modèles et des relationscachés que tu ne peux pas identifier en regardant simplement les données brutes. Ils seront révélés à l'aide d'une image.
- Un affichage des données t'aidera à identifier les caractéristiques les plus significatives de tes données.
- Tu pourras communiquer les données de façon plus simple.
Chaque fois que tu as la possibilité d'afficher des données à l'aide d'un graphique, saisis-la. De nos jours, la plupart des logiciels statistiques peuvent afficher et organiser les données de manière simple et directe.
Afficher des données catégorielles
Commence par rappeler ce que sont les données catégorielles.
Les donnéescatégorielles sont des données dont les propriétés sont décrites ou étiquetées.
Des exemples de données catégorielles sont des choses comme la saveur, la couleur, la race, les codes postaux, les noms, etc.
Dans le contexte des graphiques statistiques, chaque fois que tu as affaire à des données catégorielles, tu comptes combien de demandes entrent dans chaque catégorie. Ce nombre que tu comptes est connu sous le nom de fréquence, et chaque fois que tu vas afficher des données catégorielles, tu dois d'abord mettre la main sur un tableau de fréquence.
Un tableau de fréquence est un enregistrement des différentes catégories (ou valeurs) avec leur fréquence.
Les tableaux de fréquence peuvent être utilisés pour des données catégorielles ou quantitatives.
Voici un exemple qui servira de point de départ pour les différents types de graphiques statistiques.
Deux de tes amis sont d'excellents cuisiniers, ils décident donc de monter une affaire pour gagner un peu plus d'argent pendant l'été. Ils décident de vendre des glaces artisanales, mais comme ils travailleront dans une petite cuisine, ils ne pourront pas vendre une grande variété de parfums de glace.
Pour décider des parfums sur lesquels ils devraient se concentrer, tu effectues un sondage dans ton quartier en demandant les parfums de glace préférés. Tu organises les données dans le tableau de fréquence suivant.
Parfum | Fréquence |
Chocolat | \(15\) |
Vanille | \(14\) |
Fraise | \(9\) |
Menthe-Chocolat | \(3\) |
Pâte à biscuits | \(9\) |
Tableau 1. Parfums de crème glacée, graphiques statistiques.
Alors que tu retournes avec tes amis pour leur communiquer tes résultats, tu te rends compte qu'ils sont peut-être fatigués à cause de la préparation de la cuisine. C'est pourquoi tu décides d'abord de faire un affichage plus convivial des données, pour qu'ils n'aient pas à regarder des chiffres bruts.
Il est temps de voir quelles sont les options qui s'offrent à toi pour présenter ton enquête sur les parfums de crème glacée.
Diagrammes à barres
Les diagrammes à barres sont assez simples. Tu alignes les différentes catégories de ton enquête et tu dessines les barres en fonction de la fréquence de chaque variable catégorielle. Plus la fréquence est élevée, plus la barre est haute.
Il y a deux façons de dessiner des diagrammes à barres : Utiliser des barres verticales et utiliser des barres horizontales.
Le type de diagramme à barres le plus courant est celui qui utilise des barres verticales. Pour dessiner un diagramme à barres verticales, tu dois d'abord écrire les différentes catégories sur l'axe horizontal, puis la plage de fréquences sur l'axe vertical. Pour ton exemple des parfums de crème glacée, cela donnera ceci :
Figure 1. Diagramme à barres vide
Ensuite, tu devras dessiner des barres dont la hauteur va jusqu'à la fréquence de chaque variable. En général, on utilise des couleurs différentes et on choisit la largeur des barres de façon à ce qu'elles ne soient pas adjacentes les unes aux autres.
Figure 2. Diagramme à barres verticales des parfums de glace préférés de tes voisins.
Pour dessiner un diagramme à barres horizontales, tu suis la même idée, mais maintenant les variables sont alignées verticalement, tandis que les fréquences sont alignées horizontalement.
Figure 3. Diagramme à barres horizontales des parfums de glace préférés de tes voisins
Graphiques en camembert
Les diagrammes circulaires sont une façon très courante d'afficher des données. Ils représentent la population entière sous la forme d'un cercle, qui est segmenté en différentes catégories de ton enquête. Plus la fréquence d'une catégorie est élevée, plus la portion du cercle est grande.
Comme les diagrammes circulaires divisent un cercle en secteurs, on les appelle aussi diagrammes sectoriels.
Pour faire un diagramme circulaire, tu devras faire un tableau de fréquences relatives, qui est le même tableau de fréquences mais avec une colonne qui montre la fréquence relative de chaque catégorie.
Tu peux trouver la fréquence relative en divisant la fréquence respective par le total des enquêtes (qui est égal à la somme de toutes les fréquences).
Pour trouver la fréquence relative de l'arôme chocolat, tu dois d'abord noter que ton enquête est composée de \(50\) questions. Ensuite, tu dois diviser la fréquence de l'arôme chocolat par ce nombre, c'est-à-dire
\N[ \Nfrac{15}{50} = 0,3\N]
Généralement, tu devras écrire ce résultat sous forme de pourcentage, alors multiplie-le par \(100\). Cela signifie que la fréquence relative est de \(30 \%\).
Cette fréquence relative correspond au pourcentage de la population qui appartient à chaque catégorie. Voici un tableau avec la fréquence relative des autres parfums de crème glacée.
Saveur | Fréquence relative | Fréquence relative |
Chocolat | \[15\] | \[30 \% \] |
Vanille | \[14\] | \[28 \% \] |
Fraise | \[9\] | \[ 18 \% \] |
Menthe-Chocolat | \[3\] | \[ 6 \% \] |
Pâte à biscuits | \[9\] | \[ 18 \% \] |
Tableau 2. Parfums de crème glacée, graphiques statistiques.
Assure-toi que la somme des fréquences relatives est égale à \N( 100 \N% \N).
Maintenant que tu connais les fréquences relatives de chaque catégorie, tu peux passer au dessin du diagramme circulaire. Rappelle-toi que la fréquence relative t'indique le pourcentage du cercle de chaque catégorie.
Figure 4. Diagramme circulaire des parfums de glace préférés de tes voisins.
Diagrammes à barres segmentées
Les diagrammes à barres segmentées sont pratiquement un hybride entre un diagramme à barres et un diagramme circulaire, plus proche d'un diagramme circulaire. Au lieu d'utiliser un cercle et de le diviser en secteurs, tu divises une grande barre en segments, où chaque segment représente une catégorie.
Les diagrammes à barres segmentées sont généralement utilisés lorsqu'il s'agit de comparer deux ou plusieurs ensembles de données. Dans l'exemple des crèmes glacées, supposons que tu veuilles étendre ton enquête au quartier suivant, de cette façon tu pourras avoir une meilleure idée des parfums de crème glacée sur lesquels tes amis devraient se concentrer. Voici un tableau de l'enquête sur le quartier.
Parfum | Fréquence | Fréquence relative |
Chocolat | \[16\] | \[32 \%\] |
Vanille | \[12\] | \[ 24\%\] |
Fraise | \[7\] | \[ 14\%\] |
Menthe-Chocolat | \[5\] | \[ 10\%\] |
Pâte à biscuits | \[10\] | \[ 20\%\] |
Tableau 3. Saveurs de crème glacée, graphiques statistiques.
Comme le but des diagrammes à barres segmentées est de comparer deux ensembles de données, un tableau avec la fréquence relative des deux quartiers sera très utile.
Saveur | Fréquence relative (A) | Fréquence relative (B) |
Chocolat | \[30 \%\] | \[32 \%\] |
Vanille | \[28 \%\] | \[24 \%\] |
Fraise | \[18 \%\] | \[14 \%\] |
Menthe-Chocolat | \[6 \%\] | \[10 \%\] |
Pâte à biscuits | \[18 \%\] | \[20 \%\] |
Tableau 4. Parfums de crème glacée, graphiques statistiques.
Tu peux maintenant dessiner le diagramme à barres segmenté. En général, les deux ensembles de données sont placés l'un à côté de l'autre pour pouvoir les comparer.
Figure 5. Diagramme à barres segmenté des parfums de crème glacée préférés de deux quartiers.
Les diagrammes en bâtons segmentés affichent généralement la fréquence relative des données, tu auras donc également besoin d'un tableau avec des fréquences relatives pour dessiner un diagramme en bâtons segmentés. Tu peux aussi utiliser des diagrammes en bâtons segmentés pour représenter les fréquences réelles de tes données, tu dois juste t'assurer que tu utilises une échelle adéquate.
Si les deux ensembles de données sont obtenus à partir d'un nombre différent d'enquêtes, tu devrais probablement t'en tenir aux fréquences relatives. De cette façon, les deux ensembles de données resteront sur la même échelle.
Affichage des données quantitatives
Il est temps de voir ce que sont les données quantitatives.
Les donnéesquantitatives sont des données qui peuvent être mesurées ou comptées.
Quelques exemples de données catégorielles sont des choses comme l'âge, la taille, le poids, la longueur, le volume, etc.
Pour les données quantitatives, il ne serait pas pratique d'afficher chaque valeur possible en utilisant, par exemple, un histogramme. Supposons que tu mesures la taille de tes camarades de classe. Ces valeurs varieront généralement de \(64\) à environ \(74\) pouces (plus ou moins). Mais comme il s'agit de données mesurables, tu auras affaire à un grand nombre de valeurs, et tu devras donc inclure de nombreuses barres pour les représenter !
Au lieu de cela, tu peux travailler avec des fourchettes, c'est-à-dire que tu peux prendre en compte les personnes dont la taille est comprise entre \(64\) et \(66\) pouces et les laisser se situer au même endroit.
Une variable quantitative typique est la taille.
Supposons que tu veuilles faire une enquête sur la taille de tes camarades de classe. Pour te faciliter la tâche, ils sont tous alignés du plus petit au plus grand. Tu écris les valeurs suivantes, en pouces :
\[64, 65, 65, 65, 66, 66, 66, 66, 66, 66, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67, 68, 68, 68, 68,69, 69, 69, 70, 70, 71, 72].
Tu utiliseras ces valeurs pour aborder les différents affichages de données quantitatives.
Histogramme
Un histogramme ressemble beaucoup à un diagramme à barres. Les deux utilisent des barres ! La différence est que les barres de l'histogramme sont placées les unes à côté des autres et qu'elles sont généralement de la même couleur.
Pour dessiner un histogramme, tu dois choisir comment diviser l'étendue des données. Dans ton exemple de la taille, il serait bon de l'afficher en différences de \(2\) pouces. Tu devras additionner les fréquences en conséquence et faire un autre tableau.
Hauteur de la plage | Fréquence |
\N- 64 \N- h < 66 \N] | \[4\] |
\N- [66 \N h < 68 \N] | \[13\] |
\N- [68 \N - 70 \N] | \[7\] |
\N- [70 \N h < 72 \N] | \[3\] |
\N- [72 \N h < 74 \N] | \[1\] |
Tableau 5. Fréquence des hauteurs, graphiques statistiques.
Tout comme dans un diagramme à barres, la hauteur de chaque barre représente la fréquence de chaque plage de données.
Figure 6. Histogramme des tailles de tes camarades de classe.
Graphiques en pointillés
Les diagrammes en points sont une autre façon simple d'afficher des données quantitatives. Pense à un histogramme, mais au lieu de placer des barres, tu places un point pour chaque valeur dans l'intervalle correspondant. Les points s'empilent les uns sur les autres (ou à droite si tu dessines un graphique horizontal) et constituent un moyen facile de compter les fréquences.
Figure 7. Diagramme en points de la taille de tes camarades de classe
Le diagramme de points ci-dessus est dessiné verticalement, mais sache que tu peux aussi les trouver dessinés horizontalement.
Interprétation des graphiques statistiques
Comme nous l'avons déjà mentionné, les graphiques statistiques sont utiles parce que tu peux interpréter les données en fonction de la façon dont elles sont réparties. Prends par exemple le diagramme à barres segmenté des parfums de glace préférés de tes voisins.
Figure 8. Diagramme à barres segmenté des parfums de glace préférés de deux quartiers.
À partir de là, tu peux facilement voir qu'indépendamment du quartier dans lequel tu te trouves, les parfums de crème glacée les plus populaires sont le chocolat, la vanille et la fraise. Cela suggère que tes amis devraient d'abord s'efforcer d'obtenir une bonne recette pour ces parfums !
Considère maintenant l'histogramme des tailles de tes camarades de classe.
Figure 9. Histogramme des tailles de tes camarades de classe
Tu peux remarquer que la plupart de tes camarades de classe mesurent entre 66 et 68 pouces, alors que quelques-uns sont beaucoup plus grands ou plus petits. Cela suggère que la plupart des données sont regroupées autour de la moyenne avec seulement quelques valeurs aberrantes, ce qui est un sujet central dans les statistiques.
Pour plus d'informations à ce sujet, consulte notre article sur la distribution normale !
Autres exemples de graphiques statistiques
Tu trouveras ici d'autres exemples de graphiques statistiques. Commençons par les données descriptives.
Pendant que tu t'informais sur la taille de tes camarades de classe, tu as aussi pensé à leur poser des questions sur leur sport préféré. Voici les résultats de cette enquête.
Sport préféré | Fréquence |
Football | \[7\] |
Football | \[5\] |
Basket-ball | \[10\] |
Baseball | \[6\] |
Autre | \[2\] |
Tableau 6. Sport préféré et fréquence, graphiques statistiques.
Tu as maintenant besoin d'un moyen agréable d'afficher ces données.
- Fais un diagramme à barres de ces données.
- Fais un diagramme circulaire de ces données.
Solutions :
a. Pour faire un diagramme à barres, il te suffit de dessiner une barre pour chaque catégorie que tu as dans tes données. La hauteur de chaque barre correspondra à la fréquence de chaque catégorie.
Figure 10. Diagramme en barres des préférences sportives de tes camarades de classe.
b. Pour réaliser un diagramme circulaire, tu devras faire un tableau de fréquences relatives. Tu peux trouver la fréquence relative de chaque catégorie en divisant la fréquence respective par le total des enquêtes, puis en la multipliant par \(100\).
Sport préféré | Fréquence | Fréquence relative |
Football | \[7\] | \[ 23.3 \% \] |
Football | \[5\] | \[ 16.7 \%\ \] |
Basket-ball | \[10\] | \[ 33.3 \% \] |
Baseball | \[6\] | \[ 20.0 \% \] |
Autres | \[2\] | \[6.7 \% \] |
Tableau 7. Sport préféré, fréquence et fréquence relative, graphiques statistiques.
Tu peux ainsi savoir quelle est la taille des parts du gâteau ! Voici le graphique.
Figure 11. Graphique circulaire des préférences sportives de tes camarades de classe.
Et pourquoi pas des graphiques affichant des données quantitatives ?
Alors qu'il travaille dans une boutique de souvenirs, un de tes amis te demande si tu pourrais lui dire plus ou moins combien d'argent il devrait dépenser pour un souvenir pour sa mère.
Pour lui donner une réponse adéquate, tu décides de faire des statistiques ! Tu vas dans la base de données du magasin et tu classes les prix des souvenirs du moins cher au plus cher. Pour simplifier les choses, les prix sont arrondis au centime supérieur.
\[ \begin{align} &0.5, 0.5, 1, 1, 1, 1.5, 2, 2, 2, 2, 2, 2, 2.5, 2.5, 3, 3, 3, 3, 3.5, \\ &4, 5, 5, 5, 5, 5, 5, 5, 5, 5.5, 6, 7, 7.5, 8.5, 9, 9.5, 10, 10, 10 \end{align}\]
- Fais un histogramme de ces données.
- Fais un diagramme en points de ces données.
Solution :
a. Pour réaliser l'histogramme, tu dois d'abord choisir un intervalle approprié pour regrouper les données. Tu peux diviser ces données en dollars entiers. La première barre représentera tous les souvenirs qui coûtent moins de 1 dollar, la deuxième barre sera celle qui représente les souvenirs qui coûtent 1 dollar ou plus, mais moins de 2 dollars, et ainsi de suite.
Figure 12. Histogramme des prix des souvenirs dans une boutique de cadeaux
b. Celui-ci est une tâche plus simple car tu n'as pas besoin de regrouper les prix par plages. Ici, il te suffit de dessiner un point l'un au-dessus de l'autre pour chaque souvenir avec le prix correspondant.
Figure 13. Diagramme en points des prix des souvenirs dans une boutique de cadeaux.
Graphiques statistiques - Principaux enseignements
- Un graphique statistique est un graphique qui organise les données, ce qui permet une visualisation plus claire.
- Les graphiques statistiques :
- Révèlent des modèles et des relationscachés que tu ne peux pas identifier en regardant simplement les données brutes.
- Identifient les caractéristiques les plus significatives de tes données.
- Communiquent les données de façon plus simple.
- Les données catégorielles et quantitatives peuvent être affichées à l'aide de graphiques statistiques
- Les données catégorielles sont généralement affichées à l'aide de diagrammes à barres, de diagrammes à secteurs et de diagrammes à barres empilées.
- Les données quantitatives sont généralement affichées à l'aide d'histogrammes et de diagrammes en points.
- Un diagramme à barres se compose de barres de différentes hauteurs représentant les données catégorielles de ton enquête. La hauteur de la barre correspond à la fréquence de chaque catégorie.
- Un diagramme circulaire est constitué d'un cercle divisé en secteurs. La surface de chaque secteur correspond à la fréquence relative de chaque catégorie.
- Lesdiagrammes à barres empilées sont utilisés pour comparer deux ensembles de données catégorielles. Ils se composent de deux barres ou plus, où chaque barre est constituée de barres plus petites empilées les unes sur les autres en fonction de la fréquence relative de chaque catégorie.
- Leshistogrammes sont semblables aux diagrammes à barres, mais les barres sont adjacentes et généralement toutes de la même couleur. Ils sont utilisés pour représenter des données quantitatives divisées en plages.
- Les diagrammesen points placent des points à la place des barres pour chaque valeur qui se situe dans la fourchette. Chaque point est empilé sur l'autre pour chaque valeur comprise dans la fourchette correspondante.