Boîte à moustaches
Une boîte à moustaches (ou diagramme en boîte) permet de visualiser des informations clés d'une série statistique. Les informations suivantes sont nécessaires sur un diagramme en boîte :
le minimum ;
le maximum ;
le premier quartile, (\(Q_1\)) ;
la médiane (\(Q_2\)) ;
le troisième quartile, (\(Q_3\)).
Sur le diagramme en boîte ci-dessous, le minimum est \(158\) et le maximum est \(166\). Autrement dit, la plus petite valeur de la série statistique est \(158\) et la plus grande valeur de la série statistique est \(166\).
Fig. 1 - Un exemple d'un diagramme en boîte
De plus, le premier quartile est \(160{,}5\), la médiane est \(163\) et le troisième quartile est \(165{,}5\). Si tu ne te sens pas à l'aise avec les quartiles, nous détaillons tout ce qu'il faut savoir plus bas dans cette explication.
Il est également possible de noter des valeurs aberrantes sur une boîte à moustaches. Il s'agit de valeurs qui sont très distantes de toutes les autres valeurs mesurées. Or, nous ne prenons souvent pas en compte ces valeurs.
Un diagramme en boîte nous montre la dispersion des données. Regardons cela de plus près.
Indicateurs de dispersion
Un indicateur de dispersion donne une idée de la distribution des valeurs d'une série statistique. En d'autres termes, cela nous permet de savoir si les valeurs de la série statistique sont très proches ou assez éloignées. Plus élevé l'indicateur de dispersion, plus éloignées sont les données. Ici, nous détaillons deux indicateurs de dispersion qui sont pertinents dans l'interprétation d'un diagramme en boîte : l'étendue et l'écart interquartile.
Étendue
L'étendue est la différence entre le maximum et le minimum. Si l'étendue est relativement petit, nous pouvons imaginer que les valeurs de la série statistique sont très proches.
Fig. 2 - Comment interpréter un diagramme en boîte
Le minimum et le maximum du diagramme en boîte en haut sont \(163\) et \(155\), respectivement. L'étendue de la série statistique est donc \(163 - 155 = 8\).
Pour le diagramme en boîte en bas, le maximum est \(166\) et le minimum est \(158\), respectivement. L'étendue de la série statistique est donc \(166 - 158 = 8\).
Même si globalement les valeurs d'une série statistique sont plus élevées que l'autre, elles sont également étalées.
L'étendue n'est qu'une donnée qui nous aide à interpréter la dispersion d'une série statistique. Les deux séries ci-dessus ont la même étendue, mais ne sont pas tout à fait étalées de la même façon. Avant de voir comment interpréter l'écart interquartile, détaillons ce qu'il faut savoir sur les quartiles.
Quartiles
Les quartiles d'une série statistique la séparent en quatre parties.
Le premier quartile, noté \(Q_1\), est la plus petite valeur de la série statistique, telle qu'au moins un quart des valeurs sont inférieures ou égales.
Le deuxième quartile, noté \(Q_2\), est la plus petite valeur de la série statistique, telle que la moitié des valeurs sont inférieures ou égales.
Le troisième quartile, noté \(Q_3\), est la plus petite valeur de la série statistique, telle qu'au moins trois quarts des valeurs sont inférieures ou égales.
La médiane est la même chose que le deuxième quartile.
Calculons les quartiles de la série suivante : \(47, 50, 62, 76, 98, 54, 38, 66, 24\).
Il faut d'abord mettre les valeurs en ordre croissant : \(24, 38, 47, 50, 54, 62, 66, 76, 98\).
Comme l'effectif est \(9\), la médiane est la cinquième valeur, \(54\). Les valeurs inférieures ou égales à la médiane sont : \(24, 38, 47, 50, 54\). Le premier quartile est donc \(47\). De même, les valeurs supérieures ou égales à la médiane sont : \(54, 62, 66, 76, 98\). Le troisième quartile est donc \(66\).
Écart interquartile
L'écart interquartile est la différence entre le troisième quartile et le premier quartile. Nous pouvons donc utiliser la formule suivante : \[ \text{EI} = Q_3 - Q_1 \] Voyons maintenant comment interpréter cet indicateur de dispersion.
Fig. 3 - Interpréter un diagramme en boîte
Le premier quartile et le troisième quartile du diagramme en boîte en haut sont \(157{,}5\) et \(161\), respectivement. L'écart interquartile de la série statistique est donc \(161 - 157{,}5 = 3{,}5\).
Pour le diagramme en boîte en bas, le premier quartile est \(160{,}5\) et le minimum est \(165{,}5\), respectivement. L'écart interquartile de la série statistique est donc \(165{,}5 - 160{,}5 = 5\).
Même si les étendues des deux séries statistiques sont les mêmes, l'écart interquartile du diagramme en boîte en bas est plus élevé. Cela veut dire que la série correspondante est plus étalée que l'autre.
Diagramme en boîte - Points clés
- Un diagramme en boîte est un diagramme qui montre :
- le minimum ;
- le maximum ;
- le premier quartile, (\(Q_1\)) ;
- la médiane (\(Q_2\)) ;
- le troisième quartile, (\(Q_3\)).
- Un indicateur de dispersion montre si les valeurs de la série statistique sont très proches ou assez éloignées.
- L'étendue est la différence entre le maximum et le minimum.
- Les quartiles d'une série statistique la divisent en quatre parties.
- L'écart interquartile est la différence entre le troisième quartile et le premier quartile : \( \text{EI} = Q_3 - Q_1 \).
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Get to know Lily
Content Quality Monitored by:
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
Get to know Gabriel