Boîte à moustaches
Une boîte à moustaches (ou diagramme en boîte) permet de visualiser des informations clés d'une série statistique. Les informations suivantes sont nécessaires sur un diagramme en boîte :
le minimum ;
le maximum ;
le premier quartile, (\(Q_1\)) ;
la médiane (\(Q_2\)) ;
le troisième quartile, (\(Q_3\)).
Sur le diagramme en boîte ci-dessous, le minimum est \(158\) et le maximum est \(166\). Autrement dit, la plus petite valeur de la série statistique est \(158\) et la plus grande valeur de la série statistique est \(166\).
Fig. 1 - Un exemple d'un diagramme en boîte
De plus, le premier quartile est \(160{,}5\), la médiane est \(163\) et le troisième quartile est \(165{,}5\). Si tu ne te sens pas à l'aise avec les quartiles, nous détaillons tout ce qu'il faut savoir plus bas dans cette explication.
Il est également possible de noter des valeurs aberrantes sur une boîte à moustaches. Il s'agit de valeurs qui sont très distantes de toutes les autres valeurs mesurées. Or, nous ne prenons souvent pas en compte ces valeurs.
Un diagramme en boîte nous montre la dispersion des données. Regardons cela de plus près.
Indicateurs de dispersion
Un indicateur de dispersion donne une idée de la distribution des valeurs d'une série statistique. En d'autres termes, cela nous permet de savoir si les valeurs de la série statistique sont très proches ou assez éloignées. Plus élevé l'indicateur de dispersion, plus éloignées sont les données. Ici, nous détaillons deux indicateurs de dispersion qui sont pertinents dans l'interprétation d'un diagramme en boîte : l'étendue et l'écart interquartile.
Étendue
L'étendue est la différence entre le maximum et le minimum. Si l'étendue est relativement petit, nous pouvons imaginer que les valeurs de la série statistique sont très proches.
Fig. 2 - Comment interpréter un diagramme en boîte
Le minimum et le maximum du diagramme en boîte en haut sont \(163\) et \(155\), respectivement. L'étendue de la série statistique est donc \(163 - 155 = 8\).
Pour le diagramme en boîte en bas, le maximum est \(166\) et le minimum est \(158\), respectivement. L'étendue de la série statistique est donc \(166 - 158 = 8\).
Même si globalement les valeurs d'une série statistique sont plus élevées que l'autre, elles sont également étalées.
L'étendue n'est qu'une donnée qui nous aide à interpréter la dispersion d'une série statistique. Les deux séries ci-dessus ont la même étendue, mais ne sont pas tout à fait étalées de la même façon. Avant de voir comment interpréter l'écart interquartile, détaillons ce qu'il faut savoir sur les quartiles.
Quartiles
Les quartiles d'une série statistique la séparent en quatre parties.
Le premier quartile, noté \(Q_1\), est la plus petite valeur de la série statistique, telle qu'au moins un quart des valeurs sont inférieures ou égales.
Le deuxième quartile, noté \(Q_2\), est la plus petite valeur de la série statistique, telle que la moitié des valeurs sont inférieures ou égales.
Le troisième quartile, noté \(Q_3\), est la plus petite valeur de la série statistique, telle qu'au moins trois quarts des valeurs sont inférieures ou égales.
La médiane est la même chose que le deuxième quartile.
Calculons les quartiles de la série suivante : \(47, 50, 62, 76, 98, 54, 38, 66, 24\).
Il faut d'abord mettre les valeurs en ordre croissant : \(24, 38, 47, 50, 54, 62, 66, 76, 98\).
Comme l'effectif est \(9\), la médiane est la cinquième valeur, \(54\). Les valeurs inférieures ou égales à la médiane sont : \(24, 38, 47, 50, 54\). Le premier quartile est donc \(47\). De même, les valeurs supérieures ou égales à la médiane sont : \(54, 62, 66, 76, 98\). Le troisième quartile est donc \(66\).
Écart interquartile
L'écart interquartile est la différence entre le troisième quartile et le premier quartile. Nous pouvons donc utiliser la formule suivante : \[ \text{EI} = Q_3 - Q_1 \] Voyons maintenant comment interpréter cet indicateur de dispersion.
Fig. 3 - Interpréter un diagramme en boîte
Le premier quartile et le troisième quartile du diagramme en boîte en haut sont \(157{,}5\) et \(161\), respectivement. L'écart interquartile de la série statistique est donc \(161 - 157{,}5 = 3{,}5\).
Pour le diagramme en boîte en bas, le premier quartile est \(160{,}5\) et le minimum est \(165{,}5\), respectivement. L'écart interquartile de la série statistique est donc \(165{,}5 - 160{,}5 = 5\).
Même si les étendues des deux séries statistiques sont les mêmes, l'écart interquartile du diagramme en boîte en bas est plus élevé. Cela veut dire que la série correspondante est plus étalée que l'autre.
Diagramme en boîte - Points clés
- Un diagramme en boîte est un diagramme qui montre :
- le minimum ;
- le maximum ;
- le premier quartile, (\(Q_1\)) ;
- la médiane (\(Q_2\)) ;
- le troisième quartile, (\(Q_3\)).
- Un indicateur de dispersion montre si les valeurs de la série statistique sont très proches ou assez éloignées.
- L'étendue est la différence entre le maximum et le minimum.
- Les quartiles d'une série statistique la divisent en quatre parties.
- L'écart interquartile est la différence entre le troisième quartile et le premier quartile : \( \text{EI} = Q_3 - Q_1 \).
Comment tu t'assures que ton contenu est précis et digne de confiance ?
Chez StudySmarter, tu as créé une plateforme d'apprentissage qui sert des millions d'étudiants. Rencontre les personnes qui travaillent dur pour fournir un contenu basé sur des faits et pour veiller à ce qu'il soit vérifié.
Processus de création de contenu :
Lily Hulatt est une spécialiste du contenu numérique avec plus de trois ans d’expérience en stratégie de contenu et en conception de programmes. Elle a obtenu son doctorat en littérature anglaise à l’Université de Durham en 2022, a enseigné au Département d’études anglaises de l’Université de Durham, et a contribué à plusieurs publications. Lily se spécialise en littérature anglaise, langue anglaise, histoire et philosophie.
Fais connaissance avec Lily
Processus de contrôle de la qualité du contenu:
Gabriel Freitas est un ingénieur en intelligence artificielle possédant une solide expérience en développement logiciel, en algorithmes d’apprentissage automatique et en IA générative, notamment dans les applications des grands modèles de langage (LLM). Diplômé en génie électrique de l’Université de São Paulo, il poursuit actuellement une maîtrise en génie informatique à l’Université de Campinas, avec une spécialisation en apprentissage automatique. Gabriel a un solide bagage en ingénierie logicielle et a travaillé sur des projets impliquant la vision par ordinateur, l’IA embarquée et les applications LLM.
Fais connaissance avec Gabriel