Sauter à un chapitre clé
Comparer des distributions de données
Lorsque tu compares plusieurs distributionsa> de données, tu peux faire des commentaires sur les éléments suivants
Une mesure de localisation - une mesure de localisation est utilisée pour résumer un ensemble de données à l'aide d'une seule valeur. Par exemple, la moyenne et la médiane sont des mesures de localisation.
Unemesure de dispersion - une mesure de dispersion nous fournit des informations concernant la variabilité des données dans un ensemble de données donné, c'est-à-dire à quel point les différents points d'un ensemble de données sont proches ou éloignés les uns des autres. L'écart type et l'écart interquartile sont des exemples de mesures de dispersion.
Tu peux comparer différentes distributions de données en utilisant la moyenne et l'écart type, ou en utilisant la médiane et l'écart interquartile. Dans les cas où les ensembles de données contiennent des valeurs extrêmes et/ou des valeurs aberrantes, il est généralement plus approprié d'utiliser la médiane et l'écart interquartile.
N'utilise pas la médiane et l'écart-type ensemble ou la moyenne et les intervalles interquartiles ensemble.
Explorons ce concept plus en détail à l'aide d'exemples.
Comparaison de la moyenne et des écarts types d'ensembles de données
Les températures moyennes journalières au cours du mois d'août sont enregistrées à Heathrow et à Leeming. Pour Heathrow, ∑x=562, ∑x²=10301,2. Pour Leeming, la température moyenne était de 15,6°C avec un écart type de 2,01° C.
a) Calcule la moyenne et l'écart-type pour Heathrow. b) Compare les données de Heathrow avec celles de Leeming.
Solutions
Pour Heathrow,
\(\begin{align} mean &= \frac {\sum{x}}{n}) \N- &= \Nfrac{562}{31} = 18.1ºC \Nend{align}\N)
\(Écart-type = \sqrt{\frac{\sum{x^2}}{n} - (\frac{\sum{x}}{n})^2} = \sqrt {\frac{10301.2}{31} - (\frac{562}{31})^2} = 1.91ºC\N-)
b) D'après les informations ci-dessus, nous constatons que la température moyenne à Heathrow au mois d'août était plus élevée que celle de Leeming, et que l'écart/variabilité des températures était moins important que celui de Leeming.
Une entreprise collecte les délais de livraison en minutes des fournisseurs A et B pour une période de 20 jours. Voici le résultat des données collectées. Compare les performances des deux fournisseurs.
fournisseurs | ∑x | ∑x² |
A | 360 | 18000 |
B | 300 | 29000 |
solutions
Pour le fournisseur A,
\(\N- début{alignement} moyenne_A &= \frac {\sum x}{n} \N &= \frac{360}{20} = 18 \Nend{align}\N)
Pour le fournisseur B,
\(\N- début{alignement} moyenne_B &= \Nfrac {\sum x}{n}) \N- &= \frac{300}{20} = 15 \Nend{align}\N)
D'après les informations ci-dessus, nous constatons que le fournisseur A a un délai de livraison plus long, tandis que le fournisseur B a un délai de livraison plus étalé.
Considère l'exemple ci-dessus dans un contexte réel. Si l'entreprise souhaite conserver l'un de ses fournisseurs et se défaire de l'autre, elle pourrait comparer les données ci-dessus comme nous l'avons fait. Si la priorité de l'entreprise est de réduire les délais de livraison en moyenne, elle privilégierait le fournisseur B. Si la priorité est en revanche une plus grande fiabilité, elle privilégierait le fournisseur qui présente le moins de variabilité, et ce serait le fournisseur A.
Comparer la médiane et l'écart interquartile d'ensembles de données
Les élèves de deux sections différentes passent un examen. Les notes quartiles et médianes de chaque section sont fournies. Compare les performances des deux sections.
Section | médiane | ||
Section 1 | 58 | 71 | 87 |
Section 2 | 62 | 74 | 83 |
Solutions
L'écart interquartile pour la section 1 = Q3 - Q1= 87-58 = 29
L'écart interquartile pour la section 2 = Q3 - Q1= 83-62 = 21
D'après les données fournies, nous constatons que la médiane des notes est plus élevée pour la section 2, tandis que la variabilité des notes est plus élevée dans la section 1.
Une entreprise collecte les délais de livraison des fournisseurs, A et B, pour une période de 20 jours. Le délai de livraison médian était de 4 heures pour le fournisseur A, et de 3 heures pour le fournisseur B. L'écart interquartile pour le fournisseur A était de 0,8 heure et pour le fournisseur B de 1,5 heure.
Compare les performances des fournisseurs en termes de rapidité et de fiabilité.
Solutions
Le fournisseur B semble être le plus efficace en termes de rapidité avec un délai de livraison médian inférieur. Le fournisseur A semble être plus fiable avec un délai de livraison plus court.
Comparaison des données - Principaux enseignements
- Dans de nombreuses applications du monde réel, nous devons comparer des informations entre plusieurs ensembles de données.
- Lorsque tu compares plusieurs distributions de données, tu peux faire des commentaires sur
- une mesure de l'emplacement
- une mesure de l'étendue
- Tu peux comparer différentes distributions de données en utilisant la moyenne et l'écart type, ou en utilisant la médiane et les intervalles interquartiles.
Apprends avec 5 fiches de Comparer des données dans l'application gratuite StudySmarter
Tu as déjà un compte ? Connecte-toi
Questions fréquemment posées en Comparer des données
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus