Tu as probablement déjà rencontré des méthodes d'analyse et d'interprétation des données dans des distributions de données données données. Dans de nombreuses applications du monde réel, nous sommes amenés à comparer des informations entre plusieurs ensembles de données. Voyons comment comparer des données entre des distributions de données.
Une mesure de localisation - une mesure de localisation est utilisée pour résumer un ensemble de données à l'aide d'une seule valeur. Par exemple, la moyenne et la médiane sont des mesures de localisation.
Unemesure de dispersion - une mesure de dispersion nous fournit des informations concernant la variabilité des données dans un ensemble de données donné, c'est-à-dire à quel point les différents points d'un ensemble de données sont proches ou éloignés les uns des autres. L'écart type et l'écart interquartile sont des exemples de mesures de dispersion.
Tu peux comparer différentes distributions de données en utilisant la moyenne et l'écart type, ou en utilisant la médiane et l'écart interquartile. Dans les cas où les ensembles de données contiennent des valeurs extrêmes et/ou des valeurs aberrantes, il est généralement plus approprié d'utiliser la médiane et l'écart interquartile.
N'utilise pas la médiane et l'écart-type ensemble ou la moyenne et les intervalles interquartiles ensemble.
Explorons ce concept plus en détail à l'aide d'exemples.
Comparaison de la moyenne et des écarts types d'ensembles de données
Les températures moyennes journalières au cours du mois d'août sont enregistrées à Heathrow et à Leeming. Pour Heathrow, ∑x=562, ∑x²=10301,2. Pour Leeming, la température moyenne était de 15,6°C avec un écart type de 2,01° C.
a) Calcule la moyenne et l'écart-type pour Heathrow. b) Compare les données de Heathrow avec celles de Leeming.
b) D'après les informations ci-dessus, nous constatons que la température moyenne à Heathrow au mois d'août était plus élevée que celle de Leeming, et que l'écart/variabilité des températures était moins important que celui de Leeming.
Une entreprise collecte les délais de livraison en minutes des fournisseurs A et B pour une période de 20 jours. Voici le résultat des données collectées. Compare les performances des deux fournisseurs.
D'après les informations ci-dessus, nous constatons que le fournisseur A a un délai de livraison plus long, tandis que le fournisseur B a un délai de livraison plus étalé.
Considère l'exemple ci-dessus dans un contexte réel. Si l'entreprise souhaite conserver l'un de ses fournisseurs et se défaire de l'autre, elle pourrait comparer les données ci-dessus comme nous l'avons fait. Si la priorité de l'entreprise est de réduire les délais de livraison en moyenne, elle privilégierait le fournisseur B. Si la priorité est en revanche une plus grande fiabilité, elle privilégierait le fournisseur qui présente le moins de variabilité, et ce serait le fournisseur A.
Comparer la médiane et l'écart interquartile d'ensembles de données
Les élèves de deux sections différentes passent un examen. Les notes quartiles et médianes de chaque section sont fournies. Compare les performances des deux sections.
Section
médiane
Section 1
58
71
87
Section 2
62
74
83
Solutions
L'écart interquartile pour la section 1 = Q3 - Q1= 87-58 = 29
L'écart interquartile pour la section 2 = Q3 - Q1= 83-62 = 21
D'après les données fournies, nous constatons que la médiane des notes est plus élevée pour la section 2, tandis que la variabilité des notes est plus élevée dans la section 1.
Une entreprise collecte les délais de livraison des fournisseurs, A et B, pour une période de 20 jours. Le délai de livraison médian était de 4 heures pour le fournisseur A, et de 3 heures pour le fournisseur B. L'écart interquartile pour le fournisseur A était de 0,8 heure et pour le fournisseur B de 1,5 heure.
Compare les performances des fournisseurs en termes de rapidité et de fiabilité.
Solutions
Le fournisseur B semble être le plus efficace en termes de rapidité avec un délai de livraison médian inférieur. Le fournisseur A semble être plus fiable avec un délai de livraison plus court.
Comparaison des données - Principaux enseignements
Dans de nombreuses applications du monde réel, nous devons comparer des informations entre plusieurs ensembles de données.
Lorsque tu compares plusieurs distributions de données, tu peux faire des commentaires sur
une mesure de l'emplacement
une mesure de l'étendue
Tu peux comparer différentes distributions de données en utilisant la moyenne et l'écart type, ou en utilisant la médiane et les intervalles interquartiles.
Apprends plus vite avec les 5 fiches sur Comparer des données
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Comparer des données
Qu'est-ce que comparer des données en mathématiques?
Comparer des données en mathématiques consiste à analyser et évaluer des ensembles de données pour identifier des similitudes et des différences.
Quels outils sont utilisés pour comparer des données?
On utilise des tableaux, des graphiques, des diagrammes en barres, des diagrammes circulaires, et des histogrammes pour comparer les données.
Pourquoi est-il important de comparer des données?
Comparer des données permet de prendre des décisions informées, de repérer des tendances et de faire des prévisions basées sur les informations recueillies.
Comment analyser des données comparées?
Analyser des données comparées implique l'examen des mesures centrales comme la moyenne, la médiane, et l'écart-type pour comprendre les distributions et les variations.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.