Lesmesuresstatistiquesa> sont une technique d'analyse descriptive utilisée pour résumer les caractéristiques d'un ensemble de données. Cet ensemble de données peut représenter la population entière ou un échantillon de celle-ci. Les mesures statistiques peuvent être classées en mesures de tendance centrale et en mesures de dispersion.
Lesmesures de tendance centraledécrivent certaines caractéristiques clés de l'ensemble des données en se basant sur les valeurs moyennes ou intermédiaires, car elles décrivent le centre des données. Les mesures de tendance centrale que nous allons étudier sont la moyenne, le mode et la médiane.
Moyenne
La moyenne, également appelée moyenne mathématique d'un ensemble de données donné, peut être trouvée en additionnant toutes les valeurs de l'ensemble de données, et en divisant par le nombre de valeurs. Nous pouvons utiliser une formule mathématique pour décrire cela : \(\mu = \frac{\Sigma x}{n}\) où \(\mu\) est utilisé pour représenter la moyenne.
Nous disposons des notes d'un quiz réalisé par des élèves de mathématiques en classe de6ème. Ils sont 76, 89, 45, 50, 88, 67, 75, 83. Quelle est la moyenne des notes ?
Réponse :
\(\mu = \frac{\Sigma x}{n}\)
La formule ci-dessus signifie que nous allons additionner toutes les notes, puis diviser la somme par le nombre de notes disponibles.
Puisqu'il y a 8 notes disponibles, nous allons diviser notre somme par 8.
\(\mu = \frac{573}{8}\)
Mode
Le mode est la valeur la plus fréquente dans un ensemble de données. Parfois, tu auras un ensemble de données où cela décrit plus d'une valeur. Dans ce cas, elles sont toutes considérées comme le mode.
Trouve le mode pour l'ensemble de données donné 6, 9, 3, 6, 6, 5, 2, 3.
Réponse :
En classant ces valeurs par ordre croissant, tu pourras identifier celle qui se produit le plus souvent.
2, 3, 3, 5, 6, 6, 6, 9
Il est évident que 6 est le nombre qui revient le plus souvent, donc le mode est 6.
Médiane
La médianeest la valeur centrale d'un ensemble de données donné. Dans les cas où les valeurs médianes sont au nombre de deux (lorsque le nombre de points de données est pair), tu dois trouver la moyenne des deux valeurs médianes. Pour trouver la médiane, il convient de réorganiser tes valeurs par ordre croissant. Prends la valeur \(\frac{n+1}{2}\) si le nombre de points de données est impair. Lorsque le nombre est pair, prends la valeur \(\frac{n}{2}\) et la valeur \(\frac{n+2}{2}\).
Les âges de 12 élèves de 11e année ont été recueillis, et les valeurs sont les suivantes : 15, 21, 19, 19, 20, 18, 17, 16, 17, 18, 19, 18. Trouve l'âge médian.
Réponse :
Classe ces valeurs par ordre croissant :
15, 16, 17, 17, 18, 18, 18, 19, 19, 19, 20, 21
Comme le nombre de points de données est pair, nous aurons deux nombres médians, qui sont tous les deux 18. La médiane est donc 18.
Les notes d'un examen passé par 7 étudiants sont données ci-dessous. Trouve le score médian.
87, 56, 78, 66, 73, 71, 79
Réponse :
Réarrange les nombres du plus petit au plus grand.
56, 66, 71, 73, 78, 79, 87
Le nombre de points de valeur est impair, donc le nombre du milieu devient le score médian.
Médiane = 73
Quelles sont les mesures de dispersion ?
Lesmesures de dispersion sont des mesures statistiques qui décrivent la similarité et la variété des valeurs d'ensembles de données donnés. Se fier uniquement aux mesures de la tendance centrale comme description sommaire des ensembles de données peut être très trompeur, car cela ne tient pas compte des valeurs extrêmes. Les mesures de dispersion nous aident à le faire, notamment l'étendue, la variance et l'écart type.
Range
L'étendue est la différence entre les valeurs les plus élevées et les plus basses d'un ensemble de données donné. Elle t'aide à connaître l'étendue des données. Pour trouver l'étendue, la valeur la plus basse des données est soustraite de la valeur la plus élevée.
Trouve l'étendue des âges des 12 élèves d'une classe. Voici tes données : 15, 21, 19, 19, 20, 18, 17, 16, 17, 18, 19, 18.
Réponse :
Valeur la plus élevée = 21
Valeur la plus basse = 15
Étendue = valeur la plus élevée - valeur la plus basse
Il ne peut pas être utilisé pour une distribution ouverte.
Les quartiles et l'écart interquartile
Un quartile est un type de quantile qui divise un ensemble de données ordonnées en quatre parties (quarts). Un quartile n'est pas le groupe de nombres qui a été divisé. C'est le point limite de la division.
L'écart interquartile est la différence entre la valeur du quartile supérieur et celle du quartile inférieur.
Pour trouver le quartile d'un ensemble de données donné, tu peux procéder comme suit :
Ordonne les valeurs par ordre croissant.
Trouve la médiane. Elle est toujours appelée deuxième quartile (Q2).
Trouve maintenant la médiane des deux moitiés de l'ensemble de données. La moitié la plus basse est étiquetée Q1, et la moitié la plus haute est étiquetée Q3.
Trouve l'intervalle interquartile (IQR) en soustrayant Q1 de Q3.
Trouve l'écart interquartile pour les données données 6, 9, 3, 6, 6, 5, 2, 3, 8.
Réponse :
Réorganise les valeurs de la plus petite à la plus grande.
2, 3, 3, 5, 6, 6, 6, 8, 9
Trouve la médiane
La médiane est 6.
Q2 = 6
Trouve la médiane des deux moitiés, qui sont : 2, 3, 3, 5 | 6, 6, 8, 9
Pour la première partie, nous avons 3 comme médiane. Q1= 6
Avec la deuxième étape, nous devrons additionner les deux valeurs médianes et les diviser par 2.
La variance et l'écart type sont tous deux des mesures de la variabilité. La variance est la mesure de la variation des points de données par rapport à la moyenne, et l'écart type est la racine carrée de la variance. Ce que cela nous dit, c'est que l'écart type est dérivé de la variance.
La variance est représentée par \(\sigma^2\)
L'écart-type est désigné par \(\sigma\).
Formule de variance
La formule de la variance de la population est la suivante : \(\sigma^2 = \frac{\Sigma(x_1 - \mu )^2}{N}\)
Où \(\sigma^2\) = variance de la population
N = taille de la population
xi = chaque valeur de la population
\(\mu\) = la moyenne de la population.
La formule de la variance de l'échantillon est la suivante : \(s^2 = \frac {\Sigma(x_i - \bar{x})^2}{n-1}\)
Où s2 = variance de l'échantillon
n = taille de l'échantillon
xi = chaque valeur de l'échantillon
\(\bar{x}\) = la moyenne de l'échantillon.
Formule de l'écart type
La formule de l'écart-type de la population est donnée par \(\sigma = \sqrt{\frac{\sigma(x_i - \mu)^2}{N}}\).
Où \(\sigma\) = écart-type de la population.
N = taille de la population.
xi = chaque valeur de la population.
\(\mu\) = la moyenne de la population.
La formule de l'écart type de l'échantillon est donnée par \(s = \sqrt {\frac{\Sigma(x_i - \bar {x})^2}{n-1}}\)
Où s = écart type de l'échantillon.
n = taille de l'échantillon.
xi = chaque valeur de l'échantillon.
\(\bar{x}\) = la moyenne de l'échantillon.
Calcule l'écart-type pour les notes suivantes à un examen de mathématiques passé par des élèves de6ème: 82, 93, 98, 89, 88.
Réponse :
La première chose à faire est de trouver la moyenne de l'échantillon :
La formule que nous allons utiliser ici est donc \(s = \sqrt{\frac{\Sigma(x_i-\bar{x})^2}{n-1}}\), puisque les notes disponibles ne sont qu'un échantillon de l'ensemble des étudiants qui ont passé l'examen.
Nous pouvons construire un tableau pour décomposer la formule et la calculer de manière appropriée.
xi
\(x_i - \bar{x}\)
\N((x_i - \bar{x})^2\)
82
64
93
3
9
98
64
89
-1
1
88
-2
D'après la formule, nous devrons faire la somme de \((x_i - \bar{x})^2\), qui est la dernière colonne de notre tableau.
Mesures statistiques - Principaux enseignements
Les mesures statistiques sont une technique d'analyse descriptive utilisée pour donner un résumé des caractéristiques d'un ensemble de données.
Les mesures de tendance centrale décrivent certaines caractéristiques clés de l'ensemble de données en se basant sur les valeurs moyennes ou médianes, car elles décrivent le centre des données.
Les trois principales mesures de tendance sont la moyenne, le mode et la médiane.
La moyenne est la mesure de tendance centrale la plus courante et sa formule est \(\mu = \frac{\Sigma x}{n}\).
Les mesures de dispersion sont des mesures statistiques qui décrivent la similarité et la variété des valeurs d'ensembles de données donnés.
L'écart-type est une mesure de la variation ou de la dispersion d'un ensemble de valeurs.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.