Tu es sur le point de terminer tes études secondaires et tu as décidé qu'il était temps de changer d'air, alors tu veux aller à l'université dans une autre ville, disons San Francisco, en Californie. Parmi les questions que tu te poses, il y a celle de savoir combien je vais payer pour le loyer d'un appartement ou combien je vais dépenser pour les transports en commun. Tu décides donc de demander à certaines de tes connaissances qui vivent là-bas combien elles dépensent en moyenne.
Ce processus s'appelle prendre une moyenne d'échantillon et dans cet article, tu trouveras la définition, comment calculer une moyenne d'échantillon, l'écart type, la variance, la distribution d'échantillonnage et des exemples.
Définition de la moyenne d'un échantillon
La moyenne d'un ensemble de nombres est simplement la moyenne, c'est-à-dire la somme de tous les éléments de l'ensemble divisée par le nombre d'éléments de l'ensemble.
La moyenne de l'échantillon est la moyenne des valeurs obtenues dans l'échantillon.
Il est facile de voir que si deux ensembles sont différents, ils auront très probablement aussi des moyennes différentes.
Calcul de la moyenne de l'échantillon
La moyenne de l'échantillon est désignée par \(\overline{x}\), et est calculée en additionnant toutes les valeurs obtenues dans l'échantillon et en les divisant par la taille totale de l'échantillon \(n\). Le processus est le même que le calcul de la moyenne d'un ensemble de données. La formule est donc la suivante : \[\Noverline{x}=\Nfrac{x_1+\Nldots+x_n}{n},\N].
où \(\overline{x}\) est la moyenne de l'échantillon, \(x_i\) est chaque élément de l'échantillon et \(n\) est la taille de l'échantillon.
Revenons à l'exemple de San Francisco. Supposons que tu demandes à 5 de tes connaissances combien elles dépensent par semaine pour les transports publics et qu'elles te répondent : 20 $, 25 $, 27 $, 43 $ et 50 $. La moyenne de l'échantillon est donc calculée par :
Par conséquent, pour cet échantillon, le montant moyen dépensé pour les transports en commun au cours d'une semaine est de \(33\N$).
Écart-type et variance de la moyenne de l'échantillon
Comme la variance est le carré de l'écart type, pour calculer l'une ou l'autre valeur, il faut considérer deux cas :
1. Tu connais l'écart type de la population.
2. Tu ne connais pas l'écart type de la population.
La section suivante montre comment calculer cette valeur dans chaque cas.
Formule de calcul de la moyenne et de l'écart-type pour les moyennes des échantillons
La moyenne de l'échantillon, désignée par \(\mu_overline{x}\), est donnée par la moyenne de la population, c'est-à-dire que si \(\mu\) est la moyenne de la population, \[\mu_overline{x}=\mu.\].
Pour calculer l'écart type de la moyenne de l'échantillon (également appelé erreur standard de la moyenne (SEM)), désigné par \(\sigma_\overline{x}\), les deux cas précédents doivent être pris en compte. Explorons-les l'un après l'autre.
Calcul de l'écart-type moyen de l'échantillon à l'aide de l'écart-type de la population
Si l'échantillon de taille \(n\) est tiré d'une population dont l'écart type \(\sigma\) est connu, alors l'écart type de la moyenne de l'échantillon sera donné par \[\sigma_\overline{x}=\frac{\sigma}{\sqrt{n}}.\].
Un échantillon de \(81\) personnes a été prélevé dans une population dont l'écart-type est \(45\), quel est l'écart-type de la moyenne de l'échantillon ?
Solution :
En utilisant la formule énoncée précédemment, l'écart-type de la moyenne de l'échantillon est \[\sigma_\overline{x}=\frac{45}{\sqrt{81}}=\frac{45}{9}=5.\N].
Note que pour faire ce calcul, tu n'as pas besoin de savoir quoi que ce soit sur l'échantillon à part sa taille.
Calculer l'écart-type moyen de l'échantillon sans utiliser l'écart-type de la population
Parfois, lorsque tu veux estimer la moyenne d'une population, tu n'as pas d'autres informations que les données de l'échantillon que tu as prélevé. Heureusement, si l'échantillon est suffisamment grand (supérieur à \(30\)), l'écart type de la moyenne de l'échantillon peut être approximé à l'aide de l'écart type de l'échantillon. Ainsi, pour un échantillon de taille \(n\), l'écart type de la moyenne de l'échantillon est \[\sigma_\overline{x}\approx\frac{s}{\sqrt{n}},\] où \(s\) est l'écart type de l'échantillon (voir l'article Écart type pour plus d'informations) calculé par :
où \(x_i\) représente chaque élément de l'échantillon et \(\overline{x}\) la moyenne de l'échantillon.
❗❗ L'écart type de l'échantillon mesure la dispersion des données au sein de l'échantillon, tandis que l'écart type de la moyenne de l'échantillon mesure la dispersion entre les moyennes de différents échantillons.
Distribution d'échantillonnage de la moyenne
Rappelle la définition de la distribution d'échantillonnage.
La distribution de la moyenne de l'échantillon (ou distribution d'échantillonnage de la moyenne) est la distribution obtenue en considérant toutes les moyennes qui peuvent être obtenues à partir d'échantillons de taille fixe dans une population.
Si \(\overline{x}\) est la moyenne d'un échantillon de taille \(n\) d'une population avec une moyenne \(\mu\) et un écart type \(\sigma\). Alors, la distribution d'échantillonnage de \(\overline{x}\) a une moyenne et un écart type donnés par \[\mu_\overline{x}=\mu\,\text{ et },\sigma_\overline{x}=\frac{\sigma}{\sqrt{n}}.\].
De plus, si la distribution de la population est normale ou si la taille de l'échantillon est suffisamment grande (selon le théorème de la limite centrale, \(n\geq 30\) est suffisant), alors la distribution d'échantillonnage de \(\surligne{x}\) est également normale.
Lorsque la distribution est normale, tu peux calculer les probabilités à l'aide de la table de distribution normale standard. Pour cela, tu dois convertir la moyenne de l'échantillon \(\overline{x}\) en un score \(z\) à l'aide de la formule suivante
Tu te demandes peut-être ce qui se passe lorsque la distribution de la population n'est pas normale et que la taille de l'échantillon est petite ? Malheureusement, pour ces cas, il n'existe pas de moyen général d'obtenir la forme de la distribution d'échantillonnage.
Voyons un exemple de graphique d'une distribution d'échantillonnage de la moyenne.
Pour revenir à l'exemple des transports publics à San Francisco, supposons que tu aies réussi à sonder des milliers de personnes, que tu aies regroupé les personnes en groupes de taille \(10\), que tu aies fait la moyenne dans chaque groupe et que tu aies obtenu le graphique suivant.
Figure 1. Histogramme de fréquence relative des moyennes de 360 échantillons pour l'exemple des transports publics.
Ce graphique se rapproche du graphique de la distribution d'échantillonnage de la moyenne. D'après ce graphique, tu peux en déduire que l'on dépense en moyenne \(\$37\) pour les transports en commun à San Francisco.
Exemples de moyennes d'échantillons
Voyons un exemple de calcul de probabilités.
On suppose que la distribution de la température du corps humain a une moyenne de \(98,6\, °F\) avec un écart type de \(2\, °F\). Si un échantillon de \(49\) personnes est pris au hasard, calcule les probabilités suivantes :
(a) la température moyenne de l'échantillon est inférieure à \(98\), c'est-à-dire \(P(\overline{x}<98)\).
(b) la température moyenne de l'échantillon est supérieure à \(99\), c'est-à-dire \(P(\overline{x}>99)\).
(c) la température moyenne est comprise entre \N(98\N) et \N(99\N), c'est-à-dire \N(P(98<\Noverline{x}<99)\N).
Solution :
1. Puisque la taille de l'échantillon est de \(n=49>30\), tu peux supposer que la distribution d'échantillonnage est normale.
2. Calcule la moyenne et l'écart type de la moyenne de l'échantillon. En utilisant les formules énoncées précédemment, \(\mu_\overline{x}=98,6\) et l'écart type \(\sigma_\overline{x}=2/\sqrt{49}=2/7\).
3. En convertissant les valeurs en scores \(z-\)et en utilisant la table normale standard (voir l'article Distribution normale standard pour plus d'informations), tu auras pour (a) :
La moyenne de l'échantillon te permet d'estimer la moyenne de la population.
La moyenne de l'échantillon \(\overline{x}\) est calculée comme une moyenne, c'est-à-dire \[\overline{x}=\frac{x_1+\ldots+x_n}{n},\] où \(x_i\) est chaque élément de l'échantillon et \(n\) est la taille de l'échantillon.
La distribution d'échantillonnage de la moyenne \(\overline{x}\) a une moyenne et un écart type donnés par \[\mu_\overline{x}=\mu\,\text{ et },\sigma_\overline{x}=\frac{\sigma}{\sqrt{n}}.\].
Lorsque la taille de l'échantillon est supérieure à \(30\), selon le théorème de la limite centrale, la distribution d'échantillonnage de la moyenne est similaire à une distribution normale.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.