Si l'on te demandait s'il y a des choses importantes dans ta vie, je parie qu'il ne serait pas difficile de répondre à cette question. Tu pourrais facilement identifier des aspects de ta vie quotidienne sans lesquels tu ne pourrais pas vivre avec une qualité relative. Tu pourrais qualifier ces choses de centrales dans ta vie.
Ilenvademêmedansplusieursdomainesdelaconnaissance, enparticulierdanslesstatistiquesa>. Ilexisteunrésultatmathématiquesiimportantdanslesstatistiquesqu'ilsonttenuàinclurelemotcentral dans sa désignation. Et il est central non seulement par son importance, mais aussi par son pouvoir de simplification.
Il s'agit du théorème de la limite centrale et dans cet article, tu verras sa définition, sa formule, ses conditions, ses calculs et des exemples d'application.
Comprendre le théorème de la limite centrale
Prends l'exemple suivant.
Imagine que tu as un sac contenant quatre balles
de taille égale ;
indiscernables au toucher ;
et numérotées avec les nombres pairs 2, 4, 6 et 8.
Tu vas retirer deux boules au hasard, avec remplacement, et tu vas calculer la moyenne des numéros des deux boules que tu as retirées.
"Avec remplacement" signifie que tu retires la première boule du sac, que tu la remets, et que tu retires la deuxième boule. Et oui, cela peut conduire à retirer deux fois la même boule.
Remarque que tu as 16 combinaisons possibles ; nous les présentons dans les tableaux ci-dessous, avec leurs moyennes calculées.
1ère boule
2
2
2
2
4
4
4
4
2ème balle
2
4
6
8
2
4
6
8
moyenne
2
3
4
5
3
4
5
6
1ère balle
6
6
6
6
8
8
8
8
2ème balle
2
4
6
8
2
4
6
8
signifie
4
5
6
7
5
6
7
8
Traçons maintenant un graphique à barres de ces moyennes, figure 2.
Fig. 2 - Diagramme à barres de la liste des moyennes dans les tableaux
Si tu le remarques, la forme de ce diagramme à barres se rapproche de la forme d'une distribution normale, n'es-tu pas d'accord ? Il se rapproche de la forme d'une courbe normale !
Maintenant, si au lieu d'avoir 4 boules numérotées avec 2, 4, 6 et 8, tu avais 5 boules numérotées avec 2, 4, 6, 8 et 10, alors tu aurais 25 combinaisons possibles, ce qui conduit à 25 moyennes.
À quoi ressemblerait la barre graphique de cette nouvelle liste de moyennes ? Oui, elle aurait une forme similaire à celle d'une courbe normale.
Si tu continuais à augmenter le nombre de boules numérotées, le graphique à barres correspondant se rapprocherait de plus en plus d'une courbe normale.
"Pourquoi ?" demandes-tu. Cela t'amène à la section suivante.
Définition du théorème de la limite centrale
Le théorème de la limite centrale est un théorème important en statistiques, si ce n'est le plus important, et il est responsable de l'effet de rapprochement des diagrammes en bâtons pour les valeurs croissantes du nombre de boules numérotées avec la courbe de la distribution normale dans l'exemple ci-dessus.
Commençons par examiner son énoncé, puis rappelons deux concepts importants qu'il implique : une distribution de moyennes d'échantillons et la distribution normale utile.
Énoncé du théorème de la limite centrale
L'énoncé du théorème de la limite centrale dit ceci :
Si tu prélèves un nombre suffisamment important d'échantillons de n'importe quelle distribution aléatoire, la distribution des moyennes des échantillons peut être approximée par la distribution normale.
Facile, non ?! "Uhh... Non... !!" Ok, ok. Comprenons-le en simplifiant un peu son énoncé :
Si tu prélèves un grand nombre d'échantillons d'une distribution, la moyenne de l'échantillon de cette distribution peut être approximée par la distribution normale.
Oublions un instant "un nombre suffisamment grand" et "une distribution aléatoire quelconque", et concentrons-nous sur :
la moyenne d'un échantillon ;
et la distribution normale.
Comprendre la distribution des moyennes d'un échantillon
Imagine que tu doives réaliser une étude statistique pour un attribut particulier. Tu identifies la population de ton étude et tu en tires un échantillon aléatoire. Tu calculeras ensuite une statistique particulière liée à l'attribut qui t'intéresse à partir de cet échantillon, et ce sera lamoyenne.
Imagine maintenant que tu tires au hasard un autre échantillon de la même population, de la même taille que le précédent, et que tu calcules lamoyenne de l'attribut de ce nouvel échantillon.
Imagine que tu fasses cela quelques fois de plus (et de plus en plus). Ce que tu obtiendras, c'est une liste demoyennesdes échantillons que tu as tirés. Et voilà ! Cetteliste de moyennes que tu as obtenue constitue unedistributiondes moyennes des échantillons.
Pour approfondir tes connaissances sur ce sujet, lis notre article Moyenne des échantillons.
Rappel de la distribution normale
Une grande utilité de la distribution normale est associée au fait qu'elle se rapproche de façon assez satisfaisante des courbes de fréquence des mesures physiques. En d'autres termes, les mesures physiques telles que la taille et le poids d'un échantillon d'éléments de la population humaine peuvent être approximées par cette distribution. Tu es maintenant sur le point de voir une autre application importante de cette distribution.
Tu sais peut-être déjà que la distribution normale est une distribution de probabilités à deux paramètres, une moyenne \(\mu\) et un écart type \(\sigma\), et qui a l'apparence graphique d'une courbe en forme de cloche - voir la figure 1.
Fig. 1 - Courbe normale d'une distribution normale de moyenne 0 et d'écart type 0,05
La moyenne est la valeur à laquelle la distribution est centrée, et l'écart-type décrit son degré de dispersion.
Dans le cas de la figure 1, la courbe normale est centrée sur 0 et sa dispersion est plutôt faible, 0,05. Plus la dispersion est faible, plus la courbe est proche de l'axe \(y\).
Pour te rafraîchir la mémoire sur ce sujet, lis notre article Distribution normale.
Combien d'échantillons sont suffisants ?
Ce que tu dois comprendre ici, c'est que le théorème de la limite centrale nous dit que pour un "nombre" d'échantillons d'une distribution, la moyenne de l'échantillon se rapprochera de la distribution normale.
En rappelant l'exemple ci-dessus :
"Imagine que tu as un sac avec quatre balles
de taille égale ;
indiscernables au toucher ;
et numérotées avec les nombres pairs 2, 4, 6 et 8.
Tu vas retirer deux boules au hasard, avec remplacement, et tu vas calculer lamoyenne des numéros des deux boules que tu as retirées."
Remarque qu'ici les échantillons sont les moyennes des deux boules retirées, et que la distribution sera cellede la liste des moyennes obtenues.
En incluant maintenant ce que nous avons retiré pour l'instant, le théorème de la limite centrale dit que quelle que soit la distribution - "toute distribution aléatoire" -, la distribution de sa moyenne se rapproche de la distribution normale lorsque le nombre d'échantillons augmente - "un nombre suffisamment grand d'échantillons".
La question s'impose maintenant : qu'est-ce qu'un nombre suffisamment grand d'échantillons ? Cela nous amène à la section suivante.
Conditions du théorème de la limite centrale
Deux conditions principales doivent être remplies pour que tu puisses appliquer le théorème de la limite centrale.
Ces conditions sont les suivantes :
Caractère aléatoire - la collecte de l'échantillon doit être aléatoire, cela signifie que chaque élément de la population doit avoir la même chance d'être sélectionné.
Pour revenir au premier exemple, tu avais les 4 balles sur un sac, et elles étaient indiscernables au toucher. Ces éléments rendent l'expérience aléatoire.
Échantillon suffisamment grand: en règle pratique, lorsque le nombre d'échantillons est d'au moins 30, la distribution des moyennes des échantillons s'approchera de façon satisfaisante d'une distribution normale.
C'est pourquoi l'exemple ci-dessus ne sert qu'à illustrer avec simplicité l'idée du théorème de la limite centrale. Nous en avons tiré 16 échantillons, et s'il y avait 5 boules, nous ne pourrions obtenir que 25 échantillons, ce qui, une fois de plus, n'est pas un nombre d'échantillons assez important.
Formule du théorème de la limite centrale
Aborder la formule du théorème de la limite centrale revient à la reformuler en introduisant toutes les notations nécessaires et en lui donnant des détails supplémentaires.
Il vaut la peine de répéter la première affirmation :
Si tu prélèves un nombre suffisamment important d'échantillons de n'importe quelle distribution aléatoire, la distribution des moyennes des échantillons peut être approximée par la distribution normale.
Suppose que tu disposes d'une distribution initiale, avec une distribution de probabilitéinconnue ou connue, et que tu considères\(\mu\) comme sa moyenne et \(\sigma\) comme son écart type.
Suppose également que tu prendras \(n\) échantillons de cette distribution initiale, et \ (n\GE30\).
Alors, lamoyenne de l'échantillon, \(\bar{x}\), avec lamoyenne \(\mu_bar{x}\) et l'écarttype \(\sigma_\bar{x}\),sera normalement distribuée avec la moyenne \(\mu\) et la variation standard \(\frac{\sigma}{\sqrt{n}}\).
Grâce à cette nouvelle reformulation du théorème de la limite centrale, tu peux conclure que :
Lamoyenne de la distribution de la moyenne de l'échantillon \(\bar{x}\) sera égale à la moyenne de la distribution initiale, c'est-à-dire \[\mu_\bar{x}=\mu;\].
L'écart-type de la distribution de la moyenne de l'échantillon \(\bar{x}\) sera \(\frac{1}{\sqrt{n}}\) de l'écart-type de la distribution initiale, c'est-à-dire \[\sigma_\bar{x}=\frac{\sigma}{\sqrt{n}};\]
C'esten fait une bonne chose : remarque que pour une valeur croissante de \N(n\N), \N(\frac{\sigma}{\sqrt{n}}\) diminue, la dispersion de \N(\Nbar{x}\N) diminue, ce qui signifie qu'elle se comporte de plus en plus comme une distribution normale.
Le théorème de la limite centrale s'applique à toute distribution comportant de nombreux échantillons, qu'il s'agisse d'une distribution connue (comme une distribution binomiale, uniforme ou de Poisson) ou d'une distribution inconnue.
Prenons un exemple où tu verras cette notation en action.
Une étude indique que l'âge moyen des acheteurs de cacahuètes est de \(30\) ans et que l'écart type est de \(12\). Avec un échantillon de 100 personnes, quels sont la moyenne et l'écart-type de l'âge moyen des acheteurs de cacahuètes ?
Solution :
La population et par conséquent l'échantillon de l'étude se compose d'acheteurs de cacahuètes, et l'attribut qui les intéressait était l'âge.
On te dit donc que la moyenne et l'écart-type de la distribution initiale sont \(\mu=30\) et \(\sigma=12\).
On te dit aussi le nombre d'échantillons, donc \(n=100\).
Puisque \(n\) est plus grand que \(30\), tu peux appliquer le théorème de la limite centrale. Il y aura donc une moyenne d'échantillon \(\bar{x}\) qui est normalement distribuée avec une moyenne \(\mu_\bar{x}\) et un écart type \(\sigma_\bar{x}\).
Par conséquent, \(\bar{x}\) est normalement distribué avec une moyenne de \(30\) et un écart type de \(1,2\).
Calculs impliquant le théorème de la limite centrale
Comme tu le sais maintenant, le théorème de la limite centrale nous permet d'approcher n'importe quelle distribution de moyennes, pour un grand nombre d'échantillons, de la distribution normale. Cela signifie que certains des calculs pour lesquels le théorème de la limite centrale est applicable impliquent des calculs avec la distribution normale. Ici, ce que tu vas faire, c'est convertir une distribution normale en distribution normale standard.
L'importance de cette conversion réside dans le fait que tu auras alors accès à un tableau de valeurs de la normale standard, également connu sous le nom de z-score, auquel tu pourras te référer pour poursuivre tes calculs.
Tout point\(x\) d'une distribution normale peut être converti en distribution normale standard \(z\) en procédant comme suit
\[z=\frac{x-\mu}{\sigma},\]
où \N(z\N) suit la distribution normale standard (avec une moyenne \N(\Nmu=0\N) et un écart type \N(\Nsigma=1\N)).
Puisque\( \bar{x}\) est normalement distribué avec une moyenne \(\mu\) et un écart type
\[\frac{\sigma}{\sqrt{n}},\]
la conversion se fera plutôt comme suit
\[z=\frac{x-\mu}{\frac{\sigma}{\sqrt{n}}}.\]
Tu peux te rafraîchir la mémoire sur ce sujet en lisant notre articlez-score.
Cet exemple sert de rappel de la conversion à la distribution normale standard.
Un échantillon aléatoire de taille \ (n=90\) est sélectionné dans une population dont la moyenne est \(\mu=20\) et l'écart type \(\sigma=7\). Détermine la probabilité que \(\bar{x}\) soit inférieur ou égal à \(22\).
Solution :
Comme la taille de l'échantillon est de \(n=90\), tu peux appliquer le théorème de la limite centrale. Cela signifie que \(\bar{x}\) suivra une distribution normale avec une moyenne de
Tu veux maintenant trouver \(P(\bar{x}\le 22)\N), et pour cela tu appliques la conversion à la normale standard :
\N- [\N- Début{alignement} P(\bar{x}\le 22)&=P\left( z\le \frac{22-20}{0,738} \le right) \\N- &=P( z\le 2,71) \N- &=\text{ aire sous la courbe normale à gauche de 2,71} \N- \N- &=0.9966 \N- \N- end{align} \]
Exemples du théorème de la limite centrale
Pour consolider les apprentissages de cet article, passons maintenant aux exemples d'application. Tu verras ici un aperçu de tous les principaux aspects du théorème de la limite centrale.
Premier exemple.
Les données sur le poids d'une population féminine suivent une distribution normale. Elles ont une moyenne de 65 kg et un écart type de 14 kg. Quel est l'écart type de l'échantillon choisi si un chercheur analyse les dossiers de 50 femmes ?
Solution :
La distribution initiale est celle du poids des femmes. Tu sais qu'elle a une moyenne de 65 kg et un écart type de 14 kg. Un échantillon de 50 femmes signifie que \(n=50\), qui est plus grand que \(30\). Tu peux donc appliquer le théorème de la limite centrale.
Cela signifie qu'il existe une moyenne d'échantillon \(\bar{x}\) qui suit une distribution normale avec une moyenne \(\mu_\bar{x}=65\) et un écart type \(\sigma_\bar{x}=\frac{14}{\sqrt{50}}= 1,98\) à deux décimales près.
L'écart-type de l'échantillon choisi par le chercheur est donc \N(1,98\N).
Faisons un dernier problème de mots.
Un petit hôtel reçoit en moyenne \(10\) nouveaux clients par jour avec un écart type de 3 clients. Calcule la probabilité que, sur une période de 30 jours, l'hôtel reçoive en moyenne plus de \(12\) clients.
Solution :
La distribution initiale a une moyenne \(\mu=10\) et un écart type \(\sigma=3\). Comme la période de temps est de 30 jours, \(n=30\). Par conséquent, tu peux appliquer le théorème de la limite centrale. Cela signifie que tu auras \(\bar{x}\) dont la distribution a une moyenne \(\mu_\bar{x}\) et un écart type \(\sigma_\bar{x}\), et que
\[ \begin{align} P(z\ge 3,65)&=\text{ aire sous la courbe normale à droite de 3,65} \N- &=1-0.9999 \N- &=0.0001\N, (0.01\N%).\N-end{align} \]
Par conséquent, la probabilité qu'au cours d'une période de 30 jours, l'hôtel reçoive en moyenne plus de \(12\) clients est de \(0,01\% \N).
Importance du théorème de la limite centrale
Il existe de nombreuses situations dans lesquelles le théorème de la limite centrale est important. En voici quelques-unes :
Lorsqu'il est difficile de recueillir des données sur chaque élément d'une population, le théorème de la limite centrale est utilisé pour obtenir une approximation des caractéristiques de la population.
Le théorème de la limite centrale est utile pour faire des déductions significatives sur la population à partir d'un échantillon. Il peut être utilisé pour savoir si deux échantillons ont été tirés de la même population, et également vérifier si l'échantillon a été tiré d'une certaine population.
Pour construire des modèles statistiques robustes en science des données, on applique le théorème de la limite centrale.
Pour évaluer les performances d'un modèle en apprentissage automatique, le théorème central limite est employé.
Tu testes une hypothèse en statistiques en utilisant le théorème de la limite centrale pour déterminer si un échantillon appartient à une certaine population.
Théorème de la limite centrale - Principaux enseignements
Le théorème de lalimite centrale dit que si tu prélèves un nombre suffisamment important d'échantillons à partir d'une distribution aléatoire, la distribution des moyennes de l'échantillon peut être approximée par la distribution normale.
Une autre façon d'énoncer le théorème de la limite centrale est de dire que si \(n\ge 30\N), alors la moyenne de l'échantillon \(\bar{x}\N) suit une distribution normale avec \(\mu_bar{x}=\mu\N) et \(\sigma_\bar{x}=\frac{\sigma}{\sqrt{n}}.\N).
Toute distribution normale peut être convertie en distribution normale standard en faisant \N(z=\frac{x-\mu}{\frac{\sigma}{\sqrt{n}}.\N).
La connaissance de la distribution normale standard, de son tableau et de ses propriétés t'aide dans les calculs impliquant le théorème de la limite centrale.
Apprends plus vite avec les 0 fiches sur Théorème Central Limite
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Théorème Central Limite
Qu'est-ce que le Théorème Central Limite?
Le Théorème Central Limite stipule que la somme des variables aléatoires indépendantes et identiquement distribuées tend vers une distribution normale.
Pourquoi le Théorème Central Limite est-il important?
Le Théorème Central Limite est crucial car il permet d'utiliser la distribution normale pour les estimations même si les données originales ne sont pas normales.
Quels sont les prérequis pour appliquer le Théorème Central Limite?
Pour appliquer le Théorème Central Limite, les variables doivent être indépendantes, identiquement distribuées et avoir une variance finie.
Comment utilise-t-on le Théorème Central Limite en pratique?
En pratique, on utilise le Théorème Central Limite pour approximer les distributions d'échantillons et faciliter les tests statistiques et les intervalles de confiance.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.