Sauter à un chapitre clé
Intervalle de confiance pour la différence de deux moyennes dont les écarts types sont connus
Si tu ne t'intéressais qu'au prix moyen du café dans une ville, tu pourrais faire un intervalle de confiance pour une moyenne de population. Dans ce cas, pour réaliser un intervalle de confiance correct, il faudrait que :
Soit la taille de l'échantillon est suffisamment grande (\(n \ge 30\)), soit la distribution de la population est approximativement normale.
L'échantillon est aléatoire ou il est raisonnable de supposer qu'il est représentatif de l'ensemble de la population.
Si tu connais l'écart-type de la population, \ (\sigma\), l'intervalle de confiance est donné par
\[ \bar{x} \pm (z \text{ valeur critique})\Nà gauche(\frac{\sigma}{\sqrt{n}}\Nà droite)\N]
où \(\bar{x}\) est la moyenne de l'échantillon.
Mais ici, tu as deux villes différentes et tu veux comparer le prix moyen du café, alors comment construire l'intervalle de confiance ? Commençons par énumérer certaines des notations utilisées par la suite.
Tout d'abord, la notation de la population :
Population (1) | Population (2) | |
Population Moyenne | \N- \N( \Nmu_1\N) | \N- \N- \N- \N- \N( \Nmu_2\N) |
Écart-type de la population | \N- (\Nsigma_1\N) | \(\sigma_2\) |
Et maintenant, les échantillons :
Échantillon de la population (1) | Échantillon de la population (2) | |
Taille de l'échantillon | \(n_1\) | \(n_2\) |
Moyenne de l'échantillon | \N- (\Nbar{x}_1\N) | \(\bar{x}_2\) |
Écart-type de l'échantillon | \(s_1\) | \(s_2\) |
Les conditions pour construire un intervalle de confiance pour la différence de deux moyennes sont donc les suivantes :
Les échantillons sont indépendants.
Soit la taille de l'échantillon est suffisamment grande (\(n_1 \ge 30\) et \(n_2 \ge 30\)), soit la distribution de la population est approximativement normale.
Les échantillons sont aléatoires ou il est raisonnable de supposer que les échantillons sont représentatifs de la population plus large.
Ces conditions ne changent pas même si tu ne connais pas les écarts types de la population.
Comme les échantillons sont indépendants et aléatoires, tu sais que
\[ \mu_{\bar{x}_1 - \bar{x}_2} = \mu_1 - \mu_2\]
et que
\[ \sigma_{x_1 - x_2} = \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} }.\]
L'intervalle de confiance pour la différence entre les deux moyennes de la population est alors le suivant
\[\bar{x}_1 - \bar{x}_2 \pm (z \text{ valeur critique})\sqrt{\frac{\sigma_1^2}{n_1}]. +\frac{\sigma_2^2}{n_2} } .\]
En général, tu ne sauras pas quels sont les écarts types de la population, mais voyons un exemple illustrant l'utilisation de ces formules.
Tu fais une enquête auprès de 40 cafés de petites villes et de 49 cafés de grandes villes, et tu trouves que le prix moyen d'une grande tasse de café est de 3,75 $ et qu'il est de 4,50 $ dans les grandes villes. Tu sais aussi que l' écart type de la population dans les petites villes est de (1,20) et dans les grandes villes de (0,98).
Construis un intervalle de confiance de \(99\%) pour la différence de leurs deux moyennes, et tire-en des conclusions.
Solution :
Il est utile de présenter les informations dont tu disposes. Appelle la petite ville Population \(1\) et la grande ville Population \(2\). Tu sais alors que
\N- [\N- \N{array}{lll} & n_1 = 40 & \Nbar{x}_1 = 3,75 & \Nsigma_1 = 1,20 \N- & n_2 = 49 & \Nbar{x}_2 = 4,50 & \Nsigma_2 = 0,98 . \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N-]
Tu sais que la valeur critique d'un intervalle de confiance de \(99\%\) est \(2,58\). Calcule ensuite l'intervalle de confiance pour la différence des moyennes,
\[\N- & \Nbar{x}_1 - \Nbar{x}_2 \Npm (z \text{ valeur critique})\Nsqrt{\Nfrac{\Nsigma_1^2}{n_1}]. +\frac{\sigma_2^2}{n_2} } \N- & \Nquad = 3.75-4.50 \Npm 2.58 \sqrt{\frac{(1.20)^2}{40} +\frac{(0.98)^2}{49} } \N- & \N- \Nquad = -0.75 \Npm 2.58\Nsqrt{0.036 + 0.0196} \N- & \Nquad \N-approx -0.75 \Npm 0.61 \N- & \Nquad = (-1.36, -0.14) .\Nend{align}\N]
Qu'est-ce que tu peux en conclure ? Tout d'abord, tu peux conclure que la méthode utilisée pour construire cette estimation d'intervalle réussit à capturer la différence réelle dans les moyennes de la population environ \(99\%\) du temps.
Plus important encore, tu peux conclure avec un degré de confiance de 99% que la différence réelle dans le prix moyen d'une grande tasse de café se situe entre 1,36$ et 0,14$. Comme les deux extrémités de l'intervalle de confiance sont négatives, tu peux estimer que le prix moyen d'une grande tasse de café est entre \ (0,14 $) et \ (1,36 $) plus bas dans une petite ville que dans une grande ville.
Remarque que dans l'exemple précédent, les deux extrémités de l'intervalle de confiance étaient négatives. Que se passe-t-il si l'une des extrémités est négative et l'autre positive ? Cela implique que \(0\) est à l'intérieur de l'intervalle de confiance, donc en d'autres termes, il serait plausible qu'il n'y ait pas de différence entre les deux moyennes.
Intervalle de confiance pour la différence de deux moyennes de population indépendantes
Si tu ne connais pas les écarts types de la population, mais que tu sais que tes échantillons sont indépendants (c'est-à-dire que le choix d'un membre de la première population n'affecte pas ton choix d'un membre de la deuxième population), tu peux calculer l'intervalle de confiance à l'aide de la formule suivante :
\[\bar{x}_1 - \bar{x}_2 \pm (t \text{ valeur critique})\sqrt{\frac{s_1^2}{n_1}]. +\frac{s_2^2}{n_2} } ,\]
où le degré de liberté pour la valeur critique \(t\) est calculé par
\[df = \frac{(V_1 + V_2)^2}{\dfrac{V_1^2}{n_1-1} + \dfrac{V_2^2}{n_2-1} },\]
et
\[ V_1 = \frac{s_1^2}{n_1}, \quad V_2 = \frac{s_2^2}{n_2} .\]
C'est la même façon de calculer le degré de liberté pour un test \(t\) à deux échantillons.
Voyons un exemple d'application de ces formules et de conclusions.
Tu fais une enquête auprès de 40 cafés de petites villes et de 49 cafés de grandes villes, et tu trouves que le prix moyen d'une grande tasse de café est de 3,75 $ et qu'il est de 4,50 $ dans les grandes villes. Tu sais aussi que l' écart type de l'échantillon dans les petites villes est de (1,00), et dans les grandes villes, l' écart type de l 'échantillon est de (0,70).
Construis un intervalle de confiance de \(99\%\) pour la différence de leurs deux moyennes, et tire-en des conclusions.
Solution :
Trouve d'abord \(V_1\) et \(V_2\),
\N- \N[ \N- \Ndébut{alignement} V_1 &= \frac{s_1^2}{n_1} \\N- &= \frac{1^2}{40} \N- &= 0.025 \N- \N- \N- \N- \N- \N- \N-{align} \]
et
\[ \begin{align} V_2 &= \frac{s_2^2}{n_2} \N- &= \frac{0.70^2}{49} \N- &= 0.01, \Nend{align} \]
donc
\[\N- Début{align} df &= \frac{(V_1 + V_2)^2}{\dfrac{V_1^2}{n_1-1} + \dfrac{V_2^2}{n_2-1}} \N- Début{align} df &= \frac{(V_1 + V_2)^2}{\frac{V_1^2}{\N-1}} } \N- &= \frac{(0.025 + 0.01 )^2}{\dfrac{0.025^2}{40-1} + \dfrac{0.01^2}{49-1} } \\ &=\frac{0.001225}{\dfrac{0.000625}{39} + \dfrac{0.0001}{48} } \\N- \N- 67,6 environ. \N- [end{align}\N]
La plupart des tableaux de \N(t\N) n'auront pas \N(df = 68\N) en eux, cependant une calculatrice vous donnera la valeur critique appropriée de \N(t\N) de \N(2,65\N).
Calcule ensuite l'intervalle de confiance pour la différence entre les deux moyennes de la population,
\N- [\N- Début{align} \bar{x}_1 - \bar{x}_2 & \pm (t \text{ valeur critique})\sqrt{\frac{s_1^2}{n_1} +\frac{s_2^2}{n_2} } \\N- &\Nquad = 3.75-4.50 \Npm (2.65)\sqrt{\frac{1^2}{40} +\frac{0.75^2}{49} } \\ &\quad \approx -0.75 \pm 0.51 \\ &\quad = (-1.26, -0.24). \N- [\N-]
Tu peux donc conclure avec un degré de confiance de 99 % que la différence réelle dans le prix moyen d'une grande tasse de café se situe entre 1,26 $ et 0,24 $. Comme les deux extrémités de l'intervalle de confiance sont négatives, tu peux estimer que le prix moyen d'une grande tasse de café est entre \ (0,24 $) et \ (1,26 $) plus bas dans une petite ville que dans une grande ville.
En quoi la marge d'erreur diffère-t-elle de l'intervalle de confiance ?
Marge d'erreur d'un intervalle de confiance pour la différence entre les moyennes de deux populations
La marge d'erreur est en fait définie comme la moitié de la largeur de l'intervalle de confiance. Ainsi, dans le cas de la différence entre deux moyennes où tu ne connais pas les écarts types de la population, la marge d'erreur est donnée par
\[ \text{marge d'erreur } = (t \text{valeur critique})\sqrt{\frac{s_1^2}{n_1} +\frac{s_2^2}{n_2} }. \]
En revanche, si tu connais les écarts types de la population, la marge d'erreur est la suivante
\[ \text{marge d'erreur} = (z \text{ valeur critique})\sqrt{\frac{\sigma_1^2}{n_1} +\frac{\sigma_2^2}{n_2} } . \]
Dans les deux cas, il s'agit juste de la moitié de la largeur de l'intervalle de confiance.
Formule d'intervalle de confiance pour la différence entre deux moyennes
Être capable d'utiliser la formule est certainement une partie de la création d'un intervalle de confiance. Il est tout aussi important d'être capable d'utiliser les informations que la formule te donne pour tirer des conclusions. En fait, la plupart des logiciels statistiques prennent les données que tu leur donnes et font les calculs pour toi !
Lorsque l'on examine l'intervalle de confiance pour la différence entre deux moyennes, trois choses peuvent se produire :
Les deux extrémités de l'intervalle sont négatives.
Les deux extrémités de l'intervalle sont positives.
L'une des extrémités est négative et l'autre est positive.
Tu as déjà vu un exemple de conclusion tirée lorsque les deux extrémités sont négatives, alors voyons un exemple de conclusion que tu peux tirer dans chacun des deux autres cas.
Supposons que tu aies un nouveau traitement médical et que tu veuilles étudier le nombre moyen de jours de guérison des personnes qui reçoivent le traitement par rapport à celles qui ne le reçoivent pas. Les personnes ont été réparties au hasard entre le groupe traité et le groupe placebo. Définis
- Population \(1\) - les personnes qui reçoivent le traitement ; et
- Population \(2\) - les personnes qui reçoivent un placebo.
Supposons que l'intervalle de confiance pour la différence entre les deux moyennes, \(\bar{x}_1 - \bar{x}_2 \) soit \( (14,7, 23,1)\). Quelle conclusion peux-tu tirer sur la différence entre le traitement et le placebo ?
Solution :
Ici, les deux extrémités de l'intervalle de confiance sont positives. Cela signifie que tu penses que \(\mu_1 - \mu_2 > 0\), ou en d'autres termes que le temps moyen de rétablissement des personnes qui ont reçu le traitement médical est plus important que le temps moyen de rétablissement des personnes qui ont reçu le placebo, et qu'en fait le temps de rétablissement des personnes qui ont reçu le traitement médical est plus long d'au moins \(14\) jours. Malheureusement, cela impliquerait que le nouveau traitement médical n'aide pas les gens à se rétablir plus rapidement.
Ensuite, le cas où un point final est négatif et un autre positif.
Utilisons exactement la même configuration que dans l'exemple précédent. Donc
- Population \(1\) - les personnes qui reçoivent le traitement ; et
- Population \(2\) - les personnes qui reçoivent un placebo.
Supposons que l'intervalle de confiance pour la différence entre les deux moyennes, \N(\Nbar{x}_1 - \Nbar{x}_2 \N) soit \N( (-3,4, 4,3)\N). Quelle conclusion peux-tu tirer sur la différence entre le traitement et le placebo ?
Solution :
Ici, zéro est inclus dans l'intervalle de confiance. Cela implique qu'il est plausible que \(\mu_1\) et \(\mu_2\) soient identiques. En d'autres termes, il est plausible que le nouveau traitement médical ne soit ni plus ni moins efficace que le placebo. Tu peux donc dire que même si le nouveau traitement médical n'a probablement pas aidé, il n'a probablement pas été pire que le placebo.
Il est toujours utile de voir un autre exemple.
Exemple d'intervalle de confiance pour la différence entre les moyennes de deux populations
Examinons quelque chose que tu pourrais confondre avec un problème de différence entre deux moyennes au premier abord.
Il est courant que les élèves d'une classe reçoivent un pré-test, qu'ils apprennent la matière, puis qu'ils fassent un test réel. Cela permet (si tout va bien) de mesurer ce que les élèves apprennent en classe. S'agit-il d'un cas où tu devrais construire un intervalle de confiance pour la différence entre les deux moyennes de la population ?
Solution :
Rappelle-toi qu'une des conditions pour construire un intervalle de confiance pour la différence de deux moyennes est que tes échantillons soient indépendants. Dans cet exemple, un élève qui a passé le pré-test est automatiquement placé dans le groupe qui passera le test réel. Ces échantillons ne sont absolument pas indépendants !
Ainsi, bien que cela ressemble à une question sur la différence de deux moyennes, tu devras en fait examiner les personnes de la classe et la différence de leurs résultats au test et faire un intervalle de confiance pour la moyenne de la population.
Ce n'est pas parce qu'il y a le mot "différence" que tu dois faire un intervalle de confiance pour la différence entre deux moyennes. On considère qu'il s'agit d'échantillons appariés, et un intervalle de confiance standard pour une moyenne de population est la façon d'aborder ce problème.
Voyons maintenant un exemple où les échantillons sont indépendants.
Suppose que tu veuilles savoir si la couleur de la tasse à café a un impact sur la façon dont les gens pensent à la saveur. Tu prends \(24\) personnes et tu les répartis au hasard dans l'un des deux groupes de traitement : soit une tasse à café blanche, soit une tasse à café orange.
Les deux groupes ont reçu exactement le même café et on leur a demandé d'évaluer la saveur sur une échelle de 0 à 100. Les résultats figurent dans le tableau ci-dessous.
Échantillon | Taille de l'échantillon | Évaluation moyenne de la qualité | Écart-type de l'échantillon |
Échantillon 1 : tasse à café blanche | \(n_1 = 12\) | \(\bar{x}_1 = 50.35\) | \(s_1 = 20.17\) |
Échantillon 2 : tasse à café orange | \(n_2 = 12\) | \(\bar{x}_2= 61.48\) | \(s_2 = 16.69\) |
Peux-tu conclure que la couleur de la tasse fait une différence dans l'évaluation moyenne de la qualité du café ?
Solution :
Vérifions d'abord que toutes les conditions pour construire un intervalle de confiance pour la différence de deux moyennes sont remplies. Les échantillons sont certainement indépendants et choisis au hasard, mais la taille de l'échantillon est inférieure à \(30\). Cela signifie que tu devras supposer que les distributions des deux évaluations de la qualité sont approximativement normales. Il n'est pas déraisonnable de supposer cela, mais il faudra le mentionner lorsque tu tireras une conclusion.
Ensuite, tu devras calculer les degrés de liberté. Voici
\[ \begin{align} V_1 &= \frac{s_1^2}{n_1} \\N- &= \frac{(20.17)^2}{12} \N- & \N- environ 33,9, \Nfin{align} \]
et
\N- [\N- Début{align} V_2 &= \frac{s_2^2}{n_2} \N- &= \frac{(16.69)^2}{12} \N- &\N- environ 23,2, \Nfin{align}\N]
donc
\N-[\N-] df &= \frac{(33.9 + 23.2)^2}{\dfrac{(33.9)^2}{12-1} + \dfrac{(23.2)^2}{12-1} } \\N- &= \frac{3260.41}{\dfrac{1149.21}{11}} + \dfrac{538.23}{11} } \\N- \N- \N- 21.25 environ. \N- [end{align}\N]
Le niveau de confiance n'a pas été indiqué, mais il est courant d'utiliser un niveau de \(95\%\). La valeur critique serait donc \(2,08\).
Construis ensuite l'intervalle de confiance,
\[ \begin{align} \bar{x}_1 - \bar{x}_2 &\pm (t \text{ valeur critique})\sqrt{\frac{s_1^2}{n_1} +\frac{s_2^2}{n_2} } \\N- &\N- \Nquad = 50.35 - 61.49 \Npm 2.08\sqrt{\frac{(20.17)^2}{12} +\frac{(16.69)^2}{12} } \\N- & \Nquad \Napprox -11.14 \Npm 14.72 \N- & \Nquad = (-26.85, 4.67).\Nend{align}\N]
En supposant que les distributions des deux évaluations de la qualité sont approximativement normales, tu peux conclure avec un niveau de confiance de 95 % que la différence réelle de l'évaluation moyenne se situe entre 26,85 et 4,67. Comme zéro se trouve dans l'intervalle de confiance, il est plausible de conclure qu'il n'y a pas de différence dans l'évaluation moyenne de l'échelle des saveurs entre le mug blanc et le mug orange.
Intervalle de confiance pour la différence de deux moyennes - Principaux enseignements
- Les conditions pour construire un intervalle de confiance pour la différence de deux moyennes sont :
Les échantillons sont indépendants.
Soit la taille de l'échantillon est suffisamment grande (\(n_1 \ge 30\) et \(n_2 \ge 30\)), soit la distribution de la population est approximativement normale.
Les échantillons sont aléatoires ou on peut raisonnablement supposer qu'ils sont représentatifs de la population dans son ensemble.
Si tu connais les écarts types de la population, la formule de l'intervalle de confiance pour la différence entre les deux moyennes est la suivante
\[\bar{x}_1 - \bar{x}_2 \pm (z \text{ valeur critique})\sqrt{\frac{\sigma_1^2}{n_1}]. +\frac{\sigma_2^2}{n_2} } ,\]où \(\bar{x}_1\) est la moyenne de l'échantillon \(1\), \(\bar{x}_2\) est la moyenne de l'échantillon \(2\), \(\sigma_1\) est l'écart type de la population \(1\), et \(\sigma_2\) est l'écart type de la population \(2\).
Le degré de liberté d'un intervalle de confiance pour la différence de deux moyennes se calcule comme suit
\[df = \frac{(V_1 + V_2)^2}{\dfrac{V_1^2}{n_1-1} + \dfrac{V_2^2}{n_2-1} },\]
où \(n_1\) et \(n_2\) sont les tailles des échantillons, \(s_1\) et \(s_2\) sont les écarts types des échantillons, et
\[ V_1 = \frac{s_1^2}{n_1}, \quad V_2 = \frac{s_2^2}{n_2} .\]
Si tu ne connais pas l'écart type de la population, la formule de l'intervalle de confiance pour la différence entre deux moyennes est la suivante
\[\bar{x}_1 - \bar{x}_2 \pm (t \text{ valeur critique})\sqrt{\frac{s_1^2}{n_1}]. +\frac{s_2^2}{n_2} } ,\]où \ (n_1\) et \(n_2\) sont les tailles des échantillons, \(s_1\) et \(s_2\) sont les écarts-types des échantillons, et \(\bar{x_1}\) et \(\bar{x}_2\) sont les moyennes des échantillons.
Apprends avec 11 fiches de Intervalle de confiance pour la différence de deux moyennes dans l'application gratuite StudySmarter
Tu as déjà un compte ? Connecte-toi
Questions fréquemment posées en Intervalle de confiance pour la différence de deux moyennes
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus