Intervalle de confiance pour la différence de deux moyennes
Est-il vrai que le prix moyen d'une tasse de café est différent selon la taille de la ville dans laquelle tu vis ? Il semble certainement raisonnable que le prix moyen d'une tasse de café soit plus élevé dans une grande ville que dans une petite, mais comment savoir si c'est vraiment vrai ? Les intervalles de confiance pour la différence de deux moyennes sont la solution pour être vraiment sûr de ta réponse. Alors, résous tes problèmes de café en lisant la suite !
Intervalle de confiance pour la différence de deux moyennes dont les écarts types sont connus
Si tu ne t'intéressais qu'au prix moyen du café dans une ville, tu pourrais faire un intervalle de confiance pour une moyenne de population. Dans ce cas, pour réaliser un intervalle de confiance correct, il faudrait que :
Soit la taille de l'échantillon est suffisamment grande (\(n \ge 30\)), soit la distribution de la population est approximativement normale.
L'échantillon est aléatoire ou il est raisonnable de supposer qu'il est représentatif de l'ensemble de la population.
Si tu connais l'écart-type de la population, \ (\sigma\), l'intervalle de confiance est donné par
\[ \bar{x} \pm (z \text{ valeur critique})\Nà gauche(\frac{\sigma}{\sqrt{n}}\Nà droite)\N]
où \(\bar{x}\) est la moyenne de l'échantillon.
Mais ici, tu as deux villes différentes et tu veux comparer le prix moyen du café, alors comment construire l'intervalle de confiance ? Commençons par énumérer certaines des notations utilisées par la suite.
Tout d'abord, la notation de la population :
Population (1)
Population (2)
Population Moyenne
\N- \N( \Nmu_1\N)
\N- \N- \N- \N- \N( \Nmu_2\N)
Écart-type de la population
\N- (\Nsigma_1\N)
\(\sigma_2\)
Et maintenant, les échantillons :
Échantillon de la population (1)
Échantillon de la population (2)
Taille de l'échantillon
\(n_1\)
\(n_2\)
Moyenne de l'échantillon
\N- (\Nbar{x}_1\N)
\(\bar{x}_2\)
Écart-type de l'échantillon
\(s_1\)
\(s_2\)
Les conditions pour construire un intervalle de confiance pour la différence de deux moyennes sont donc les suivantes :
Les échantillons sont indépendants.
Soit la taille de l'échantillon est suffisamment grande (\(n_1 \ge 30\) et \(n_2 \ge 30\)), soit la distribution de la population est approximativement normale.
Les échantillons sont aléatoires ou il est raisonnable de supposer que les échantillons sont représentatifs de la population plus large.
Ces conditions ne changent pas même si tu ne connais pas les écarts types de la population.
Comme les échantillons sont indépendants et aléatoires, tu sais que
En général, tu ne sauras pas quels sont les écarts types de la population, mais voyons un exemple illustrant l'utilisation de ces formules.
Tu fais une enquête auprès de 40 cafés de petites villes et de 49 cafés de grandes villes, et tu trouves que le prix moyen d'une grande tasse de café est de 3,75 $ et qu'il est de 4,50 $ dans les grandes villes. Tu sais aussi que l' écart type de la population dans les petites villes est de (1,20) et dans les grandes villes de (0,98).
Construis un intervalle de confiance de \(99\%) pour la différence de leurs deux moyennes, et tire-en des conclusions.
Solution :
Il est utile de présenter les informations dont tu disposes. Appelle la petite ville Population \(1\) et la grande ville Population \(2\). Tu sais alors que
Tu sais que la valeur critique d'un intervalle de confiance de \(99\%\) est \(2,58\). Calcule ensuite l'intervalle de confiance pour la différence des moyennes,
Qu'est-ce que tu peux en conclure ? Tout d'abord, tu peux conclure que la méthode utilisée pour construire cette estimation d'intervalle réussit à capturer la différence réelle dans les moyennes de la population environ \(99\%\) du temps.
Plus important encore, tu peux conclure avec un degré de confiance de 99% que la différence réelle dans le prix moyen d'une grande tasse de café se situe entre 1,36$ et 0,14$. Comme les deux extrémités de l'intervalle de confiance sont négatives, tu peux estimer que le prix moyen d'une grande tasse de café est entre \ (0,14 $) et \ (1,36 $) plus bas dans une petite ville que dans une grande ville.
Remarque que dans l'exemple précédent, les deux extrémités de l'intervalle de confiance étaient négatives. Que se passe-t-il si l'une des extrémités est négative et l'autre positive ? Cela implique que \(0\) est à l'intérieur de l'intervalle de confiance, donc en d'autres termes, il serait plausible qu'il n'y ait pas de différence entre les deux moyennes.
Intervalle de confiance pour la différence de deux moyennes de population indépendantes
Si tu ne connais pas les écarts types de la population, mais que tu sais que tes échantillons sont indépendants (c'est-à-dire que le choix d'un membre de la première population n'affecte pas ton choix d'un membre de la deuxième population), tu peux calculer l'intervalle de confiance à l'aide de la formule suivante :
C'est la même façon de calculer le degré de liberté pour un test \(t\) à deux échantillons.
Voyons un exemple d'application de ces formules et de conclusions.
Tu fais une enquête auprès de 40 cafés de petites villes et de 49 cafés de grandes villes, et tu trouves que le prix moyen d'une grande tasse de café est de 3,75 $ et qu'il est de 4,50 $ dans les grandes villes. Tu sais aussi que l' écart type de l'échantillon dans les petites villes est de (1,00), et dans les grandes villes, l' écart type de l'échantillon est de (0,70).
Construis un intervalle de confiance de \(99\%\) pour la différence de leurs deux moyennes, et tire-en des conclusions.
La plupart des tableaux de \N(t\N) n'auront pas \N(df = 68\N) en eux, cependant une calculatrice vous donnera la valeur critique appropriée de \N(t\N) de \N(2,65\N).
Calcule ensuite l'intervalle de confiance pour la différence entre les deux moyennes de la population,
Tu peux donc conclure avec un degré de confiance de 99 % que la différence réelle dans le prix moyen d'une grande tasse de café se situe entre 1,26 $ et 0,24 $. Comme les deux extrémités de l'intervalle de confiance sont négatives, tu peux estimer que le prix moyen d'une grande tasse de café est entre \ (0,24 $) et \ (1,26 $) plus bas dans une petite ville que dans une grande ville.
En quoi la marge d'erreur diffère-t-elle de l'intervalle de confiance ?
Marge d'erreur d'un intervalle de confiance pour la différence entre les moyennes de deux populations
La marge d'erreur est en fait définie comme la moitié de la largeur de l'intervalle de confiance. Ainsi, dans le cas de la différence entre deux moyennes où tu ne connais pas les écarts types de la population, la marge d'erreur est donnée par
Dans les deux cas, il s'agit juste de la moitié de la largeur de l'intervalle de confiance.
Formule d'intervalle de confiance pour la différence entre deux moyennes
Être capable d'utiliser la formule est certainement une partie de la création d'un intervalle de confiance. Il est tout aussi important d'être capable d'utiliser les informations que la formule te donne pour tirer des conclusions. En fait, la plupart des logiciels statistiques prennent les données que tu leur donnes et font les calculs pour toi !
Lorsque l'on examine l'intervalle de confiance pour la différence entre deux moyennes, trois choses peuvent se produire :
Les deux extrémités de l'intervalle sont négatives.
Les deux extrémités de l'intervalle sont positives.
L'une des extrémités est négative et l'autre est positive.
Tu as déjà vu un exemple de conclusion tirée lorsque les deux extrémités sont négatives, alors voyons un exemple de conclusion que tu peux tirer dans chacun des deux autres cas.
Supposons que tu aies un nouveau traitement médical et que tu veuilles étudier le nombre moyen de jours de guérison des personnes qui reçoivent le traitement par rapport à celles qui ne le reçoivent pas. Les personnes ont été réparties au hasard entre le groupe traité et le groupe placebo. Définis
Population \(1\) - les personnes qui reçoivent le traitement ; et
Population \(2\) - les personnes qui reçoivent un placebo.
Supposons que l'intervalle de confiance pour la différence entre les deux moyennes, \(\bar{x}_1 - \bar{x}_2 \) soit \( (14,7, 23,1)\). Quelle conclusion peux-tu tirer sur la différence entre le traitement et le placebo ?
Solution :
Ici, les deux extrémités de l'intervalle de confiance sont positives. Cela signifie que tu penses que \(\mu_1 - \mu_2 > 0\), ou en d'autres termes que le temps moyen de rétablissement des personnes qui ont reçu le traitement médical est plus important que le temps moyen de rétablissement des personnes qui ont reçu le placebo, et qu'en fait le temps de rétablissement des personnes qui ont reçu le traitement médical est plus long d'au moins \(14\) jours. Malheureusement, cela impliquerait que le nouveau traitement médical n'aide pas les gens à se rétablir plus rapidement.
Ensuite, le cas où un point final est négatif et un autre positif.
Utilisons exactement la même configuration que dans l'exemple précédent. Donc
Population \(1\) - les personnes qui reçoivent le traitement ; et
Population \(2\) - les personnes qui reçoivent un placebo.
Supposons que l'intervalle de confiance pour la différence entre les deux moyennes, \N(\Nbar{x}_1 - \Nbar{x}_2 \N) soit \N( (-3,4, 4,3)\N). Quelle conclusion peux-tu tirer sur la différence entre le traitement et le placebo ?
Solution :
Ici, zéro est inclus dans l'intervalle de confiance. Cela implique qu'il est plausible que \(\mu_1\) et \(\mu_2\) soient identiques. En d'autres termes, il est plausible que le nouveau traitement médical ne soit ni plus ni moins efficace que le placebo. Tu peux donc dire que même si le nouveau traitement médical n'a probablement pas aidé, il n'a probablement pas été pire que le placebo.
Il est toujours utile de voir un autre exemple.
Exemple d'intervalle de confiance pour la différence entre les moyennes de deux populations
Examinons quelque chose que tu pourrais confondre avec un problème de différence entre deux moyennes au premier abord.
Il est courant que les élèves d'une classe reçoivent un pré-test, qu'ils apprennent la matière, puis qu'ils fassent un test réel. Cela permet (si tout va bien) de mesurer ce que les élèves apprennent en classe. S'agit-il d'un cas où tu devrais construire un intervalle de confiance pour la différence entre les deux moyennes de la population ?
Solution :
Rappelle-toi qu'une des conditions pour construire un intervalle de confiance pour la différence de deux moyennes est que tes échantillons soient indépendants. Dans cet exemple, un élève qui a passé le pré-test est automatiquement placé dans le groupe qui passera le test réel. Ces échantillons ne sont absolument pas indépendants !
Ainsi, bien que cela ressemble à une question sur la différence de deux moyennes, tu devras en fait examiner les personnes de la classe et la différence de leurs résultats au test et faire un intervalle de confiance pour la moyenne de la population.
Ce n'est pas parce qu'il y a le mot "différence" que tu dois faire un intervalle de confiance pour la différence entre deux moyennes. On considère qu'il s'agit d'échantillons appariés, et un intervalle de confiance standard pour une moyenne de population est la façon d'aborder ce problème.
Voyons maintenant un exemple où les échantillons sont indépendants.
Suppose que tu veuilles savoir si la couleur de la tasse à café a un impact sur la façon dont les gens pensent à la saveur. Tu prends \(24\) personnes et tu les répartis au hasard dans l'un des deux groupes de traitement : soit une tasse à café blanche, soit une tasse à café orange.
Le café dans une tasse orange est-il meilleur ?
Les deux groupes ont reçu exactement le même café et on leur a demandé d'évaluer la saveur sur une échelle de 0 à 100. Les résultats figurent dans le tableau ci-dessous.
Échantillon
Taille de l'échantillon
Évaluation moyenne de la qualité
Écart-type de l'échantillon
Échantillon 1 : tasse à café blanche
\(n_1 = 12\)
\(\bar{x}_1 = 50.35\)
\(s_1 = 20.17\)
Échantillon 2 : tasse à café orange
\(n_2 = 12\)
\(\bar{x}_2= 61.48\)
\(s_2 = 16.69\)
Peux-tu conclure que la couleur de la tasse fait une différence dans l'évaluation moyenne de la qualité du café ?
Solution :
Vérifions d'abord que toutes les conditions pour construire un intervalle de confiance pour la différence de deux moyennes sont remplies. Les échantillons sont certainement indépendants et choisis au hasard, mais la taille de l'échantillon est inférieure à \(30\). Cela signifie que tu devras supposer que les distributions des deux évaluations de la qualité sont approximativement normales. Il n'est pas déraisonnable de supposer cela, mais il faudra le mentionner lorsque tu tireras une conclusion.
Ensuite, tu devras calculer les degrés de liberté. Voici
En supposant que les distributions des deux évaluations de la qualité sont approximativement normales, tu peux conclure avec un niveau de confiance de 95 % que la différence réelle de l'évaluation moyenne se situe entre 26,85 et 4,67. Comme zéro se trouve dans l'intervalle de confiance, il est plausible de conclure qu'il n'y a pas de différence dans l'évaluation moyenne de l'échelle des saveurs entre le mug blanc et le mug orange.
Intervalle de confiance pour la différence de deux moyennes - Principaux enseignements
Les conditions pour construire un intervalle de confiance pour la différence de deux moyennes sont :
Les échantillons sont indépendants.
Soit la taille de l'échantillon est suffisamment grande (\(n_1 \ge 30\) et \(n_2 \ge 30\)), soit la distribution de la population est approximativement normale.
Les échantillons sont aléatoires ou on peut raisonnablement supposer qu'ils sont représentatifs de la population dans son ensemble.
Si tu connais les écarts types de la population, la formule de l'intervalle de confiance pour la différence entre les deux moyennes est la suivante
\[\bar{x}_1 - \bar{x}_2 \pm (z \text{ valeur critique})\sqrt{\frac{\sigma_1^2}{n_1}]. +\frac{\sigma_2^2}{n_2} } ,\]où \(\bar{x}_1\) est la moyenne de l'échantillon \(1\), \(\bar{x}_2\) est la moyenne de l'échantillon \(2\), \(\sigma_1\) est l'écart type de la population \(1\), et \(\sigma_2\) est l'écart type de la population \(2\).
Le degré de liberté d'un intervalle de confiance pour la différence de deux moyennes se calcule comme suit
Si tu ne connais pas l'écart type de la population, la formule de l'intervalle de confiance pour la différence entre deux moyennes est la suivante
\[\bar{x}_1 - \bar{x}_2 \pm (t \text{ valeur critique})\sqrt{\frac{s_1^2}{n_1}]. +\frac{s_2^2}{n_2} } ,\]où \ (n_1\) et \(n_2\) sont les tailles des échantillons, \(s_1\) et \(s_2\) sont les écarts-types des échantillons, et \(\bar{x_1}\) et \(\bar{x}_2\) sont les moyennes des échantillons.
Apprends plus vite avec les 11 fiches sur Intervalle de confiance pour la différence de deux moyennes
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Intervalle de confiance pour la différence de deux moyennes
Qu'est-ce qu'un intervalle de confiance pour la différence de deux moyennes ?
Un intervalle de confiance pour la différence de deux moyennes est une plage de valeurs qui estime la différence entre deux moyennes de population avec un certain niveau de confiance.
Comment calculer un intervalle de confiance pour la différence de deux moyennes ?
Pour calculer cet intervalle, on utilise les moyennes échantillonnées, les écarts-types et les tailles d'échantillons de deux groupes, puis on applique une formule spécifique.
Pourquoi utilise-t-on un intervalle de confiance pour la différence de deux moyennes ?
On utilise cet intervalle pour quantifier l'incertitude autour de l'estimation de la différence de deux moyennes, aidant ainsi à faire des inférences statistiques fiables.
Quels sont les composants principaux d'un intervalle de confiance pour la différence de deux moyennes ?
Les composants principaux sont les moyennes des échantillons, les écarts-types des échantillons, les tailles des échantillons et le niveau de confiance choisi.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.