Tout le monde a déjà été confronté à cette situation : toi et ta moitié n'arrivez pas à vous mettre d'accord sur ce qu'il faut regarder pour la soirée de sortie ! Pendant que vous discutez tous les deux du film à regarder, une question surgit au fond de ton esprit : les différents types de personnes (par exemple, les hommes et les femmes) ont-ils des préférences différentes en matière de films ? La réponse à cette question, et à d'autres du même genre, peut être trouvée à l'aide d'un test spécifique du Khi-deux - le test du Khi-deuxa> pourl'homogénéité.
Lorsque tu veux savoir si deux variables catégorielles suivent la même distribution de probabilité (comme dans la question sur les préférences cinématographiques ci-dessus), tu peux utiliser le test d'homogénéité du khi-deux.
Le test d'homogénéité du khi-deux est un test non paramétrique du khi-deux de Pearson que tu appliques à une seule variable catégorielle provenant de deux ou plusieurs populations différentes afin de déterminer si elles ont la même distribution.
Dans ce test, tu collectes au hasard des données d'une population pour déterminer s'il existe une association significative entre \(2\) ou plusieurs variables catégorielles.
Conditions d'un test du chi carré pour l'homogénéité
Tous les tests du khi-deux de Pearson partagent les mêmes conditions de base. La principale différence réside dans la façon dont ces conditions s'appliquent dans la pratique. Un test du Khi-deux pour l'homogénéité nécessite une variable catégorielle provenant d'au moins deux populations, et les données doivent être le nombre brut de membres de chaque catégorie. Ce test permet de vérifier si les deux variables suivent la même distribution.
Pour pouvoir utiliser ce test, les conditions d'un test d'homogénéité du Khi-deux sont :
Les variables doivent être catégoriques.
Comme tu testes l'homogénéité des variables, elles doivent avoir les mêmes groupes. Ce test du Khi-deux utilise des tableaux croisés, en comptant les observations qui entrent dans chaque catégorie.
Référence de l'étude : "Arrêt cardiaque extrahospitalier dans les immeubles de grande hauteur : Delays to Patient Care and Effect on Survival "1 - qui a été publiée dans le Journal de l'Association médicale canadienne (JAMC) le 5 avril 2016.
Cette étude a comparé le mode de vie des adultes (maison ou maison de ville, appartement à \(1^{st}\) ou \(2^{nd}\) étage, et appartement à \(3^{rd}\) ou étage supérieur) avec leur taux de survie à une crise cardiaque (a survécu ou n'a pas survécu).
Ton objectif est de savoir s'il existe une différence dans les proportions des catégories de survie (c'est-à-dire, as-tu plus de chances de survivre à une crise cardiaque selon l'endroit où tu vis ?) pour les populations de \(3\N) :
les victimes de crises cardiaques qui vivent dans une maison ou une maison de ville,
les victimes de crises cardiaques qui vivent au 1er ou au 2e étage d'un immeuble d'habitation, et
les victimes de crises cardiaques qui vivent à l'étage (3^{rd}\) ou à un étage supérieur d'un immeuble d'habitation.
Les groupes doivent s'exclure mutuellement, c'est-à-dire que l'échantillon est sélectionné au hasard.
Chaque observation ne peut faire partie que d'un seul groupe. Une personne peut vivre dans une maison ou dans un appartement, mais elle ne peut pas vivre dans les deux.
Table de contingence
Mode de vie
Survécu
N'a pas survécu
Total des rangées
Maison ou maison en rangée
217
5314
5531
Appartement au1er ou2e étage
35
632
667
Appartement au3ème étage ou plus
46
1650
1696
Totaux des colonnes
298
7596
\(n =\) 7894
Tableau 1. Tableau de contingence, test du chi-deux pour l'homogénéité.
Les effectifs attendus doivent être au moins égaux à \(5\).
Cela signifie que la taille de l'échantillon doit être suffisamment grande, mais il est difficile de déterminer à l'avance quelle est cette taille. En général, il suffit de s'assurer qu'il y a plus de \(5\) dans chaque catégorie.
Les observations doivent être indépendantes.
Cette hypothèse est liée à la façon dont tu recueilles les données. Si tu utilises un échantillonnage aléatoire simple, il sera presque toujours statistiquement valide.
Test du chi carré pour l'homogénéité : hypothèse nulle et hypothèse alternative
La question sous-jacente à ce test d'hypothèse est la suivante : Ces deux variables suivent-elles la même distribution ?
Les hypothèses sont formées pour répondre à cette question.
L'hypothèse nulle est que les deux variables sont issues de la même distribution.\[ \i1{align}H_{0} : p_{1,1} &= p_{2,1} \text{ AND } \\N-p_{1,2} &= p_{2,2} \N-text{ AND } \ldots \text{ AND } \\N-p_{1,n} &= p_{2,n}\N- end{align} \]
L'hypothèse nulle exige que chaque catégorie ait la même probabilité entre les deux variables.
The alternative hypothesis is that the two variables are not from the same distribution, i.e., at least one of the null hypotheses is false.\[ \begin{align}H_{a}: p_{1,1} &\neq p_{2,1} \text{ OR } \\N-p_{1,2} &\neq p_{2,2} \text{ OR } \ldots \text{ OR } \\N-p_{1,n} &\neq p_{2,n}\N- end{align} \]
Si même une seule catégorie est différente d'une variable à l'autre, alors le test renverra un résultat significatif et fournira la preuve du rejet de l'hypothèse nulle.
Les hypothèses nulle et alternative de l'étude sur la survie après une crise cardiaque sont les suivantes :
La population est constituée des personnes qui vivent dans des maisons, des maisons en rangée ou des appartements et qui ont eu une crise cardiaque.
Hypothèse nulle\N( H_{0} : \N) Les proportions dans chaque catégorie de survie sont les mêmes pour tous les groupes de personnes.
Hypothèse alternative\N( H_{a} : \N) Les proportions dans chaque catégorie de survie ne sont pas les mêmes pour tous les groupes de personnes.
Fréquences attendues pour un test du khi-deux pour l'homogénéité
Tu dois calculer les fréquences attendues pour un test du Khi-deux pour l'homogénéité individuellement pour chaque population à chaque niveau de la variable catégorielle, comme indiqué par la formule :
\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]
où ,
\(E_{r,c}\) est la fréquence attendue pour la population \(r\) au niveau \(c\) de la variable catégorielle,
\(r\) est le nombre de populations, qui est également le nombre de lignes dans un tableau de contingence,
\(c\) est le nombre de niveaux de la variable catégorielle, qui est également le nombre de colonnes d'un tableau de contingence,
\(n_{r}\) est le nombre d'observations de la population \(r\),
\(n_{c}\) est le nombre d'observations du niveau \(c\) de la variable catégorielle, et
\(n\) est la taille totale de l'échantillon.
Poursuis avec l'étude sur la survie après une crise cardiaque :
Ensuite, tu calcules les fréquences attendues à l'aide de la formule ci-dessus et du tableau de contingence, en plaçant tes résultats dans un tableau de contingence modifié pour que tes données restent organisées.
Tableau 2. Tableau de contingence avec les fréquences observées, test du chi-deux pour l'homogénéité.
Tableau de contingence avec les fréquences observées (O) et les fréquences attendues (E)
Mode de vie
A survécu
N'a pas survécu
Total des rangées
Maison ou maison en rangée
O1,1: 217E1,1: 208.795
O1,2: 5314E1,2: 5322.205
5531
Appartement au1er ou2ème étage
O2,1: 35E2,1: 25.179
O2,2: 632E2,2: 641.821
667
Appartement au3ème étage ou plus
O3,1: 46E3,1: 64.024
O3,2: 1650E3,2: 1631.976
1696
Totaux des colonnes
298
7596
\(n =\) 7894
Les décimales du tableau sont arrondies à \(3\) chiffres.
Degrés de liberté pour un test d'homogénéité du khi-deux
Il y a deux variables dans un test du khi-deux pour l'homogénéité. Par conséquent, tu compares deux variables et tu as besoin que le tableau de contingence s'additionne dans les deux dimensions.
Puisque tu as besoin que les lignes et les colonnes s'additionnent, les degrés de liberté se calculent comme suit :
\[ k = (r - 1) (c - 1) \]
où,
\N(k\N) est le degré de liberté,
\(r\) est le nombre de populations, qui est également le nombre de lignes dans un tableau de contingence, et
\(c\) est le nombre de niveaux de la variable catégorielle, qui est également le nombre de colonnes d'un tableau de contingence.
Test du chi carré pour l'homogénéité : Formule
La formule (également appelée statistique de test) d'un test du khi-deux pour l'homogénéité est :
\(O_{r,c}\) est la fréquence observée pour la population \(r\) au niveau \(c\), et
\(E_{r,c}\) est la fréquence attendue pour la population \(r\) au niveau \(c\).
Comment calculer la statistique de test pour un test d'homogénéité du khi-deux ?
Étape 1 : Créer un tableau
En commençant par ton tableau de contingence, supprime la colonne "Totaux des lignes" et la ligne "Totaux des colonnes". Ensuite, sépare tes fréquences observées et attendues en deux colonnes, comme suit :
Tableau 3. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.
Tableau des fréquences observées et attendues
Mode de vie
Statut
Fréquence observée
Fréquence attendue
Maison ou maison de ville
Survivant
217
208.795
N'a pas survécu
5314
5322.205
Appartement du1er ou du2e étage
A survécu
35
25.179
N'a pas survécu
632
641.821
Appartement du3ème étage ou plus
A survécu
46
64.024
N'a pas survécu
1650
1631.976
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Étape \(2\) : Soustraire les fréquences attendues des fréquences observées
Ajoute une nouvelle colonne à ton tableau, intitulée "O - E". Dans cette colonne, inscris le résultat de la soustraction de la fréquence attendue à la fréquence observée :
Tableau 4. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.
Tableau des fréquences observées, attendues et O - E
Mode de vie
Statut
Fréquence observée
Fréquence attendue
O - E
Maison ou maison de ville
Survivant
217
208.795
8.205
N'a pas survécu
5314
5322.205
-8.205
Appartement du1er ou2ème étage
A survécu
35
25.179
9.821
N'a pas survécu
632
641.821
-9.821
Appartement du3ème étage ou plus
A survécu
46
64.024
-18.024
N'a pas survécu
1650
1631.976
18.024
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Étape \N(3\N) : Élever au carré les résultats de l'étape \N(2\N)Ajoute une nouvelle colonne à ton tableau, appelée "(O - E)2". Dans cette colonne, inscris le résultat de la mise au carré des résultats de la colonne précédente :
Tableau 5. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.
Tableau des fréquences observées, attendues, O - E et (O - E)2
Mode de vie
Statut
Fréquence observée
Fréquence attendue
O - E
(O - E)2
Maison ou maison de ville
Survivant
217
208.795
8.205
67.322
N'a pas survécu
5314
5322.205
-8.205
67.322
Appartement du1er ou2ème étage
Survivant
35
25.179
9.821
96.452
N'a pas survécu
632
641.821
-9.821
96.452
Appartement du3ème étage ou plus
Survivant
46
64.024
-18.024
324.865
N'a pas survécu
1650
1631.976
18.024
324.865
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Étape \(4\) : Diviser les résultats de l'étape \(3\) par les fréquences attenduesAjoute une nouvelle colonne à ton tableau appelée "(O - E)2/E". Dans cette colonne, inscris le résultat de la division des résultats de la colonne précédente par leurs fréquences attendues :
Tableau 6. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.
Tableau des fréquences observées, attendues, O - E, (O - E)2, et (O - E)2/E
Mode de vie
Statut
Fréquence observée
Fréquence attendue
O - E
(O - E)2
(O - E)2/E
Maison ou maison de ville
Survivant
217
208.795
8.205
67.322
0.322
N'a pas survécu
5314
5322.205
-8.205
67.322
0.013
Appartement du1er ou du2e étage
Survivant
35
25.179
9.821
96.452
3.831
N'a pas survécu
632
641.821
-9.821
96.452
0.150
Appartement du3ème étage ou plus
Survivant
46
64.024
-18.024
324.865
5.074
N'a pas survécu
1650
1631.976
18.024
324.865
0.199
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Étape 5 : Additionne les résultats de l'étape \N(4\N) pour obtenir la statistique du test du khi-deuxEnfin, additionne toutes les valeurs de la dernière colonne de ton tableau pour calculer la statistique de ton test du khi-deux :
La statistique du test du Khi-deux pour l'homogénéité dans l'étude sur la survie aux crises cardiaques est:
\[ \chi^{2} = 9.589. \]
Étapes à suivre pour effectuer un test du khi-deux pour l'homogénéité
Pour déterminer si la statistique du test est suffisamment importante pour rejeter l'hypothèse nulle, tu compares la statistique du test à une valeur critique tirée d'une table de distribution du khi-deux. Cette comparaison est au cœur du test d'homogénéité du khi-deux.
Suis les étapes ci-dessous pour effectuer un test d'homogénéité du khi-deux.
Les étapes \(1, 2\) et \(3\) sont décrites en détail dans les sections précédentes : "Test du khi-deux pour l'homogénéité : hypothèse nulle et hypothèse alternative", "Fréquences attendues pour un test du khi-deux pour l'homogénéité", et "Comment calculer la statistique de test pour un test du khi-deux pour l'homogénéité".
Étape \(1\) : Énoncer les hypothèses
L'hypothèse nulle est que les deux variables sont issues de la même distribution.\N-[ \N-{align}H_{0} : p_{1,1} &= p_{2,1} \N-{text{ AND }]. \\N-p_{1,2} &= p_{2,2} \N-text{ AND } \ldots \text{ AND } \\N-p_{1,n} &= p_{2,n}\N- end{align} \]
The alternative hypothesis is that the two variables are not from the same distribution, i.e., at least one of the null hypotheses is false.\[ \begin{align}H_{a}: p_{1,1} &\neq p_{2,1} \text{ OR } \\N-p_{1,2} &\neq p_{2,2} \text{ OR } \ldots \text{ OR } \\N-p_{1,n} &\neq p_{2,n}\N- end{align} \]
Étape \(2\) : Calculer les fréquences attendues
Fais référence à ton tableau de contingence pour calculer les fréquences attendues à l'aide de la formule :
\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]
Étape \N(3\N) : Calculer la statistique du test du khi-deux
Utilise la formule du test d'homogénéité du khi-deux pour calculer la statistique du test du khi-deux :
En utilisant le tableau de contingence, remarque qu'il y a \(3\) lignes et \(2\) colonnes de données brutes. Therefore, the degrees of freedom are:\[ \begin{align}k &= (r - 1) (c - 1) \\&= (3-1) (2-1) \\&= 2 \text{ degrees of freedom}\end{align} \]
Choisis un niveau de signification.
En général, sauf indication contraire, le niveau de signification de \( \alpha = 0,05 \) est celui que tu veux utiliser. Cette étude a également utilisé ce niveau de signification.
Détermine la valeur critique (tu peux utiliser un tableau de distribution du khi-deux ou une calculatrice). Un tableau de distribution du khi-deux est utilisé ici.
D'après le tableau de distribution du khi-deux ci-dessous, pour \N( k = 2 \N) et \N( \Nalpha = 0,05 \N), la valeur critique est :\N[ \Nchi^{2} \Ntext{ valeur critique} = 5,99. \N].
Tableau 7. Tableau des points de pourcentage, test du khi-deux pour l'homogénéité.
Points de pourcentage de la distribution du khi-deux
Degrés de liberté(k)
Probabilité d'une valeur plus grande de X2; niveau de signification (α).
0.99
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.01
1
0.000
0.004
0.016
0.102
0.455
1.32
2.71
3.84
6.63
2
0.020
0.103
0.211
0.575
1.386
2.77
4.61
5.99
9.21
3
0.115
0.352
0.584
1.212
2.366
4.11
6.25
7.81
11.34
Étape \(5\) : Comparer la statistique du test du khi-deux à la valeur critique du khi-deux
La statistique de ton test est-elle suffisamment grande pour rejeter l'hypothèse nulle ? Pour le savoir, compare-la à la valeur critique.
Compare la statistique de ton test à la valeur critique dans l'étude sur la survie des victimes de crises cardiaques :
La statistique du test du khi-deux est : \N( \Nchi^{2} = 9,589 \N)
La valeur critique du khi-deux est : \( 5.99 \)
La statistique du test du khi-deux est supérieure à la valeur critique.
Étape \(6\) : Décider de rejeter ou non l'hypothèse nulle
Enfin, décide si tu peux rejeter l'hypothèse nulle.
Si la valeur du khi-deux est inférieure à la valeur critique, la différence entre les fréquences observées et attendues n'est pas significative, c'est-à-dire que p > alpha.
Cela signifie que tu ne rejettes pas l'hypothèse nulle.
Si la valeur du Khi-deux est supérieure à la valeur critique, il y a une différence significative entre les fréquences observées et les fréquences attendues, c'est-à-dire \( p < \alpha \).
Cela signifie que tu as suffisamment de preuves pour rejeter l'hypothèse nulle.
Tu peux maintenant décider de rejeter l'hypothèse nulle pour l'étude sur la survie en cas de crise cardiaque :
La statistique du test du Khi-deux est supérieure à la valeur critique, c'est-à-dire que la valeur de \(p\) est inférieure au seuil de signification.
Tu as donc des preuves solides que les proportions dans les catégories de survie ne sont pas les mêmes pour les groupes \(3\).
Tu conclus qu'il y a moins de chances de survie pour les personnes victimes d'une crise cardiaque et vivant au troisième étage ou plus d'un appartement, et tu rejettes donc l'hypothèse nulle.
Valeur P d'un test du khi-deux pour l'homogénéité
La valeur P d'un test du Khi-deux pour l'homogénéité est la probabilité que la statistique du test, avec \(k\) degrés de liberté, soit plus extrême que sa valeur calculée. Tu peux utiliser une calculatrice de distribution du khi-deux pour trouver la valeur \(p\) d'une statistique de test. Tu peux aussi utiliser un tableau de distribution du khi-deux pour déterminer si la valeur de la statistique de ton test du khi-deux est supérieure à un certain seuil de signification.
Test du chi-deux pour l'homogénéité VS l'indépendance
À ce stade, tu peux te demander quelle est la différence entre un test du khi-deux pour l'homogénéité et un test du khi-deux pour l'indépendance.
Tu utilises le test du Khi-deux pour l'homogénéité lorsque tu n'as que \(1) variable catégorielle provenant de \(2) (ou plus) populations.
Dans ce test, tu collectes au hasard des données d'une population pour déterminer s'il existe une association significative entre \(2\) variables catégorielles.
Lorsque tu interroges les élèves d'une école, tu peux leur demander quelle est leur matière préférée. Tu poses la même question à des populations d'élèves différentes :
les étudiants de première année et
étudiants de première année et à ceux de terminale.
Tu utilises un test d'homogénéité du khi-deux pour déterminer si les préférences des étudiants de première année diffèrent significativement de celles des étudiants de terminale.
Tu utilises le test du khi-deux pour l'indépendance lorsque tu as \Ndes variables catégorielles provenant de la même population.
Dans ce test, tu recueilles au hasard les données de chaque sous-groupe séparément afin de déterminer si le nombre de fréquences diffère de manière significative entre les différentes populations.
Dans une école, les élèves peuvent être classés en fonction de :
leur orientation (gaucher ou droitier) ou par
leur domaine d'études (mathématiques, physique, économie, etc.).
Tu utilises un test d'indépendance du khi-deux pour déterminer si le fait d'être gaucher ou droitier est lié au choix des études.
Exemple de test du khi-deux pour l'homogénéité
En reprenant l'exemple de l'introduction, tu décides de trouver une réponse à la question suivante : les hommes et les femmes ont-ils des préférences différentes en matière de films ?
Tu choisis un échantillon aléatoire de \(400\) étudiants de première année d'université : \N(200\N) hommes et \N(300\N) femmes. On demande à chaque personne lequel des films suivants elle préfère : The Terminator ; The Princess Bride ; ou The Lego Movie. Les résultats sont présentés dans le tableau de contingence ci-dessous.
Tableau 8. Tableau de contingence, test du chi carré pour l'homogénéité.
Tableau de contingence
Film
Hommes
Femmes
Totaux des rangées
Le Terminator
120
50
170
La Princesse Mariée
20
140
160
Lego Movie
60
110
170
Totaux des colonnes
200
300
\(n =\) 500
Solution:
Étape \(1\) : Énonce les hypothèses.
Hypothèse nulle: la proportion d'hommes qui préfèrent chaque film est égale à la proportion de femmes qui préfèrent chaque film. Ainsi,\N-[ \N-{align}H_{0} : p_{{text{hommes aiment Le Terminator}} &= p_{{text{femmes aiment Le Terminator}} \text{ AND} \\N-H_{0} : p_{text{hommes aiment The Princess Bride} &= p_{text{femmes aiment The Princess Bride}} \text{ AND} \\N-H_{0} : p_{text{hommes aiment Le Lego Movie} &= p_{text{femmes aiment Le Lego Movie}\N- [\N-] [\N-] [\N-] [\N-] [\N-] [\N-] \]
Hypothèse alternative: Au moins une des hypothèses nulles est fausse. So,\[ \begin{align}H_{a}: p_{\text{men like The Terminator}} &\neq p_{\text{women like The Terminator}} \text{ OR} \\N-H_{a} : p_{text{hommes aiment La Princesse Bride} &\neq p_{text{femmes aiment La Princesse Bride}} \text{ OR} \\N-H_{a} : p_{text{hommes aiment The Lego Movie} &\neq p_{text{femmes aiment The Lego Movie}}\end{align} \]
Étape \(2\) : Calculer les fréquences attendues.
En utilisant le tableau de contingence ci-dessus et la formule des fréquences attendues :\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n}, \]créer un tableau des fréquences attendues.
Tableau 9. Tableau des données pour les films, test du khi-deux pour l'homogénéité.
Film
Hommes
Femmes
Totaux des rangées
Terminator
68
102
170
La princesse mariée
64
96
160
Lego Movie
68
102
170
Totaux des colonnes
200
300
\(n =\) 500
Étape \(3\) : Calcule la statistique du test du khi-deux.
Crée un tableau pour conserver les valeurs calculées et utilise la formule :\[ \chi^{2} = \sum \frac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \]pour calculer la statistique de ton test.
Tableau 10. Tableau des données pour les films, test du Khi-deux pour l'homogénéité.
Film
Personne
Fréquence observée
Fréquence attendue
O-E
(O-E)2
(O-E)2/E
Terminator
Hommes
120
68
52
2704
39.767
Les femmes
50
102
-52
2704
26.510
Princess Bride
Les hommes
20
64
-44
1936
30.250
Les femmes
140
96
44
1936
20.167
Lego Movie
Les hommes
60
68
-8
64
0.941
Les femmes
110
102
8
64
0.627
Les décimales de ce tableau sont arrondies à \(3\) chiffres.
Add all the values in the last column of the table above to calculate the Chi-square test statistic:\[ \begin{align}\chi^{2} &= 39.76470588 + 26.50980392 \\&+ 30.25 + 20.16667 \\&+ 0.9411764706 + 0.6274509804 \\&= 118.2598039.\end{align} \]
La formule ici utilise les nombres non arrondis du tableau ci-dessus pour obtenir une réponse plus précise.
La statistique du test du Khi-deux est la suivante :\[ \chi^{2} = 118.2598039. \]
Étape \N(4\N) : Trouve la valeur critique du khi-deux et la valeur \(P\)-Valeur.
À l'aide d'un tableau de distribution du khi-deux, regarde la ligne des degrés de liberté (2) et la colonne de la signification (0,05) pour trouver la valeur critique de 5,99.
Pour utiliser une calculatrice de la valeur de \(p\), tu as besoin de la statistique du test et des degrés de liberté.
Entre les degrés de liberté et la valeur critique du Khi-deux dans la calculatrice pour obtenir :[P(\chi^{2} > 118,2598039) = 0. \N].
Étape \N(5\N) : Comparer la statistique du test du khi-deux à la valeur critique du khi-deux.
La statistique du test de \N(118.2598039\N) est significativement plus grande que la valeur critique de \N(5.99\N).
La valeur de \(p\) est également bien inférieure au niveau de signification.
Étape 6 : Décider de rejeter ou non l'hypothèse nulle.
Parce que la statistique du test est plus grande que la valeur critique et que la valeur de \(p\)est inférieure au seuil de signification, tu as suffisamment de preuves pour rejeter l'hypothèse nulle,
tu as suffisamment de preuves pour rejeter l'hypothèse nulle.
Test du chi-deux pour l'homogénéité - Principaux enseignements
Le test du Khi-deux pour l'homogénéité est un test du Khi-deux qui s'applique à une seule variable catégorielle provenant de deux ou plusieurs populations différentes afin de déterminer si elles ont la même distribution.
Ce test a les mêmes conditions de base que tout autre test du chi carré de Pearson;
Les variables doivent être catégoriques.
Les groupes doivent être mutuellement exclusifs.
Les effectifs attendus doivent être au moins égaux à \(5\).
Les observations doivent être indépendantes.
L'hypothèse nulle est que les variables proviennent de la même distribution.
L'hypothèse alternative est que les variables n'appartiennent pas à la même distribution.
Les degrés de liberté d'un test du Khi-deux pour l'homogénéitésont donnés par la formule :\[ k = (r - 1) (c - 1) \].
La fréquence attendue pour la ligne \(r\) et la colonne \(c\) d'un test du Khi-deux pour l'homogénéité est donnée par la formule :\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]
La formule (ou statistique de test) d'un test du Khi-deux pour l'homogénéité est donnée par la formule suivante :\[ \chi^{2} = \sum \frac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \].
Apprends plus vite avec les 7 fiches sur Test du khi-deux pour l'homogénéité
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Test du khi-deux pour l'homogénéité
Qu'est-ce que le Test du khi-deux pour l'homogénéité?
Le Test du khi-deux pour l'homogénéité est une méthode statistique pour vérifier si deux ou plusieurs groupes indépendants suivent la même distribution.
Comment effectuer le Test du khi-deux pour l'homogénéité?
Pour effectuer le test, il faut établir un tableau de contingence, calculer les fréquences attendues, trouver la statistique khi-deux et comparer avec une valeur critique.
Quels sont les prérequis du Test du khi-deux pour l'homogénéité?
Les prérequis incluent des échantillons indépendants, des données catégorielles, et des effectifs théoriques d'au moins 5 par cellule.
Quand utiliser le Test du khi-deux pour l'homogénéité?
On utilise le test lorsqu'on veut comparer les distributions de deux ou plusieurs groupes indépendants sur une même variable qualitative.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.