Sauter à un chapitre clé
Malheureusement pour toi, l'alarme incendie ne se déclenche pas, et avant même que tu t'en rendes compte, les flammes se sont répandues dans toute la cuisine et tu ne peux plus descendre pour appeler le 999.
C'est un exemple d'erreur de type II, que l'on appelle aussi faux négatif. Il y a un incendie mais l'alarme ne se déclenche pas. De même, dans les tests d'hypothèse, une erreur de type II se produit lorsque tu ne rejettes pas l'hypothèse nulle mais que celle-ci est en fait fausse.
Qu'est-ce qu'une erreur de type II en statistiques ?
Supposons que tu aies effectué un test d'hypothèse et que tu ne rejettes pas l'hypothèse nulle \(H_0\).
Une erreur de type II se produit lorsque l'hypothèse nulle est en fait fausse ou que l'hypothèse alternative, \(H_1\), est vraie.
C'est différent d'une erreur de type I qui se produit lorsque tu rejettes l'hypothèse nulle, mais que l'hypothèse nulle est en fait vraie.
Ces deux erreurs peuvent être représentées dans le tableau suivant,
\N- (H_0\N) vrai | \N(H_1\N) vrai | |
Rejeter \(H_0\) | Erreur de type I | Pas d'erreur |
Ne pas rejeter \(H_0\) | Pas d'erreur | Erreur de type II |
Une erreur de type II est également connue sous le nom de faux négatif.
Une erreur de type II (faux négatif) se produit lorsque tu ne rejettes pas \(H_0\), mais que \(H_0\) est en fait faux.
Un exemple de faux négatif est celui d'une personne qui fait un test de dépistage du coronavirus et qui reçoit un résultat indiquant qu'elle n'est pas infectée, alors qu'elle l'est en réalité.
Probabilité d'une erreur de type II
La probabilité d'une erreur de type II est notée \(\beta\) et pour trouver la probabilité d'une erreur de type II, tu dois connaître la vraie valeur du paramètre testé, qui te sera généralement donnée dans la question.
La probabilité d'une erreur de type II est la probabilité d'accepter l'hypothèse nulle lorsqu'elle est fausse.
Elle peut également être considérée comme la probabilité de ne pas se trouver dans la région critique en supposant que l'hypothèse nulle est fausse, et est donnée par la formule suivante,
\[\N- Début{align} \mathbb{P}( \text{Type II error})&=\mathbb{P}(\text{acceptation } H_0 \text{ quand } H_0 \text{ est fausse}) \\N &=\mathbb{P}(\text{ne pas être dans la région critique} \mid H_0 \text{ est fausse}) \end{align}\N]
Probabilité d'une erreur de type II Exemples
Considérons une variable \(X\) avec une distribution de Poisson. Un échantillon est prélevé et un statisticien souhaite effectuer le test d'hypothèse suivant, \(H_0 : \lambda=9\) v.s. \(H_1:\lambda\neq9\), au niveau de signification de 5 %.
a) Trouve la région critique pour ce test.
b) Suppose que la vraie valeur de \(\lambda\) s'avère être 8, calcule la probabilité d'une erreur de type II.
Solution
a) Puisque \(H_0 : \lambda=9\) v.s. \(H_1:\lambda\neq9\), nous avons affaire à un test bilatéral.
Supposons que \(H_0\) est vrai, c'est-à-dire supposons que \(X\sim \text{Poi}(9)\).
Soit \N(X=c_1\N) la limite supérieure de la région critique inférieure. Nous voulons trouver \(c_1\) tel que \(\mathbb{P}(X \leq c_1)<0.0025\).
D'après les tableaux statistiques,
\[\begin{align} \mathbb{P}(X \leq 4)&=0.0550>0.0025 \\mathbb{P}(X \leq 3)&=0.0212<0.0025 \n- end{align}\n-]
Par conséquent, \(c_1=3\).
Soit \N(X=c_2\N) la limite inférieure de la région critique supérieure. Nous voulons trouver \N(c_2\N) de telle sorte que \N(\mathbb{P}(X \geq c_2)<0.0025\N).
D'après les tableaux statistiques,
\[\small{\begin{align} \mathbb{P}(X \geq 15)&=1-\mathbb{P}(X \leq 14)=1-0.9585=0.0415>0.0025 \mathbb{P}(X \geq 16)&=1-\mathbb{P}(X \leq 15)=1-0.9780=0.0220<0.0025 \end{align}}\]
Par conséquent, \(c_2=16\).
La région critique pour ce test est donc \({X \leq3}\) et \({X \geq 16}\).
b) Puisque nous avons la vraie valeur de \N(\Nlambda=8}), nous savons que l'hypothèse nulle est fausse et nous pouvons donc calculer la probabilité d'une erreur de type II.
\(\begin{align}) \mathbb{P}(\text{Type II error})&=\mathbb{P}(\text{accepting } H_0 \text{ when } H_0 \text{ is false}) \\N &=\mathbb{P}(4\leq X\geq 15 \mid H_0 \text{ is false}) \Nend{align}\N)
Etant donné que la vraie valeur de \(\lambda=8\),
\N- (\N- début{align}) \mathbb{P}( \text{ Type II error })&=\mathbb{P}(4 \leq X \geq 15\mid \lambda=8) \mathbb{P}(X \geq 15 \mid \lambda=8)-\mathbb{P}(X \leq 3 \mid \lambda=8) \mathbb{P}(4 \leq X \geq 15\mid \lambda=8) \mathbb{P}=0.9918-0.0424=0.9494. \n-{align}\n-)
Prenons maintenant un autre exemple.
Supposons que quelqu'un affirme que la taille moyenne des hommes aux États-Unis est normalement distribuée avec une moyenne de 70 pouces et un écart type de 3 pouces.
Un statisticien décide alors de prendre un échantillon aléatoire de 36 hommes de la population des États-Unis afin de tester cette affirmation.
Soit la variable aléatoire \(X\) représentant la taille d'un homme.
a) En utilisant un niveau de signification de 5 %, trouve la région critique pour ce test.
b) Étant donné que la taille moyenne était en fait de 65 pouces, trouve la probabilité que l'affirmation de la personne soit acceptée à tort.
Solution
a) Nous définissons l'hypothèse nulle
\H_0 : \mu=70 \quad \text{v.s.} H_1 : \mu\neq70.\N]
Supposons que \(H_0), alors puisque \(X) représente la taille d'un homme, la taille moyenne des hommes aux États-Unis est distribuée de telle sorte que \(\bar{X} \sim N(70, 3^2/36)\N).
Puisque nous voulons faire le test en utilisant la moyenne d'une variable aléatoire normale, pour simplifier les choses, nous pouvons utiliser le résultat,
Si \(\bar{X} \sim N(\mu,\sigma^2)\N), alors \(Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt n}}) \sim N(0,1)\N).
Normalise cette variable \(\bar{X}\) : \( Z=\frac{\bar{X}-70}{\frac{3}{\sqrt(36)}} = \frac{\bar{X}-70}{\frac{1}{2}}=2(\bar{X}-70)\) où la variable aléatoire \(Z \sim N(0, 1)\).
Avec un niveau de signification de 5 %, puisque nous avons un test d'hypothèse bilatéral, nous avons besoin de 2,5 % sur chaque queue.
D'après les tableaux statistiques, la région critique pour \N(Z\N) est la suivante
\N(Z > 1.9600\N) ou \N(Z<-1.9600\N)
Les valeurs critiques de \(\bar{X}\) sont donc données par
\[2(\bar{X}-70)=\pm 1,96\]
\N- Par conséquent, \Nbar{X} = 69,02 \Net \Ncertainement \Nbar{X} = 70,98 \N]
La région critique pour \(\bar{X}\) est donc \(\bar{X} <69.02\) ou \(\bar{X} >70.98\).
b) Si l'affirmation de la personne concernant la taille moyenne des hommes est acceptée alors que la taille moyenne réelle s'avère être différente, il s'agit d'une erreur de type II.
\[\begin{align} \mathbb{P}(\text{Type II error})&=\mathbb{P}(69.02 \leq \bar{X} \leq 70.98 \mid \mu=65) \\N- &=\mathbb{P}(\bar{X} \leq 70.98 \mid \mu=65)-\mathbb{P}(\bar{X} \leq 69.02 \mid \mu=65) \N &=0.9769-0.9099\&=0.067. \N- [Fin{align}\N-]
Erreur de type II et puissance d'un test
La puissance d'un test d'hypothèse est la probabilité de rejeter une fausse hypothèse nulle.
C'est cette probabilité qui intéresse les statisticiens, car plus la puissance est élevée, meilleur est le test. Par conséquent, un statisticien cherche à minimiser la probabilité d'une erreur de type II afin de maximiser la puissance du test.
En mettant à jour le tableau présenté précédemment, nous avons,
\N-(H_0\N) vrai | \N-(H_1\N) vrai | |
Rejeter \(H_0\) | Erreur de type I | \(\text{Power} = 1 - \mathbb{P}(\text{Erreur de type II})\) |
Ne pas rejeter \N(H_0\N) | Pas d'erreur | Erreur de type II |
La puissance d'un test est atteinte lorsque \(H_0\) est fausse et qu'une décision correcte a été prise.
Sa probabilité est donnée par ,
\[\begin{align} \text{Puissance}&=1-\mathbb{P}(\text{Erreur de type II})=1-\beta \\\N &=\mathbb{P}(\text{être dans la région critique lorsque } H_0 \text{ est fausse}) \end{align}\N]
Supposons qu'une variable aléatoire \(X\) ait une distribution géométrique. Un statisticien souhaite tester l'hypothèse \[H_0 : p=0,05\quad \text{v.s.} \quad H_1 : p\neq0,05\] en utilisant un niveau de signification de 1 %.
a) Trouve la région critique pour ce test.
b) Maintenant, étant donné que \(p=0,03\), trouve la puissance de ce test.
Solution
a) Supposons que nous soyons sous l'hypothèse nulle, \N(H_0), de sorte que \N(X \sim \text{Geo}(0.05)\N). Comme il s'agit d'un test bilatéral au niveau de signification de 1 %, si \(X=c_1\) est la limite inférieure de la région critique supérieure, nous devons trouver \(c_1\) de telle sorte que \[\mathbb{P}(X \geq c_1)<0,005.\N].
D'après la distribution d'une variable aléatoire géométrique, nous avons
\[\N- (1-0.05)^{c_1-1}&<0.005 \N- c_1-1&>\frac{\Nln(0.005)}{\Nln(0.95)} \N- c_1&>104.29454 \N- fin{align}\N].
Donc \(c_1=104\) ce qui donne une région critique supérieure de \(X \geq 104.\)
Si \(X=c_2\) est la limite supérieure de la région critique inférieure, nous devons trouver \(c_2\) de telle sorte que
\N-[\N-Mathbb{P}(X \N-c_2)<0.005.\N]
\[\N- 1-(1-0.05)^{c_2}&<0.005 \N- 0.95^c_2&>0.995 \N- c_2&<\Nfrac{\Nln(0.995)}{\Nln(0.95)} \N- c_2&<0.0977 \N- end{align}\N].
Donc \(c_2=0.1\) ce qui donne une région critique inférieure de \(X \leq 0.01.\)
b) The power of the test can be calculated via, \[ \begin{align} \text{Power }&= \mathbb{P}(H_0 \text{ est rejetée} \mid p=0.03) \\ &=\mathbb{P}(X \leq 0.1 \mid p=0.03)+\mathbb{P}(X \geq 104 \mid p=0.03) \\N &=1-(1-0.03)^{0.1}+(1-0.03)^{104}=0.04513 \end{align}\N]
Erreurs de type II et taille de l'échantillon
Le principal facteur déterminant d'une erreur de type II est la taille de l'échantillon. Plus la taille de l'échantillon est petite, plus la probabilité d'une erreur de type II est élevée.
En d'autres termes, plus la puissance souhaitée d'un test est grande, plus la taille de l'échantillon est importante.
Il peut être difficile de décider de la taille correcte de l'échantillon d'un test car les statisticiens veulent minimiser la probabilité d'une erreur de type II, mais l'augmentation de la taille de l'échantillon augmente le coût. Néanmoins, lemoyen le plus important de minimiser les erreurs de type II est d'augmenter la taille de l'échantillon.
Erreur de type II - Principaux enseignements
- Une erreur de type II se produit lorsque tu ne rejettes pas \(H_0\), mais que \(H_0\) est en fait fausse.
Une erreur de type II est également connue sous le nom de faux négatif et est désignée par \(\beta\).
\N- [\N- Début{align} \mathbb{P}( \text{Type II error})&=\mathbb{P}(\text{acceptation } H_0 \text{ quand } H_0 \text{ est fausse}) \\N &=\mathbb{P}(\text{ne pas être dans la région critique} \mid H_0 \text{ est fausse}) \end{align}\N]
La puissance d'un test d'hypothèse est la probabilité que tu rejettes correctement l'hypothèse nulle et que l'hypothèse soit fausse.
L'erreur de type II est inversement proportionnelle à la puissance d'un test d'hypothèse, \(\text{Puissance}=1-\beta\).
Apprends avec 7 fiches de Erreurs de type II dans l'application gratuite StudySmarter
Tu as déjà un compte ? Connecte-toi
Questions fréquemment posées en Erreurs de type II
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus