Lorsque nous faisons une déclaration sur la valeur d'un paramètre de la population, nous appelons cela une hypothèse. Nous pouvons tester une hypothèse sur une population en prélevant un échantillon de la population ou en menant une expérience. Lorsque nous effectuons un test d'hypothèse, nous devons avoir deux hypothèses. Celles-ci doivent toutes deux être une affirmation impliquant le paramètre de la population testé.
L'hypothèse nulle ou est l'hypothèse que l'on suppose correcte. L'hypothèse alternative ou décrit ce qui arrive au paramètre si l'hypothèse nulle est incorrecte.
L'hypothèse nulle est toujours un paramètre de la population égal à une certaine valeur. L'hypothèse alternative dépend de la nature unilatérale ou bilatérale du test. Si le test est unilatéral, l'hypothèse nulle comprendra soit , soit , tandis que s'il est bilatéral, elle impliquera .
On parle souvent de la statistique du test, qui est le résultat de l'expérience ou de l'échantillon de la population.
Réalisation d'un test d'hypothèse
La méthode générale pour effectuer un test d'hypothèse consiste à supposer que l'hypothèse nulle est vraie. Nous trouvons ensuite la probabilité que la statistique du test se produise, étant donné les conditions de l'hypothèse nulle. Si cette valeur est inférieure à un pourcentage donné, appelé niveau de signification ( ), nous pouvons rejeter l'hypothèse nulle. Dans le cas contraire, nous n'avons pas suffisamment de preuves pour rejeter l'hypothèse nulle. Remarque : on dit parfois "nous acceptons l'hypothèse nulle", ce qui n'est pas tout à fait exact mais qui est parfois accepté.
Le niveau de signification est toujours indiqué au début d'un test, mais il est normalement de 5 %.
Nous pouvons également être amenés à trouver la région critique et les valeurs d'une distribution de probabilité. La région critique est définie comme la (les) région(s) de la distribution de probabilité, où l'hypothèse nulle serait rejetée si la statistique du test tombait à l'intérieur de cette région. La valeur critique est la première valeur à tomber dans cette région. Dans un test unilatéral, nous aurons une région/valeur critique, alors que dans un test bilatéral, il y en aura deux, car nous devons prendre en compte les deux extrémités de la distribution.
Nous pouvons également visualiser cela sous forme de graphique. Nous devons montrer que la statistique du test se trouve à l'intérieur de la région critique pour rejeter l'hypothèse nulle. Pour un test unilatéral, cela ressemble à ceci :
Visualisation d'un test unilatéral
La région verte est la région critique et correspond au niveau de signification. Le scénario est similaire pour un test bilatéral, qui se présente comme suit :
Visualisation d'un test bilatéral
Chaque région s'additionne à la moitié du niveau de signification du test, donc les deux régions critiques s'additionnent au niveau de signification.
Test d'hypothèse avec une distribution binomiale
Pour une variable aléatoire X à distribution binomiale, écrite , nous testons des probabilités, ce qui signifie que le paramètre de la population est p. Cela signifie que nous devons utiliser p dans l'énoncé de l'hypothèse.
Test unilatéral
Les étapes d'un test unilatéral sont les suivantes :
Définis la statistique de test et le paramètre de population (nous utilisons normalement X pour la statistique de test, et pour la distribution binomiale, nous utilisons p pour le paramètre de population).
Ecris l'hypothèse nulle et l'hypothèse alternative.
Calcule la probabilité que la statistique du test atteigne la valeur observée, étant donné que l'hypothèse nulle se vérifie.
Compare cette probabilité au niveau de signification.
Conclus dans le contexte de la question.
Un dé standard à six faces utilisé dans un jeu de société est considéré comme biaisé parce qu'il ne fait pas sortir un un aussi souvent que les cinq autres valeurs. En 40 lancers, le un n'apparaît que trois fois.
À un niveau de signification de 5 %, teste si ce dé est biaisé. Soit X le nombre de fois où un dé à six faces a été lancé, donnant un résultat de un. Soit p la probabilité d'obtenir un 1 lors d'un lancer de dé.
Suppose que la nullité est vraie, donc .
. Il n'y a donc pas suffisamment de preuves pour rejeter la nullité - il n'y a pas assez de preuves pour montrer que le dé est biaisé.
Test bilatéral
Les étapes d'un test bilatéral sont presque identiques à celles d'un test unilatéral ; cependant, nous devons maintenant diviser par deux le niveau de signification à tester aux deux extrémités. Essentiellement, pour ne pas rejeter l'hypothèse nulle, il faut que la probabilité que la statistique du test se produise soit comprise entre et .
Un enseignant pense que 30 % des élèves regardent le football le samedi après-midi. L'enseignant interroge 50 élèves et 21 d'entre eux regardent le football le week-end. Déclare, avec un niveau de signification de 10 %, si le Pourcentage d'élèves qui regardent le football le samedi après-midi est différent ou non de 30 %.
Comme il s'agit d'un test bilatéral, nous avons un niveau de signification de 5 % à chaque extrémité de la distribution. Soit X le nombre d'élèves qui regardent le football le samedi après-midi.
Soit p la probabilité qu'un élève regarde le football le samedi après-midi.
En supposant que l'hypothèse nulle se vérifie, puis , et enfin , nous pouvons rejeter l'hypothèse nulle en faveur de l'hypothèse alternative. (Remarque : nous avons vérifié l'extrémité de la distribution car 21/50> 0,3).
Cela signifie qu'à un niveau de signification de 10 %, l'enseignant se trompe sur 30 % des élèves qui regardent le football le samedi après-midi.
Test d'hypothèse avec une distribution normale
Lorsque nous testons la distribution normale, nous testons la moyenne en faisant de notre paramètre de population la moyenne, que nous désignons par . Pour ce faire, nous examinons la moyenne d'un échantillon prélevé dans la distribution normale de taille n. Si nous avons une variable aléatoire X, et , et qu'un échantillon aléatoire de taille n est prélevé à partir de cette variable, alors la moyenne de l'échantillon, , est normalement distribuée avec . Nous utilisons alors la distribution de la moyenne de l'échantillon pour déterminer si la moyenne de l'échantillon est statistiquement significative.
Le processus de réalisation d'un test d'hypothèse à l'aide d'une distribution normale est le même que si l'on utilisait une distribution binomiale, mais avec un paramètre de population différent.
Nous pouvons également trouver la région / valeur critique pour la distribution normale en normalisant la statistique du test. Si , alors est une variable aléatoire normalement distribuée avec . Il serait également possible de trouver les valeurs / régions critiques en utilisant la distribution normale inverse, enregistrée sur ta calculatrice.
Une entreprise vend des sacs de pommes de terre. La masse des sacs de pommes de terre est normalement distribuée, avec un écart type de 4 kg. L'entreprise affirme que la masse moyenne des sacs de pommes de terre est de 100 kg. Un inspecteur prélève un échantillon de 25 sacs de pommes de terre et constate que le poids moyen est de 106,4 kg. En utilisant un niveau de signification de 5 %, existe-t-il des preuves montrant que la masse moyenne des sacs de pommes de terre est supérieure à 100 kg ?
Soit X la masse d'un sac de pommes de terre et la masse moyenne d'un sac de pommes de terre.
Si l'on suppose l'hypothèse nulle, alors , ce qui signifie que .
. Cela signifie qu'il n'y a pas suffisamment de preuves pour rejeter .
Cela signifie qu'il n'est pas significatif au niveau de 5 % que la masse moyenne des sacs de pommes de terre soit supérieure à 100 kg.
Un échantillon aléatoire de taille n est prélevé dans une population qui est distribuée normalement avec une moyenne et un écart type . Trouve la région critique pour la statistique du test si nous avons :
Ainsi, d'après , nous avons , ce qui signifie que pour notre échantillon, la moyenne est .
Nous souhaitons trouver . Nous pouvons convertir cette moyenne d'échantillon en distribution normale standard en utilisant . Alors implique que .
Cela signifie que donne le point critique, ce qui donne , ce qui signifie que notre région critique est la suivante
Test d'hypothèse corrélation
Lorsque l'on teste la corrélation, on cherche à savoir si l'on peut conclure statistiquement qu'il existe une corrélation entre deux variables. La corrélation (plus précisément le coefficient de corrélation du moment produit (CCMP)) est une échelle mobile, 1 signifiant une forte corrélation positive, 0 signifiant aucune corrélation et -1 signifiant une forte corrélation négative. Nous désignons r comme le PMCC pour un échantillon et comme le PMCC pour une population entière.
Dans un test bilatéral, nous déterminons s'il y a suffisamment de preuves dans l'échantillon pour conclure que la corrélation de la population est non nulle, ce qui signifie que nous prenons et . Dans un test unilatéral, nous déterminons si un échantillon a suffisamment de preuves pour conclure que la population a une corrélation positive ou négative. Ainsi, nous prenons à nouveau , mais nous prenons .
Nous pouvons trouver la région critique pour r à l'aide de tableaux statistiques (ceux-ci te sont donnés lors d'un examen) ainsi que d'un livret de formules.
Un enseignant pense qu'il existe une corrélation entre la taille des chaussures et la taille. Il prend un échantillon de 50 élèves et trouve une corrélation dans l'échantillon de 0,34. Y a-t-il suffisamment de preuves pour conclure qu'il existe une corrélation positive dans la population à un niveau de signification de 1 % ?
Grâce aux tableaux, la valeur critique est r = 0,3281, et 0,34> 0,3281, ce qui signifie que notre valeur r tombe dans la région critique. Nous pouvons rejeter l'hypothèse nulle en faveur de l'alternative. Il y a donc suffisamment de preuves pour signaler que l'échantillon suggère une corrélation positive entre la taille des chaussures et la taille.
Tests d'hypothèses - Principaux enseignements
Un test d'hypothèse teste un échantillon ou une expérience par rapport au paramètre de population et vise à voir s'il existe une différence statistiquement significative entre les résultats.
Un test d'hypothèse binomial teste la probabilité d'événements, avec le paramètre de population p.
Un test d'hypothèse normal teste la moyenne d'une population, avec les paramètres de la population.
Un test d'hypothèse de corrélation teste s'il existe une corrélation significative avec le paramètre de la population.
Apprends plus vite avec les 0 fiches sur Test d'hypothèse
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Test d'hypothèse
Qu'est-ce qu'un test d'hypothèse en mathématiques ?
Un test d'hypothèse en mathématiques est une méthode statistique utilisée pour vérifier si une hypothèse sur un paramètre de population est supportée par des données échantillons.
Quelle est la différence entre H0 et H1 ?
H0 est l'hypothèse nulle, supposant aucune variation, tandis que H1 est l'hypothèse alternative, suggérant une variation ou une différence.
Qu'est-ce qu'un p-value ?
Un p-value est la probabilité d'obtenir un résultat au moins aussi extrême que celui observé, supposant que l'hypothèse nulle est vraie.
Quand rejeter l'hypothèse nulle ?
On rejette l'hypothèse nulle si le p-value est inférieur au niveau de signification choisi, souvent 0,05.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.