Ta vie est faite de contraintes qui pèsent sur ton temps. L'heure à laquelle tu vas travailler, le temps que tu consacres à tes études et la quantité de sommeil dont tu as besoin sont autant d'exemples de contraintes qui te sont imposées. Tu peux évaluer ta liberté en fonction du nombre de contraintes qui te sont imposées.
Enstatistiquesa>, ilyaaussidescontraintes. Lestestsduchicarréutilisentlesdegrésdelibertépourdécrirelalibertéd'untestenfonctiondescontraintesquiluisontimposées. Liscequisuitpourdécouvriràquelpointletest du khi-deuxa> estvraimentlibre !
Signification des degrés de liberté
De nombreux tests utilisent des degrés de liberté, mais ici, tu verras les degrés de liberté en rapport avec les tests du khi-deux. En général, les degrés de liberté permettent de mesurer le nombre de statistiques de test que tu as calculées à partir des données. Plus tu as calculé de statistiques de test à partir de ton échantillon, moins tu as de liberté pour faire des choix avec tes données. Bien sûr, il existe aussi une façon plus formelle de décrire ces contraintes.
Une contrainte, également appelée restriction, est une exigence imposée aux données par le modèle des données.
Prenons un exemple pour voir ce que cela signifie en pratique.
Supposons que tu fasses une expérience dans laquelle tu lances un dé à quatre faces \(200\) fois. La taille de l'échantillon est donc de \(n=200\). Une contrainte est que ton expérience nécessite que la taille de l'échantillon soit égale à \(200\).
Le nombre de contraintes dépend également du nombre de paramètres dont tu as besoin pour décrire une distribution, et du fait que tu connaisses ou non ces paramètres.
Voyons maintenant comment les contraintes sont liées aux degrés de liberté.
Formule des degrés de liberté
Dans la plupart des cas, la formule
degrés de liberté = nombre de fréquences observées - nombre de contraintes
peut être utilisée. Si tu reviens à l'exemple du dé à quatre faces ci-dessus, il y avait une contrainte. Le nombre de fréquences observées est \(4\) (le nombre de faces du dé). Les degrés de liberté seraient donc \(4-1 = 3\).
Il existe une formule plus générale pour les degrés de liberté :
degrés de liberté = nombre de cellules (après combinaison) - nombre de contraintes.
Tu te demandes sans doute ce qu'est une cellule et pourquoi tu pourrais la combiner. Prenons un exemple.
Tu envoies un sondage à \(200\) personnes pour leur demander combien d'animaux de compagnie ils ont. Tu reçois le tableau de réponses suivant.
Tableau 1. Réponses à l'enquête sur la possession d'animaux de compagnie.
Animaux
\(0\)
\(1\)
\(2\)
\(3\)
\(4\)
\(>4\)
Attendu
\(60\)
\(72\)
\(31\)
\(20\)
\(7\)
\(10\)
Cependant, le modèle que tu utilises n'est qu'une bonne approximation si aucune des valeurs attendues n'est inférieure à \(15\). Tu peux donc combiner les deux dernières colonnes de données (appelées cellules) dans le tableau ci-dessous.
Tableau 2. Réponses à l'enquête sur la possession d'animaux de compagnie avec des cellules combinées.
Animaux
\(0\)
\(1\)
\(2\)
\(3\)
\(>3\)
Attendu
\(60\)
\(72\)
\(31\)
\(20\)
\(17\)
Il y a donc 5 cellules et une contrainte (le total des valeurs attendues est de 200). Les degrés de liberté sont donc \(5 - 1= 4\).
En général, tu ne combineras que des cellules contiguës dans tes tableaux de données. Ensuite, voyons la définition officielle des degrés de liberté avec la distribution du Khi-deux.
Définition des degrés de liberté
Si tu as une variable aléatoire \(X\) et que tu veux faire une approximation de la statistique \(X^2\), tu utiliseras la famille de distributions \(\chi^2\). Cela s'écrit comme suit
où \(O_t\) est la fréquence observée, \(E_t\) est la fréquence attendue, et \(N\) est le nombre total d'observations. N'oublie pas que les tests du Khi-deux ne sont qu'une bonne approximation si aucune des fréquences attendues n'est inférieure à \(5\).
Pour un rappel sur ce test et la façon de l'utiliser, voir Tests du chi carré.
Les distributions \(\chi^2\) sont en fait une famille de distributions qui dépendent des degrés de liberté. Les degrés de liberté pour ce type de distribution sont écrits à l'aide de la variable \(\nu\). Comme tu peux avoir besoin de combiner des cellules lorsque tu utilises les distributions \(\chi^2\), tu dois utiliser la définition ci-dessous.
Pour la distribution \(\chi^2\), le nombre de degrés de liberté, \(\nu\) est donné par
\[ \nu = \text{nombre de cellules après combinaison}-1.\n]
Il y aura des cas où les cellules ne seront pas combinées, et dans ce cas, tu peux simplifier un peu les choses. Si tu reviens à l'exemple du dé à quatre faces, il y a \(4\) possibilités qui peuvent apparaître sur le dé, et ce sont les valeurs attendues. Donc, pour cet exemple, \(\nu = 4 - 1 = 3\n) même si tu utilises une distribution du Khi-deux pour la modéliser.
Pour être sûr de savoir combien de degrés de liberté tu as lorsque tu utilises la distribution du Khi-deux, on l'écrit en indice : \(\chi^2_\nu \N).
Tableau des degrés de liberté
Une fois que tu sais que tu utilises une distribution du Khi-deux avec \(\nu\) degrés de liberté, tu dois utiliser une table de degrés de liberté pour pouvoir effectuer des tests d'hypothèse. Voici une section d'une table du Khi-deux.
Tableau 3. Tableau du khi-deux.
degrés de liberté
\(0.99\)
\(0.95\)
\(0.9\)
\(0.1\)
\(0.05\)
\(0.01\)
\(2\)
\(0.020\)
\(0.103\)
\(0.211\)
\(4.605\)
\(5.991\)
\(9.210\)
\(3\)
\(0.155\)
\(0.352\)
\(0.584\)
\(6.251\)
\(7.815\)
\(11.345\)
\(4\)
\(0.297\)
\(0.711\)
\(1.064\)
\(7.779\)
\(9.488\)
\(13.277\)
La première colonne du tableau contient les degrés de liberté, et la première ligne du tableau sont les zones à droite de la valeur critique.
La notation pour une valeur critique de \(\chi^2_\nu\) qui est dépassée avec une probabilité de \(a\%\) est \(\chi^2_\nu(a\%)\) ou \ (\chi^2_\nu(a/100)\).
Prenons un exemple en utilisant le tableau du Khi-deux.
Trouve la valeur critique de \(\chi^2_3(0,01)\).
Solution :
La notation de \(\chi^2_3(0,01)\) indique qu'il y a \(3\) degrés de liberté et que tu es intéressé par la colonne \(0,01\) du tableau. En regardant l'intersection de la ligne et de la colonne dans le tableau ci-dessus, tu obtiens \(11,345\). Donc
\N- [\Nchi^2_3(0,01) = 11,345 . \N]
Le tableau a une deuxième utilité, comme le montre l'exemple suivant.
Trouve la plus petite valeur de \(y\) telle que \(P(\chi^2_3 > y) = 0,95\).
Solution :
Rappelle-toi que le niveau de signification est la probabilité que la distribution dépasse la valeur critique. Par conséquent, demander la plus petite valeur \(y\N) où \N (P(\chi^2_3 > y) = 0,95\N) revient à demander ce qu'est \N(\chi^2_3(0,95)\N). En utilisant le tableau du Khi-deux, tu peux voir que \N(\chi^2_3(0,95) =0,352 \N), donc \N(y=0,352 \N).
Bien sûr, un tableau ne peut pas énumérer toutes les valeurs possibles. Si tu as besoin d'une valeur qui ne figure pas dans le tableau, il existe de nombreux logiciels de statistiques ou calculatrices qui peuvent te donner les valeurs du tableau du Khi-deux.
Test t des degrés de liberté
Les degrés de liberté d'un test t sont calculés en fonction de l'utilisation ou non d'échantillons appariés. Pour plus d'informations sur ces sujets, consulte les articles Distribution en T et Test t par paires.
Degrés de liberté - Points clés
Une contrainte, également appelée restriction, est une exigence imposée aux données par le modèle des données.
Dans la plupart des cas, les degrés de liberté = nombre de fréquences observées - nombre de contraintes.
Une formule plus générale pour les degrés de liberté est : degrés de liberté = nombre de cellules (après combinaison) - nombre de contraintes.
Pour la distribution \(\chi^2\), le nombre de degrés de liberté, \(\nu\) est donné par
\[ \nu = \text{nombre de cellules après combinaison}-1.\n]
Apprends plus vite avec les 12 fiches sur Degrés de liberté
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Degrés de liberté
Qu'est-ce que les degrés de liberté en mathématiques?
Les degrés de liberté sont le nombre de valeurs indépendantes qui peuvent varier dans une analyse statistique.
Comment calculer les degrés de liberté?
Pour une variable, les degrés de liberté sont n-1, où n est le nombre d'observations.
Pourquoi les degrés de liberté sont-ils importants?
Les degrés de liberté déterminent la précision des estimations et les tests statistiques, influençant les intervalles de confiance et les valeurs de p.
Quelle est la signification des degrés de liberté dans un test T?
Dans un test T, les degrés de liberté déterminent la distribution de référence pour évaluer la signification de la différence entre deux moyennes.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.