Si tu devais raconter à un ami une histoire précise sur un événement qui s'est produit pendant le week-end, tu ne commencerais probablement pas par les informations les plus pertinentes. Au lieu de cela, tu commencerais à décrire le cadre et les personnes qui s'y trouvent et, en général, tu proposerais un peu de contexte. C'est à cela que servent les statistiques descriptives. Les statistiques descriptives décrivent les données brutes et constituent généralement la première étape du processus d'analyse des données.
Nous commencerons par apprendre la définition des statistiques descriptives.
Ensuite, nous nous pencherons sur les statistiques descriptives en psychologie et nous aborderons quelques exemples de statistiques descriptives.
Ensuite, nous examinerons certaines analyses statistiques descriptives utilisées en psychologie.
Enfin, tu apprendras la différence entre les statistiques descriptives et les statistiques inférentielles.
Définition des statistiques descriptives
Les statistiques descriptives permettent aux chercheurs de créer un résumé préliminaire des données brutes. C'est pourquoi on les appelle aussi statistiques sommaires. Les statistiques descriptives constituent la première étape de l'analyse des données et fournissent des informations précieuses pour choisir le bon test statistique.
Les statistiques descriptives sont une forme d'analyse statistique utilisée pour résumer un ensemble de données.
Comme tu peux probablement le déduire de son nom, les statistiques descriptives décrivent les principaux aspects des données. Elles sont utiles car elles fournissent aux chercheurs des informations sur les relations potentielles entre les variables et des informations sur les tests statistiques qui seraient appropriés pour tester l'hypothèse proposée.
Cependant, les chercheurs ne concluent pas à partir des statistiques descriptives. Pour aller au-delà de la description et déduire les résultats, les chercheurs utilisent des statistiques inférentielles.
Les statistiques descriptives décrivent les données brutes, et les statistiques déductives font des prédictions sur une population plus large.
Statistiques descriptives : Psychologie
Les statistiques descriptives sont généralement présentées sous forme de graphiques, que ce soit dans des tableaux, des distributions de fréquences, des histogrammes ou des diagrammes à barres.
En général, les statistiques descriptives sont utilisées dans la recherche en psychologie pour résumer les ensembles de données.
Cependant, les statistiques descriptives ne peuvent pas être utilisées pour faire des déductions ou des généralisations sur des populations plus larges.
Analyse statistique descriptive : Mesures de la distribution des fréquences
La distribution des fréquences décrit le nombre d'observations pour une valeur variable possible. Ces informations sont souvent affichées dans des tableaux de fréquence.
Imagine une étude portant sur la relation entre deux variables : la couleur des cheveux et la nationalité. Un tableau de fréquence ressemblerait à ceci :
Couleur des cheveux
Fréquence
Nationalité
Fréquence
Noirs
7
Irlandais
5
Marron
6
Angleterre
15
Blonde
14
Pays de Galles
5
Ginger
3
Écosse
5
Total de l'échantillon
30
Échantillon total
30
À partir d'un tel tableau, les chercheurs peuvent affirmer que 14 personnes de l'échantillon étaient blondes et que 5 étaient irlandaises.
Analyse statistique descriptive : Mesures de la tendance centrale
Il existe de nombreux tests statistiques différents utilisés pour mesurer la tendance centrale. Les mesures de la tendance centrale donnent une valeur unique qui est une moyenne de l'ensemble des données, ce qui est avantageux pour les grands ensembles de données. Les trois tests les plus couramment utilisés sont : la moyenne, la médiane et le mode.
Moyenne : additionner toutes les valeurs et diviser par le nombre total de valeurs.
Médiane : placer les valeurs de l'ensemble de données dans l'ordre numérique et identifier le chiffre du milieu.
Mode : valeur la plus courante dans l'ensemble des données.
Prenons un exemple pour comprendre la tendance centrale. Imagine une étude portant sur la relation entre les résultats aux examens et le temps de révision.
Les données brutes de 10 participants peuvent ressembler à ceci :
Numéro du participant
Temps de révision (en heures)
1
6
2
3
3
7
4
5
5
6
6
9
7
5
8
6
9
6
10
4
La moyenne (M) est le nombre que l'on obtient en additionnant toutes les valeurs et en les divisant par le nombre total. Dans cet exemple, le nombre moyen d'heures d'études de l'échantillon est le suivant :
Lorsque l'on rapporte plus d'une moyenne, on l'écrit de la façon suivante : Le score moyen du temps de révision chez les étudiants en médecine est plus élevé(M = 8,7) que chez les étudiants en philosophie(M = 5,6).
Pour trouver la médiane, il faut placer les nombres dans l'ordre numérique séquentiel, et la médiane est le nombre du milieu. Dans ce cas, il s'agit de :
3, 4, 5, 5, 6, 6, 6, 6, 7, 9. Dans cet exemple, la médiane est 6
Le mode fait référence au score le plus populaire dans les données, qui dans cet exemple est six parce qu'il reflète les données de 4 participants.
Exemples de statistiques descriptives : Mesures de variabilité ou de dispersion
Les mesures de variabilité ont pour but de décrire l'ampleur des différences au sein de l'ensemble des données. C'est en quelque sorte le contraire de la tendance centrale.
Il existe quatre types de mesures de la variabilité :
L'étendue : la valeur la plus élevée moins la valeur la plus faible.
L'écart interquartile : la différence entre la valeur médiane calculée dans la seconde moitié et la première moitié d'un ensemble de données.
Écart-type (sd) : la distance moyenne d'un point de données par rapport à la moyenne.
Variance : mesure également la distance moyenne d'un point de données par rapport à la moyenne, mais elle est calculée différemment.
Reprenons l'exemple ci-dessus.
Nombre de participants (N)
Temps révisé (en heures)
1
6
2
3
3
7
4
5
5
6
6
9
7
5
8
6
9
6
10
4
L'intervalle serait la note la plus élevée, 9, moins la note la plus basse, 3. Par conséquent, l'intervalle dans cet exemple est 9 - 3 = 6.
L'écart interquartile est la différence entre les valeurs médianes calculées dans la première moitié et la seconde moitié d'un ensemble de données. La première moitié de l'ensemble de données serait 3, 4, 5, 5 et 6, tandis que la seconde serait 6, 6, 6, 7 et 9. La médiane de la première moitié est 5, et la médiane de la seconde moitié est 6. Par conséquent, l'écart interquartile est 6 - 5 = 1.
L'écart type et la variance sont légèrement plus complexes à calculer ; ils mesurent la distance d'un point de données donné par rapport à la moyenne.
Une variance ou un écart-type faible suggère que les scores ne varient pas trop par rapport à la moyenne. Au contraire, une variance ou un écart type élevé indique que les données sont très éloignées de la moyenne.
Lors de la rédaction de rapports de psychologie, la moyenne et l'écart-type sont les statistiques descriptives les plus couramment rapportées.
Exemples de statistiques descriptives : Mesures de position
Une mesure de position identifie la position d'une valeur donnée par rapport aux autres valeurs. Les quartiles et les centiles sont utilisés pour mesurer la position.
Les centiles, par exemple, divisent les données en quatre catégories : le25e, le 50e et le 75e centile. Lors du calcul des percentiles, les valeurs doivent être placées dans l'ordre croissant. De cette façon, les chercheurs peuvent établir quels scores sont associés aux différents centiles.
Les quantiles sont mesurés en classant numériquement les valeurs par ordre croissant. Les quantiles séparent les populations/échantillons en intervalles de tailles égales ; cela permet d'identifier le classement de points de données spécifiques.
Ces données fournissent des informations sur la distribution des données, ce qui est crucial pour les analyses statistiques ultérieures. Si les données sont asymétriques, des tests non paramétriques peuvent être utilisés pour l'analyse statistique.
Statistiques descriptives et inférentielles
Comme tu l'as appris, les statistiques descriptives offrent des informations sur un ensemble de données spécifique. Et bien qu'elles soient utiles, les psychologues ont également besoin d'autres tests statistiques pour tirer des conclusions. Pour cela, les psychologues utilisent des statistiques inférentielles. Celles-ci sont basées sur les probabilités et permettent aux chercheurs de tester des hypothèses et de tirer des conclusions sur les populations.
Prenons l'exemple de l'étude des taux de consommation de crème glacée tout au long de l'année. Les statistiques descriptives peuvent suggérer que l'on consomme plus de glaces en juillet qu'en janvier. Et bien qu'il soit tentant de conclure que la consommation de crème glacée est plus faible en janvier qu'en juillet, cela ne serait pas exact.
Pour faire une telle déclaration, il faudrait vérifier s'il existe une différence significative entre les moyennes de consommation de crème glacée des deux mois. Et cela ne peut être réalisé qu'à l'aide de statistiques inférentielles.
Les statistiques descriptives sont une forme d'analyse statistique utilisée pour résumer un ensemble de données.
Il existe quatre principaux types de statistiques descriptives : les mesures de fréquence, la tendance centrale, la variabilité ou la dispersion, et les mesures de position.
Les statistiques descriptives les plus courantes sont la moyenne et l'étendue.
Les statistiques descriptives et inférentielles ont des utilisations différentes, par exemple, les premières sont utilisées pour résumer les données et les secondes pour faire des déductions.
Apprends plus vite avec les 6 fiches sur Statistiques descriptives
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Statistiques descriptives
Qu'est-ce que les statistiques descriptives en psychologie?
Les statistiques descriptives en psychologie permettent de résumer et d'organiser des données pour identifier des tendances générales et des motifs.
Quels sont les principaux outils des statistiques descriptives?
Les principaux outils sont les moyennes, les modes, les médianes, les écarts-types et les graphiques (histogrammes, boîtes à moustaches).
Pourquoi utiliser des statistiques descriptives?
On utilise des statistiques descriptives pour simplifier et comprendre les données, facilitant ainsi la communication des résultats et la prise de décision.
Quelle est la différence entre statistiques descriptives et inférentielles?
Les statistiques descriptives résument les données d'un échantillon, tandis que les statistiques inférentielles tirent des conclusions sur une population à partir d'un échantillon.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.