Variables sur un graphique en nuage de points
Chaque point d'un graphique en nuage de points a des coordonnées (x, y) qui correspondent aux valeurs des deux variables. S'il existe un lien entre ces ensembles de données, une droite de régression est tracée pour donner une représentation visuelle de la relation entre eux. La relation entre ces ensembles de données est appelée « corrélation ».
Les variables d'un graphique en nuage de points sont soit indépendantes, soit dépendantes. La variable indépendante n'est influencée par rien et est souvent représentée sur l'axe des x, tandis que la variable dépendante est affectée (éventuellement) par la variable indépendante et est représentée sur l'axe des y.
Le graphique en nuage de points ci-dessous montre la relation entre les notes que les élèves obtiennent en mathématiques et en physique-chimie. Chaque point a une coordonnée x qui représente leurs résultats en mathématiques et une coordonnée y qui représente leurs résultats en physique.
Graphique en nuage de points montrant la relation entre les notes en physique chimie (sur l'axe des y) et en mathématiques (sur l'axe des x)
Qu'est-ce que la corrélation dans les graphiques en nuage de points ?
La corrélation est la relation entre deux ensembles de données ou variables, que nous cherchons à déterminer en dessinant un graphique en nuage de points. Elle est liée au coefficient de corrélation r, qui mesure la force et la direction de la relation linéaire entre les deux variables.
Il est important de comprendre que les corrélations n'existent que lorsqu'il y a un lien entre deux variables.
Les trois types de situations de corrélation sont les suivants :
Corrélation positive
Une corrélation positive, c'est quand une variable augmente, alors l'autre variable augmentera aussi. Les diagrammes en nuage de points avec une corrélation positive ont une droite de régression avec une pente positive. Une corrélation positive parfaite est exprimée par +1 et cela signifie que les deux variables évoluent toujours dans les mêmes directions et proportions.
Plus tu passes de temps à faire de l'exercice, plus tu brûles de calories.
Illustration d'un graphique en nuage de points avec une corrélation positive
Corrélation négative
Une corrélation négative, c'est quand une variable diminue, alors l'autre augmente. Les graphiques en nuage de points avec une corrélation négative ont une droite de régression avec une pente négative. Une corrélation négative parfaite est exprimée par -1 et cela signifie que les deux variables comparées évolueront toujours dans des directions opposées.
Plus une personne passe de temps à pratiquer les mathématiques, moins elle sera désorientée par ses sujets.
Illustration d'un graphique en nuage de points avec une corrélation négative
Corrélation nulle
Il n'y a pas de corrélation lorsqu'il n'existe pas de relation claire entre deux variables. L'absence de corrélation est exprimée par un coefficient de corrélation de 0.
Plus tu bois de thé, plus tu as de connaissances sur les graphiques en nuage de points.
Graphique en nuage de points sans corrélation
Force de la corrélation
La force de la corrélation dépend de la proximité des points de données, de leur évolution dans une direction positive ou négative et de la valeur du coefficient de corrélation (r). Ces corrélations sont décrites comme suit :
Corrélation forte
On parle de corrélation forte lorsque les points de données du graphique sont étroitement alignés les uns par rapport aux autres. Un coefficient de corrélation positif fort a des valeurs plus proches de +1, tandis qu'un r négatif fort a des valeurs plus proches de -1.
Graphique en nuage de points avec une forte corrélation négative
Corrélation faible ou modérée
On parle de corrélation faible ou modérée lorsque les points de données du graphique sont plus dispersés. Les coefficients de corrélation faibles ont des valeurs plus proches de 0.
Graphique en nuage de points avec une corrélation positive faible
Ajustement affine
L'ajustement affine ou la droite de régression linéaire une droite tracée à travers un graphique en nuage de points pour exprimer la corrélation des données. Elle donne un aperçu de la relation entre les deux variables et te permet de faire des prédictions sur les futurs points de données. Elle doit être tracée de manière à passer par le milieu des points du graphique, avec un nombre égal de points de chaque côté de la ligne.
Illustration d'une droite de régression sur un graphique en nuage de points
Représenter un graphique en nuage de points
Il faut considérer les éléments suivants pour faire un graphique en nuage de points : corrélation, force et valeurs aberrantes.
Les valeurs aberrantes sont des points sur le graphique en nuage de points qui ne correspondent pas au modèle de l'ensemble de données. Le graphique ci-dessous montre un exemple de valeurs aberrantes sur un graphique en nuage de points (points rouges).
Illustration de valeurs aberrantes sur un graphique en nuage de points
Un graphique en nuage de points se construit en suivant les étapes suivantes :
Étape 1 : Décide des deux variables que tu vas comparer.
Étape 2 : Collecte et tabule les données de ces variables. La variable x / indépendante sera tabulée dans la deuxième ligne et tes variables y / dépendantes seront dans la troisième.
Étape 3 : Utilise tes données collectées pour tracer les points.
Étape 4 : Trace ta ligne de régression.
Nuage de points : Exemple
Le graphique en nuage de points suivant montre la relation entre le nombre d'heures qu'un élève passe à étudier les mathématiques (sur l'axe des x) et les notes qu'il obtient (sur l'axe des y).
Exemple de graphique en nuage de points illustrant la relation entre les heures d'étude et les notes
Ce graphique en nuage de points peut être interprété de la façon suivante : La direction des points indique une corrélation positive, ce qui signifie que plus un élève étudie d'heures, plus ses notes sont élevées. Les points sont étroitement alignés, ce qui indique une forte corrélation où les élèves sont susceptibles de toujours obtenir de meilleures notes lorsqu'ils étudient davantage. Enfin, il est composé de valeurs aberrantes qui peuvent être dues à la compréhension naturelle des élèves, à leur motivation ou à leur intérêt général pour le sujet, c'est-à-dire que certains élèves obtiendront toujours des notes inférieures lorsqu'ils assistent à plus de cours parce qu'ils n'aiment pas les maths.
Point moyen
Le point moyen d'un diagramme de dispersion est le point représenté par la lettre G, dont les coordonnées sont les moyennes arithmétiques des abscisses et des ordonnées des points M1 (x1 ; y1), M2 (x2 ; y2), ... , Mn (xn ; yn).
Voici la formule pour le point moyen :
Nuage de points - Points clés
- Un graphique en nuage de points peut présenter une corrélation positive, négative ou nulle.
- Un coefficient de corrélation positif fort a des valeurs plus proches de +1, tandis qu'un r négatif fort a des valeurs plus proches de -1.
- Une corrélation faible ou modérée existe lorsque les points de données du graphique en nuage de points sont plus dispersés. Les coefficients de corrélation faibles ont des valeurs plus proches de 0.
- L'ajustement affine ou droite de régression est une droite tracée à travers un graphique en nuage de points pour exprimer la corrélation des données.
- Les graphiques en nuage de points sont représentés à l'aide des informations suivantes : corrélation, force et valeurs aberrantes.
- Le point moyen d'un diagramme de dispersion est le point représenté par la lettre G, dont les coordonnées sont les moyennes arithmétiques des abscisses et des ordonnées des points M1 (x1 ; y1), M2 (x2 ; y2), ... , Mn (xn ; yn).
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Get to know Lily
Content Quality Monitored by:
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
Get to know Gabriel