Variables sur un graphique en nuage de points
Chaque point d'un graphique en nuage de points a des coordonnées (x, y) qui correspondent aux valeurs des deux variables. S'il existe un lien entre ces ensembles de données, une droite de régression est tracée pour donner une représentation visuelle de la relation entre eux. La relation entre ces ensembles de données est appelée « corrélation ».
Les variables d'un graphique en nuage de points sont soit indépendantes, soit dépendantes. La variable indépendante n'est influencée par rien et est souvent représentée sur l'axe des x, tandis que la variable dépendante est affectée (éventuellement) par la variable indépendante et est représentée sur l'axe des y.
Le graphique en nuage de points ci-dessous montre la relation entre les notes que les élèves obtiennent en mathématiques et en physique-chimie. Chaque point a une coordonnée x qui représente leurs résultats en mathématiques et une coordonnée y qui représente leurs résultats en physique.

Graphique en nuage de points montrant la relation entre les notes en physique chimie (sur l'axe des y) et en mathématiques (sur l'axe des x)
Qu'est-ce que la corrélation dans les graphiques en nuage de points ?
La corrélation est la relation entre deux ensembles de données ou variables, que nous cherchons à déterminer en dessinant un graphique en nuage de points. Elle est liée au coefficient de corrélation r, qui mesure la force et la direction de la relation linéaire entre les deux variables.
Il est important de comprendre que les corrélations n'existent que lorsqu'il y a un lien entre deux variables.
Les trois types de situations de corrélation sont les suivants :
Corrélation positive
Une corrélation positive, c'est quand une variable augmente, alors l'autre variable augmentera aussi. Les diagrammes en nuage de points avec une corrélation positive ont une droite de régression avec une pente positive. Une corrélation positive parfaite est exprimée par +1 et cela signifie que les deux variables évoluent toujours dans les mêmes directions et proportions.
Plus tu passes de temps à faire de l'exercice, plus tu brûles de calories.

Illustration d'un graphique en nuage de points avec une corrélation positive
Corrélation négative
Une corrélation négative, c'est quand une variable diminue, alors l'autre augmente. Les graphiques en nuage de points avec une corrélation négative ont une droite de régression avec une pente négative. Une corrélation négative parfaite est exprimée par -1 et cela signifie que les deux variables comparées évolueront toujours dans des directions opposées.
Plus une personne passe de temps à pratiquer les mathématiques, moins elle sera désorientée par ses sujets.

Illustration d'un graphique en nuage de points avec une corrélation négative
Corrélation nulle
Il n'y a pas de corrélation lorsqu'il n'existe pas de relation claire entre deux variables. L'absence de corrélation est exprimée par un coefficient de corrélation de 0.
Plus tu bois de thé, plus tu as de connaissances sur les graphiques en nuage de points.

Graphique en nuage de points sans corrélation
Force de la corrélation
La force de la corrélation dépend de la proximité des points de données, de leur évolution dans une direction positive ou négative et de la valeur du coefficient de corrélation (r). Ces corrélations sont décrites comme suit :
Corrélation forte
On parle de corrélation forte lorsque les points de données du graphique sont étroitement alignés les uns par rapport aux autres. Un coefficient de corrélation positif fort a des valeurs plus proches de +1, tandis qu'un r négatif fort a des valeurs plus proches de -1.

Graphique en nuage de points avec une forte corrélation négative
Corrélation faible ou modérée
On parle de corrélation faible ou modérée lorsque les points de données du graphique sont plus dispersés. Les coefficients de corrélation faibles ont des valeurs plus proches de 0.

Graphique en nuage de points avec une corrélation positive faible
Ajustement affine
L'ajustement affine ou la droite de régression linéaire une droite tracée à travers un graphique en nuage de points pour exprimer la corrélation des données. Elle donne un aperçu de la relation entre les deux variables et te permet de faire des prédictions sur les futurs points de données. Elle doit être tracée de manière à passer par le milieu des points du graphique, avec un nombre égal de points de chaque côté de la ligne.

Illustration d'une droite de régression sur un graphique en nuage de points
Représenter un graphique en nuage de points
Il faut considérer les éléments suivants pour faire un graphique en nuage de points : corrélation, force et valeurs aberrantes.
Les valeurs aberrantes sont des points sur le graphique en nuage de points qui ne correspondent pas au modèle de l'ensemble de données. Le graphique ci-dessous montre un exemple de valeurs aberrantes sur un graphique en nuage de points (points rouges).

Illustration de valeurs aberrantes sur un graphique en nuage de points
Un graphique en nuage de points se construit en suivant les étapes suivantes :
Étape 1 : Décide des deux variables que tu vas comparer.
Étape 2 : Collecte et tabule les données de ces variables. La variable x / indépendante sera tabulée dans la deuxième ligne et tes variables y / dépendantes seront dans la troisième.
Étape 3 : Utilise tes données collectées pour tracer les points.
Étape 4 : Trace ta ligne de régression.
Nuage de points : Exemple
Le graphique en nuage de points suivant montre la relation entre le nombre d'heures qu'un élève passe à étudier les mathématiques (sur l'axe des x) et les notes qu'il obtient (sur l'axe des y).

Exemple de graphique en nuage de points illustrant la relation entre les heures d'étude et les notes
Ce graphique en nuage de points peut être interprété de la façon suivante : La direction des points indique une corrélation positive, ce qui signifie que plus un élève étudie d'heures, plus ses notes sont élevées. Les points sont étroitement alignés, ce qui indique une forte corrélation où les élèves sont susceptibles de toujours obtenir de meilleures notes lorsqu'ils étudient davantage. Enfin, il est composé de valeurs aberrantes qui peuvent être dues à la compréhension naturelle des élèves, à leur motivation ou à leur intérêt général pour le sujet, c'est-à-dire que certains élèves obtiendront toujours des notes inférieures lorsqu'ils assistent à plus de cours parce qu'ils n'aiment pas les maths.
Point moyen
Le point moyen d'un diagramme de dispersion est le point représenté par la lettre G, dont les coordonnées sont les moyennes arithmétiques des abscisses et des ordonnées des points M1 (x1 ; y1), M2 (x2 ; y2), ... , Mn (xn ; yn).
Voici la formule pour le point moyen :
Nuage de points - Points clés
- Un graphique en nuage de points peut présenter une corrélation positive, négative ou nulle.
- Un coefficient de corrélation positif fort a des valeurs plus proches de +1, tandis qu'un r négatif fort a des valeurs plus proches de -1.
- Une corrélation faible ou modérée existe lorsque les points de données du graphique en nuage de points sont plus dispersés. Les coefficients de corrélation faibles ont des valeurs plus proches de 0.
- L'ajustement affine ou droite de régression est une droite tracée à travers un graphique en nuage de points pour exprimer la corrélation des données.
- Les graphiques en nuage de points sont représentés à l'aide des informations suivantes : corrélation, force et valeurs aberrantes.
- Le point moyen d'un diagramme de dispersion est le point représenté par la lettre G, dont les coordonnées sont les moyennes arithmétiques des abscisses et des ordonnées des points M1 (x1 ; y1), M2 (x2 ; y2), ... , Mn (xn ; yn).
Comment tu t'assures que ton contenu est précis et digne de confiance ?
Chez StudySmarter, tu as créé une plateforme d'apprentissage qui sert des millions d'étudiants. Rencontre les personnes qui travaillent dur pour fournir un contenu basé sur des faits et pour veiller à ce qu'il soit vérifié.
Processus de création de contenu :
Lily Hulatt est une spécialiste du contenu numérique avec plus de trois ans d’expérience en stratégie de contenu et en conception de programmes. Elle a obtenu son doctorat en littérature anglaise à l’Université de Durham en 2022, a enseigné au Département d’études anglaises de l’Université de Durham, et a contribué à plusieurs publications. Lily se spécialise en littérature anglaise, langue anglaise, histoire et philosophie.
Fais connaissance avec Lily
Processus de contrôle de la qualité du contenu:
Gabriel Freitas est un ingénieur en intelligence artificielle possédant une solide expérience en développement logiciel, en algorithmes d’apprentissage automatique et en IA générative, notamment dans les applications des grands modèles de langage (LLM). Diplômé en génie électrique de l’Université de São Paulo, il poursuit actuellement une maîtrise en génie informatique à l’Université de Campinas, avec une spécialisation en apprentissage automatique. Gabriel a un solide bagage en ingénierie logicielle et a travaillé sur des projets impliquant la vision par ordinateur, l’IA embarquée et les applications LLM.
Fais connaissance avec Gabriel