Les données bivariées sont des données qui ont été collectées dans deux variables, et chaque point de données dans une variable a un point de données correspondant dans l'autre valeur. Nous collectons normalement des données bivariées pour essayer d'étudier la relation entre les deux variables et utiliser ensuite cette relation pour éclairer les décisions futures.
Merci de votre intérêt pour les préférences d’apprentissage !
Merci pour ton intérêt pour les différentes méthodes d’apprentissage ! Quelle méthode préfères-tu ? (par exemple, « Audio », « Vidéo », « Texte », « Pas de préférence »)
(optionnel)
Par exemple, nous pourrions recueillir des données sur la température extérieure par rapport aux ventes de crème glacée, ou nous pourrions étudier la taille par rapport à la pointure des chaussures, ce sont deux exemples de données bivariées. S'il existe une relation montrant qu'une augmentation de la température extérieure augmente les ventes de crème glacée, les magasins pourraient l'utiliser pour acheter plus de crème glacée pour les périodes plus chaudes de l'été.
Comment représenter les données à deux variables ?
Nous utilisons des diagrammes de dispersion pour représenter les données à deux variables. Un graphique de dispersion de données à deux variables est un graphique à deux dimensions avec une variable sur un axe et l'autre variable sur l'autre axe. Nous reportons ensuite les points correspondants sur le graphique. Nous pouvons ensuite tracer une ligne de régression (également connue sous le nom de ligne de meilleur ajustement) et examiner la corrélation des données (dans quelle direction les données vont et à quel point les points de données sont proches de la ligne de meilleur ajustement).
Dessiner un graphique de dispersion
Étape1 : Nous commençons par dessiner un ensemble d'axes et par choisir une échelle appropriée pour les données.Étape 2: Indique sur l'axe des x la variable explicative / indépendante (la variable qui va changer), et sur l'axe des y la réponse / variable dépendante (la variable dont nous pensons qu'elle va changer en raison du changement de la variable indépendante). Étiquette également le graphique lui-même, en décrivant ce qu'il montre. Étape 3 : Place les points de données sur le graphique.Étape 4 : Trace la ligne de meilleur ajustement, si nécessaire.
Voici un ensemble de données mettant en relation la température des jours du mois de juillet, et le nombre de glaces vendues dans un magasin du coin.
Température (° C)
14
16
15
16
23
12
21
22
Ventes de glaces
16
18
14
19
43
12
24
26
Dans ce cas, la température est la variable indépendante et les ventes de crème glacée sont la variable dépendante. Cela signifie que nous traçons la température sur l'axe des x et les ventes de glaces sur l'axe des y. Le graphique obtenu devrait ressembler à ce qui suit.
Graphique des ventes de glaces en fonction de la température - StudySmarter Originals
Les données suivantes représentent le trajet d'une voiture avec le temps et la distance parcourue mesurés à partir du début du trajet :
Temps (en heures)
1
2
3
4
5
6
7
8
Distance (km)
12
17
18
29
35
51
53
60
Dans ce cas, le temps est la variable indépendante et la distance est la variable dépendante. Cela signifie que nous inscrivons le temps sur l'axe des x et la distance sur l'axe des y. Le graphique obtenu devrait ressembler à ce qui suit.
Graphique de la distance en fonction du temps - StudySmarter Originals
Quelle est la signification de la corrélation et de la régression pour les données bivariées ?
La corrélation décrit la relation entre deux variables. Nous décrivons la corrélation sur une échelle mobile allant de -1 à 1. Tout ce qui est négatif est appelé corrélation négative, et une corrélation positive correspond à un nombre positif. Plus la corrélation est proche de chaque extrémité de l'échelle, plus la relation est forte, et plus la corrélation est proche de zéro, plus la relation est faible. Une corrélation nulle signifie qu'il n'y a pas de relation entre les deux variables. La régression consiste à tracer une ligne d'ajustement optimale pour les données. Cette ligne d'ajustement optimal minimise la distance entre les points de données et cette ligne de régression. La corrélation est une mesure de la proximité des données par rapport à notre ligne d'ajustement optimal. Si nous pouvons trouver une forte corrélation entre deux variables, alors nous pouvons établir qu'elles ont une forte relation, ce qui signifie qu'il y a une bonne probabilité qu'une variable influence l'autre.
Données bivariées - Principaux enseignements
Les données bivariées sont la collection de deux ensembles de données, où chaque donnée est jumelée à une autre provenant de l'autre ensemble de données
Nous utilisons un graphique en nuage de points pour montrer les données bivariées.
La corrélation entre les données bivariées montre la force de la relation entre deux variables.
Comment tu t'assures que ton contenu est précis et digne de confiance ?
Chez StudySmarter, tu as créé une plateforme d'apprentissage qui sert des millions d'étudiants. Rencontre les personnes qui travaillent dur pour fournir un contenu basé sur des faits et pour veiller à ce qu'il soit vérifié.
Processus de création de contenu :
Lily Hulatt
Spécialiste du contenu numérique
Lily Hulatt est une spécialiste du contenu numérique avec plus de trois ans d’expérience en stratégie de contenu et en conception de programmes. Elle a obtenu son doctorat en littérature anglaise à l’Université de Durham en 2022, a enseigné au Département d’études anglaises de l’Université de Durham, et a contribué à plusieurs publications. Lily se spécialise en littérature anglaise, langue anglaise, histoire et philosophie.
Gabriel Freitas est un ingénieur en intelligence artificielle possédant une solide expérience en développement logiciel, en algorithmes d’apprentissage automatique et en IA générative, notamment dans les applications des grands modèles de langage (LLM). Diplômé en génie électrique de l’Université de São Paulo, il poursuit actuellement une maîtrise en génie informatique à l’Université de Campinas, avec une spécialisation en apprentissage automatique. Gabriel a un solide bagage en ingénierie logicielle et a travaillé sur des projets impliquant la vision par ordinateur, l’IA embarquée et les applications LLM.
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.