Sauter à un chapitre clé
Après y avoir réfléchi un moment, j'ai trouvé cela tout à fait logiquea>. Comme les tout-petits ne mangent pas autant que les adolescents, il est normal de les faire payer moins cher. Il semble qu'il y ait une relation entre l'âge et la quantité de nourriture qu'une personne mange. Comment étudier cette relation ? Tu pourrais peut-être mener une enquête pour cette recherche !
Chaque fois que tu étudies la relation entre deux variables que tu peux mesurer, tu as affaire à deux variables quantitatives. Tu apprendras ici comment étudier leur relation et les techniques utilisées pour les représenter.
Relation entre deux variables quantitatives
Avant de poursuivre, il est important de revoir la différence entre les variables quantitatives et les variables catégorielles.
Une variable quantitative est une variable qui peut être mesurée à l'aide d'unités.
Le type d'unités que tu utilises n'a pas d'importance, tant que tu peux mesurer une variable, il s'agit d'une variable quantitative. Qu'en est-il des variables catégorielles ?
Une variable catégorielle, également appelée variable qualitative, est une variable dont les propriétés sont décrites plutôt que mesurées.
Les variables catégorielles sont généralement des choses comme les couleurs, les noms, les repas préférés, etc.
Supposons que tu fasses une enquête dans ton quartier et que tu demandes les données suivantes :
- Âge
- Sexe
- Taille
- Nom de famille
- Activité préférée
Quelles sont les variables quantitatives et celles qui sont catégoriques ?
Solution :
Pour savoir quelles variables sont quantitatives, tu dois te demander quelles variables peuvent être mesurées. Dans la liste donnée, l'âge est généralement mesuré en années, tandis que tu peux mesurer la taille en pieds, en pouces, en mètres ou en d'autres unités. Les variables quantitatives sont donc :
- L'âge
- La taille
Les autres variables seront exprimées par des mots plutôt que par des nombres, il est donc plus facile de les considérer comme des étiquettes (dans le cas du nom de famille) ou comme une description d'elles-mêmes (comme le sexe et l'activité préférée). Les variables catégorielles sont donc les suivantes :
- Sexe
- Nom de famille
- Activité préférée
Généralement, une enquête est réalisée dans le but de recueillir des données pour son inspection. Les décisions sont prises en fonction des conclusions tirées des données, il est donc important d'analyser la relation entre les variables.
Lorsque tu compares deux variables quantitatives, tu peux avoir une image plus claire des données en les organisant en fonction des valeurs numériques qui sont représentées. Ce n'est pas le cas pour les variables catégorielles, comme tu le verras dans l'exemple suivant.
Supposons que tu veuilles faire un graphique pour étudier la relation entre ces deux paires de variables :
- Taille et poids des lycéens.
- Sport préféré et couleur préférée des lycéens.
Lorsque tu fais un graphique de deux variables quantitatives, comme dans le cas de la taille et du poids des élèves, tu peux disposer les données par ordre numérique. Autrement dit, chaque axe représentera une droite numérique, de sorte qu'avant de le remplir avec des données, ton graphique ressemblera à ceci :
Le graphique comparant deux variables quantitatives est plus perspicace car si tu te déplaces vers la droite, tu observes des personnes plus grandes, et si tu te déplaces vers le haut, tu observeras des personnes dont le poids est plus élevé. Tu peux le constater même si le graphique est vide !
Si tu devais utiliser un graphique pour représenter deux variables catégorielles, comme dans le cas du sport et de la couleur préférés, il n'y a pas d'arrangement clair pour les données. Tu les organiseras peut-être par ordre alphabétique, ou tu les classeras peut-être selon tes préférences, mais cet arrangement ne te dit rien à l'avance.
Il est important de garder à l'esprit le contexte de l'enquête afin de classer correctement une variable comme quantitative ou catégorielle. Par exemple, tu pourrais penser qu'un code postal est une variable quantitative parce qu'il s'agit d'un nombre, mais comme il s'agit simplement d'une étiquette, il s'agit plutôt d'une variable catégorielle.
Si tu veux savoir comment analyser les variables catégorielles, consulte notre article Deux variables catégorielles.
Comment comparer deux variables quantitatives
La question qui se pose naturellement lorsqu'on te donne deux variables est la suivante : Ces deux variables sont-elles liées l'une à l'autre ?
Prends le cas de la taille et du poids. Plus une personne est grande, plus elle pèsera. Cela ne signifie pas qu'une personne plus grande pèsera toujours plus qu'une personne plus petite, mais cela t'indique plutôt qu'il existe une relation entre ces variables.
Il est également possible d'avoir deux variables non liées, comme l'âge et la taille d'une population d'hommes adultes. Chaque fois que tu as affaire à deux variables, qu'elles soient liées ou non, tu as affaire à des données bivariées.
Les donnéesbivariées sont des données qui sont données sous forme de paires de variables.
Dans l'exemple de la taille et du poids, lorsque tu feras une enquête, tu demanderas à la fois la taille et le poids de chaque individu, donc chacune de ces valeurs sera appariée. Il s'agit d'un exemple de données à deux variables.
Les donnéesquantitatives à deux variables sont des données à deux variables qui se composent de deux variables quantitatives.
Les données quantitatives à deux variables peuvent être représentées de plusieurs façons. Par exemple, tu peux utiliser un tableau de valeurs, où chaque colonne représente l'une des variables.
Supposons que tu veuilles étudier s'il existe une relation entre les habitudes de consommation et l'âge. Pour cette raison, tu te rends au centre commercial de ton quartier et tu demandes poliment à chaque personne qui part si elle est partante pour un sondage. Dans cette enquête, tu leur demandes simplement leur âge et le nombre d'articles qu'ils ont achetés, le cas échéant. Tes données peuvent être organisées dans un tableau comme celui-ci :
Âge (années) | Nombre d'articles achetés |
\[12\] | \[0\] |
\[36\] | \[4\] |
\[21\] | \[12\] |
\[24\] | \[5\] |
\[15\] | \[2\] |
\[23\] | \[7\] |
\[45\] | \[2\] |
\[67\] | \[1\] |
\[11\] | \[1\] |
À partir du tableau ci-dessus, tu peux commencer à noter quelques tendances. On dirait que les enfants ont tendance à acheter moins de choses, peut-être parce qu'ils manquent d'argent. D'un autre côté, les jeunes adultes semblent aimer mettre la main sur beaucoup de choses. Bien sûr, de nombreux autres facteurs entrent en jeu dans les habitudes de consommation, mais c'est un bon début !
Tu peux réorganiser le tableau ci-dessus en classant les données par âge, auquel cas tu dois t'assurer que tu associes correctement chaque entrée.
Âge (années) | Nombre d'articles achetés |
\[11\] | \[1\] |
\[12\] | \[0\] |
\[15\] | \[2\] |
\[21\] | \[12\] |
\[23\] | \[7\] |
\[24\] | \[5\] |
\[36\] | \[4\] |
\[45\] | \[2\] |
\[67\] | \[1\] |
N'oublie pas que le tableau peut aussi être écrit horizontalement, auquel cas chaque ligne représentera une enquête.
Une autre façon de représenter des données quantitatives à deux variables consiste à dessiner des points dans un plan, comme tu le verras dans la section suivante.
Graphiques de deux variables quantitatives
Il existe de nombreuses façons de représenter des données quantitatives. Par exemple, si tu souhaites réaliser une enquête sur l'âge des lycéens, tu peux utiliser un histogramme, un diagramme en points ou un diagramme en tiges et feuilles. Cependant, tous ces graphiques sont utilisés pour afficher une seule variable ainsi que sa fréquence.
Supposons que l'on te donne un ensemble de données quantitatives à deux variables, ce qui signifie que les deux variables sont des variables quantitatives, et que tu as donc affaire à une paire de nombres. La représentation graphique de données quantitatives bivariées est donc une tâche simple, car tu peux représenter les données par des points sur le plan . Pour ce faire, tu dois assigner un axe à chaque variable.
Prends l'exemple de notre centre commercial. Tu peux assigner l'une ou l'autre variable à l'un ou l'autre axe, mais tu assigneras généralement l'axe \(x\) à des variables telles que l'âge et la taille, qui évoluent à un rythme constant ou qui sont moins susceptibles d'évoluer.
En revanche, les variables telles que le poids, le nombre d'articles achetés ou de bouteilles d'eau bues en une semaine sont plus susceptibles d'être assignées à l'axe \(y\).
Note que l'âge des clients est compris entre 11 et 67 ans, et que l'axe des x est donc modifié en conséquence. De même, l'axe \(y\) est compris entre \(0) et \(12).
Maintenant que le plan est étiqueté de façon représentative, il est temps de dessiner un grand nombre de points. Ici, chaque point représente une enquête.
Le graphique présenté dans l'exemple précédent est connu sous le nom de diagramme de dispersion, et c'est l'une des façons les plus courantes d'afficher des données quantitatives bivariées.
Pour plus d'informations sur ces diagrammes, consulte notre article sur les diagrammes de dispersion !
Corrélation entre deux variables quantitatives
L'une des raisons pour lesquelles les diagrammes de dispersion sont souvent utilisés pour représenter des données quantitatives bivariées est qu'il est possible d'identifier des modèles dans les données. Considère le diagramme de dispersion suivant.
À partir du diagramme de dispersion ci-dessus, tu as peut-être trouvé un modèle dans lequel, en général, plus l'âge des enfants augmente, plus ils sont grands, ce qui est parfaitement logique. Dans ce cas, nous disons que les deux variables sont corrélées.
Lacorrélation est une mesure du degré d'association entre deux variables quantitatives.
Il convient de noter que la corrélation ne s'applique qu'à deux variables quantitatives. Si tu as affaire à des données bivariées où l'une ou les deux variables sont catégoriques, tu ne dois pas rechercher de corrélation.
Lorsque deux variables sont corrélées, tu peux tracer une ligne droite qui décrit plus ou moins le comportement des données. Cette ligne est connue sous le nom de ligne de meilleur ajustement, qui est obtenue au moyen de la régression linéaire.
Consulte notre article sur la régression linéaire pour plus d'informations sur ce sujet !
Si deux variables sont corrélées, tu t'attends à ce que le changement de l'une ait un impact significatif sur l'autre. Pour cette raison, si les variables sont corrélées, la ligne de meilleur ajustement sera soit une ligne croissante, soit une ligne décroissante.
En revanche, si deux variables ne sont pas du tout corrélées, tu dois t'attendre à ce que la ligne de meilleur ajustement soit horizontale, car le changement d'une variable n'a aucun impact sur l'autre. Dans ce scénario, les données seront dispersées sur tout le pourtour.
Pour mesurer le degré de corrélation entre deux variables, tu dois examiner le coefficient de corrélation de Pearson.
Le coefficient de corrélation de Pearson, également connu sous le nom de coefficient de Pearson, ou simplement de coefficient de corrélation, est un nombre compris entre \(-1\) et \(1\), qui est utilisé pour mesurer la corrélation de données bivariées.
Pour plus d'informations sur le coefficient de corrélation et la façon dont il est obtenu, jette un coup d'œil à notre article sur la corrélation linéaire.
Il y a certaines choses à garder à l'esprit lorsqu'on parle de corrélation, qui peuvent être abordées à l'aide du coefficient de corrélation.
Forme de la corrélation
La corrélation fait généralement référence à l'association linéaire entre deux variables, mais il est également possible de constater que certaines variables sont liées par d'autres types de relations, comme la quadratique ou l'exponentielle.
Ces autres types de corrélation ne seront pas abordés plus avant dans cet article.
Le coefficient de corrélation de Pearson ne s'applique qu'aux données bivariées à corrélation linéaire !
Sens de la corrélation
Dans les exemples précédents, tu as vu que dans le cas de deux variables corrélées, lorsque l'une augmente, l'autre augmente aussi. Il s'agit d'un type particulier de corrélation, appelé corrélation positive.
Deux variables sont positivement corrélées si le coefficient de corrélation de Pearson est positif.
Lorsque deux variables sont positivement corrélées, la ligne de meilleur ajustement a une pente positive. Cependant, il est également possible d'avoir des variables négativement corrélées.
Deux variables sont négativement corrélées si le coefficient de corrélation de Pearson est négatif.
De même, lorsque deux variables sont négativement corrélées, la ligne d'ajustement optimal a une pente négative.
Rappelle-toi qu'une corrélation négative signifie que les données sont corrélées . Le mot négatif est utilisé pour parler de la pente de la ligne de meilleur ajustement.
Force de la corrélation
Tu remarqueras parfois qu'un diagramme de dispersion ressemble fortement à un graphique linéaire, tandis que d'autres présentent des données si dispersées qu'elles semblent presque aléatoires ! La valeur absolue du coefficient de corrélation de Pearson te donnera un aperçu de la question.
Soit \(r\) le coefficient de corrélation de Pearson d'un ensemble de données quantitatives à deux variables. Plus \(|r|\) est proche de \(1,\), plus la corrélation est forte. Un coefficient de corrélation de Pearson exactement égal à \(1\) ou \(-1\) signifie que les données sont complètement linéaires, ce qui est un scénario si parfait qu'il est peu probable qu'il se produise.
En revanche, si le coefficient de corrélation de Pearson est proche de \(0\), les données suggèrent que les variables ne sont pas corrélées, ou qu'elles le sont faiblement.
Exemples de deux variables quantitatives
Ici, tu peux regarder quelques exemples de diagrammes de dispersion de deux variables quantitatives et dire s'ils représentent des données corrélées ou non.
Une enquête a été réalisée auprès de femmes adultes sur leurs habitudes de lecture, ce qui a permis d'obtenir le nuage de points suivant.
- Que représente ce diagramme de dispersion ?
- Les variables impliquées sont-elles des variables quantitatives ?
- Quel type de conclusion peux-tu tirer de ce diagramme de dispersion ?
Solution :
- En regardant les axes du graphique, tu peux noter que la taille se trouve sur l'axe horizontal, tandis que le nombre moyen de livres lus en un an se trouve sur l'axe vertical. Par conséquent, ce diagramme de dispersion est utilisé pour étudier s'il existe une relation entre les tailles et les habitudes de lecture des femmes adultes.
- Ce diagramme de dispersion met en relation la taille, qui peut être mesurée, et le nombre moyen de livres lus en un an, qui peut être compté. Par conséquent, les deux variables sont des variables quantitatives.
- En regardant le diagramme de dispersion, tu peux noter que les données sont très dispersées et qu'il n'y a pas de tendance claire à une corrélation positive ou négative. Tu peux donc supposer qu'il n'y a pas de relation entre la taille d'une femme adulte et le nombre de livres qu'elle lit en un an.
Tu peux trouver des corrélations même dans ton épicerie !
Supposons que tu sois au régime et qu'on te recommande d'éviter le sucre ajouté dans les boissons en boîte comme les jus et les sodas.
Tu es sceptique quant à cette suggestion, alors tu décides d'étudier s'il existe une relation entre le sucre ajouté et les calories par portion.
Pour ce faire, tu vas à l'épicerie et tu vérifies la valeur nutritive de \(20\) différents produits que tu vas consommer. De retour à la maison, tu réalises le diagramme de dispersion suivant.
Devrais-tu suivre la recommandation ?
Solution :
En examinant les données, tu peux constater que plus la quantité de sucre ajouté augmente, plus la quantité de calories par portion de ces boissons en boîte augmente.
Tu peux en conclure qu'il existe une corrélation positive entre la quantité de sucre moyenne et les calories des boissons en boîte. Comme tu es au régime, tu dois limiter les calories que tu consommes, tu dois donc suivre cette recommandation.
Deux variables quantitatives - Principaux enseignements
- Une variable quantitative est une variable qui peut être mesurée à l'aide d'unités.
- Les donnéesquantitatives à deux variables sont des données présentées sous forme de paires de variables quantitatives .
- Les données quantitatives à deux variables sont représentées sur un plan. Chaque point du plan correspond à une enquête.
- Lesdiagrammes de dispersion sont utilisés pour représenter les données quantitatives à deux variables.
- Une ligne de meilleur ajustement peut être utilisée dans un diagramme de dispersion pour représenter la tendance des données.
- Si la pente d'une ligne de meilleur ajustement est positive, les données sont positivement corrélées.
- Si la pente d'une ligne de meilleur ajustement est négative, les données sont négativement corrélées.
- Si les données d'un diagramme de dispersion sont très étalées en dehors de la ligne de meilleur ajustement, alors les données sont faiblement corrélées.
Apprends avec 11 fiches de Deux Variables Quantitatives dans l'application gratuite StudySmarter
Tu as déjà un compte ? Connecte-toi
Questions fréquemment posées en Deux Variables Quantitatives
À propos de StudySmarter
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.
En savoir plus