Parlons des mesures de tendance centrale ! Si tu aimes les données (et encore plus si tu ne les aimes pas), tu sais que parfois un tas de chiffres peut être écrasant. C'est là que les mesures de tendance centrale entrent en jeu - elles nous aident à donner un sens à nos données en nous donnant un résumé du groupe de données. Que tu calcules la moyenne, la médiane ou le mode, ces mesures fournissent un aperçu utile qui peut guider la prise de décision et l'analyse. Mais attention - les valeurs aberrantes et les distributions asymétriques peuvent fausser nos mesures, il est donc important de tenir compte de la situation dans son ensemble.
Une mesure de la tendance centrale tente de décrire un ensemble de données à l'aide d'une valeur singulière. Cette valeur singulière est censée représenter le point central ou la valeur typique d'un ensemble de données.
Il existe trois mesures de la tendance centrale que nous devons connaître :
La moyenne représente la valeur moyenne d'un ensemble de données.
Pour trouver la moyenne, il faut additionner toutes les valeurs de l'ensemble de données, puis diviser cette somme par le nombre de points de données. La moyenne est généralement représentée par la lettre grecque \(\mu\), prononcée /mi/ :
On peut également l'exprimer avec l'équation suivante :
\[\frac{\sum^{n}_{i=1} x_i}{n}\]
Cela signifie que toutes les valeurs (représentées par x) à partir de la valeur numéro 1 (i = 1) seront ajoutées jusqu'à ce que nous atteignions la valeur n, puis ce nombre sera divisé par n (le nombre total de valeurs).
i = 1 ne signifie pas que seules les valeurs commençant à 1 sont comptées, mais plutôt que la somme commence à la première valeur. La première valeur, selon l'ordre de la liste des nombres, peut être 1 ou n'importe quelle autre valeur.
La moyenne est l'une des mesures de tendance centrale les plus couramment utilisées dans l'analyse des données et sert souvent à résumer des ensembles de données. Cependant, la moyenne peut être influencée par des valeurs extrêmes dans l'ensemble des données, connues sous le nom de valeurs aberrantes, qui peuvent fausser les résultats. Dans ce cas, d'autres mesures de la tendance centrale, telles que la médiane ou le mode, peuvent être plus appropriées.
Trouve la valeur moyenne des précipitations pour les jours indiqués ci-dessous.
Jour
1
2
3
5
9
10
Précipitations (mm)
10
0
5
2
29
1
Solution
La moyenne est donnée par la somme de toutes les valeurs divisée par le nombre de valeurs.
La médiane est une mesure de la tendance centrale qui représente la valeur séparant la moitié supérieure de la moitié inférieure d'un ensemble de données. Si l'ensemble de données comporte un nombre pair de valeurs, la médiane est la moyenne des deux valeurs médianes.
Lorsque nous disposons d'un ensemble de données qui peut être ordonné d'une certaine façon, nous pouvons trouver la médiane. La procédure pour trouver la médiane est la suivante :
Ordonne les données, de la plus petite à la plus grande.
Si le nombre de points de données est impair, le chiffre du milieu est la médiane, ce qui signifie que nous prenons la valeur \((\frac{n+1}{2})^{th}\)).
Si le nombre de points de données est pair, nous prenons la moyenne des deux valeurs médianes. Cela signifie que nous prenons la moyenne des valeurs \((\frac{n}{2})^{th}\) et \((\frac{n+2}{2})^{th}\).
Trouve la médiane des données suivantes.
12, 3, 4, 7, 19, 13, 4, 8, 81
Solution
La première chose à faire est d'ordonner les données de la plus petite à la plus grande.
3, 4, 4, 7, 8, 12, 13, 19, 81
Comme il s'agit d'un nombre impair de points de données, la médiane est le nombre central de l'ensemble de données ordonné, ce qui donne une médiane de 8.
Ci-dessous sont indiquées les tailles de 30 enfants d'une classe (taille donnée en cm). Trouve la taille médiane.
Comme trente est pair, pour trouver la médiane, on trouve la moyenne des quinzième et seizième valeurs. La quinzième valeur est 164, et la seizième valeur est 166. La moyenne de ces valeurs est \(\frac{164+166}{2} = 165\), ce qui signifie que la valeur médiane est 165.
Le mode comme mesure de la tendance centrale
Le mode est une mesure de la tendance centrale qui représente la valeur la plus fréquente dans un ensemble de données. Il est souvent utilisé en combinaison avec la moyenne et la médiane pour donner une image complète d'un ensemble de données. Un ensemble de données peut avoir plusieurs modes s'il y a deux valeurs ou plus qui se produisent avec la même fréquence. Le mode est une statistique utile pour identifier la valeur la plus courante dans un ensemble de données, et peut être particulièrement instructif dans les situations où les données sont discrètes (c'est-à-dire constituées de nombres entiers ou de catégories) plutôt que continues (c'est-à-dire constituées d'une gamme de valeurs).
Le mode d'un ensemble de données est la valeur la plus courante de l'ensemble de données. Si deux valeurs ou plus sont les plus courantes, ces deux valeurs constituent le mode.
Trouve le mode de l'ensemble de données suivant.
1, 2, 3, 4, 4, 5, 6, 6, 6, 6, 7
Solution
Le mode ici serait 6, car cette valeur apparaît quatre fois, ce qui en fait la valeur la plus courante.
Trouve le mode des nombres suivants.
1, 2, 2, 3, 3, 3, 5, 7, 7, 7, 9, 11, 134
Solution
3 et 7 apparaissent tous les deux trois fois, ce qui en fait la valeur la plus courante, ce qui signifie que le mode est 3 et 7.
Choisir des mesures de tendance centrale appropriées
Chaque mesure de tendance centrale a ses propres avantages et inconvénients.
La moyenne présente l'avantage d'utiliser toutes les données et d'être donc représentative de toutes les données. Cependant, l'utilisation de la moyenne présente des inconvénients. Elle est influencée de façon disproportionnée par les valeurs extrêmes, ce qui peut fausser la moyenne. La moyenne ne peut pas non plus être utilisée si nos données ne sont pas numériques, et c'est la mesure de tendance centrale qui demande le plus de calculs.
Pour le mode, les avantages sont que nous pouvons trouver le mode d'un ensemble de données, qu'elles soient numériques ou autres. Les calculs sont également limités, car il suffit de compter les données, ce qui signifie que si nos données sont déjà compilées, cela facilite le calcul du mode. Cependant, l'inconvénient est que le mode n'existe pas nécessairement. De plus, nous pouvons avoir plusieurs modes, ce qui ne nous aide pas à décrire beaucoup de choses sur l'ensemble des données. De plus, le mode ne tient pas compte de l'ensemble des données.
Notre dernière mesure de la tendance centrale est la médiane. L'avantage est que la médiane n'est pas affectée par des valeurs aberrantes ou extrêmes, et que nous avons très peu de calculs à faire. En revanche, il faut ordonner l'ensemble des données, ce qui est long et fastidieux pour les grands ensembles de données. Elle ne prend pas non plus en compte l'ensemble des données, ce qui signifie qu'elle peut donner des résultats faibles.
Mesures de la tendance centrale - Principaux points à retenir
Pour trouver la moyenne, nous additionnons toutes les valeurs de l'ensemble de données et nous les divisons par le nombre de points de données.
La formule de la moyenne est \[\frac{\sum^{n}_{i=1} x_i\}{n}\].
Le mode est la valeur la plus courante dans un ensemble de données.
La médiane est la valeur centrale de l'ensemble de données.
Apprends plus vite avec les 0 fiches sur Mesures de Tendance Centrale
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Mesures de Tendance Centrale
Qu'est-ce que la moyenne?
La moyenne est la somme de toutes les valeurs divisée par le nombre de valeurs.
Comment calcule-t-on la médiane?
Pour trouver la médiane, placez les valeurs en ordre croissant et sélectionnez celle du milieu ou la moyenne des deux valeurs centrales.
Qu'est-ce que le mode en statistiques?
Le mode est la valeur qui apparaît le plus fréquemment dans un ensemble de données.
Quand utilise-t-on la moyenne, la médiane et le mode?
On utilise la moyenne pour des données symétriques, la médiane pour des données asymétriques, et le mode pour des données avec des valeurs récurrentes.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.