Si quelqu'un a une opinion très différente de la tienne, tu peux dire qu'il a un point de vue biaisé. En fait, tu pourrais dire qu'elle penche plus vers une direction que vers une autre. En statistiques, les distributions peuvent être décrites de la même façon. Dans quel sens tes données sont-elles asymétriques, quelle est l'ampleur de l'asymétrie et comment l'interpréter ? Lis la suite pour le savoir !
Tout d'abord, examinons la définition de l'asymétrie.
Si une distribution s'écarte de la distribution normale, on dit qu'elle est asymétrique.
Le degré d'asymétrie de ta distribution t'indique à la fois à quel point la distribution est asymétrique et te donne une idée des valeurs aberrantes dans les données.
Existe-t-il des distributions qui ne sont pas asymétriques ? Bien sûr qu'il y en a :
la distribution normale ;
la distribution \(t\) ;
la distribution uniforme continue (rectangulaire) ; et
la distribution de Laplace ;
toutes ont une asymétrie nulle.
Regarde le graphique ci-dessous. Il montre une distribution normale et une distribution de données représentées ensemble. Comme tu peux le voir, la distribution normale est symétrique mais la distribution des données ne l'est pas. La distribution des données n'est pas symétrique comme la distribution normale, c'est pourquoi on dit que la distribution des données est asymétrique.
Fig. 1. La distribution normale n'est pas asymétrique, mais la distribution des données est asymétrique.
La plupart des logiciels statistiques calculent l'asymétrie pour toi. Mais en règle générale, une bonne formule pour mesurer l'asymétrie est la suivante
Une distribution positivement asymétrique est une distribution dont l'asymétrie est supérieure à zéro. En d'autres termes, la moyenne de la distribution est plus grande que la médiane. Tu peux aussi voir cette distribution comme étant asymétrique à droite. Tu peux voir dans le graphique ci-dessous que la moyenne, la médiane et le mode de la distribution normale se trouvent au même endroit, mais que la distribution positivement asymétrique a pour caractéristique de ne pas être asymétrique.
La distribution positivement asymétrique a une queue plus importante sur le côté droit du graphique, qui est la même que dans la direction positive sur l'axe \(x\).
Fig. 2. Distribution asymétrique positive comparée à une distribution normale.
Si tu peux avoir une asymétrie positive, tu peux bien sûr avoir une asymétrie négative aussi !
Distribution asymétrique négative
Une distribution à asymétrienégative est une distribution dont l'asymétrie est inférieure à zéro. En d'autres termes, la moyenne de la distribution est supérieure à la médiane. Tu peux aussi voir cette distribution comme étant asymétrique à gauche. Tu peux voir dans le graphique ci-dessous que la distribution asymétrique négative présente les caractéristiques suivantes
La distribution négativement asymétrique a une queue plus importante sur le côté gauche du graphique, ce qui correspond à la direction négative sur l'axe \(x\).
Fig. 3. Distribution asymétrique négative comparée à une distribution normale.
Maintenant, comment interpréter l'asymétrie ?
Interprétation de l'asymétrie
L'une des choses que tu peux apprendre de l'asymétrie de la distribution est l'endroit où se trouvent les valeurs aberrantes de l'ensemble des données. Dans toute distribution asymétrique, les valeurs aberrantes sont des points de données situés dans la longue queue de la distribution. Cela t'indique que :
dans une distribution à asymétrie positive, les valeurs aberrantes se trouvent dans la longue queue à droite de la moyenne ; et
dans une distribution asymétrique négative, les valeurs aberrantes se trouvent dans la longue queue à gauche de la moyenne.
Ce que l'asymétrie ne te dit pas, c'est le nombre de valeurs aberrantes !
L'asymétrie n'est pas toujours une mauvaise chose. Dans certains ensembles de données, il faut s'y attendre.
Supposons que tu aies recueilli des données concernant la longueur parcourue par une balle de baseball lorsqu'elle est frappée lors d'un match de baseball professionnel. La plupart des données indiquent que la balle parcourt une distance située quelque part entre le lanceur et les sièges du stade. Cependant, il arrive qu'un joueur fasse un amorti et que la balle ne parcourt qu'une courte distance.
Les coups d'amorti seraient des valeurs aberrantes, et les données seraient biaisées en faveur des distances plus longues parcourues. Cela signifie que la distribution des données est asymétrique. C'est ce que l'on attend de ce type de données, et ce n'est pas une indication que quelque chose ne va pas avec l'ensemble des données.
En plus de l'asymétrie, tu peux utiliser l'aplatissement pour obtenir des informations sur la distribution des données.
Asymétrie et aplatissement
L'aplatissement est une façon de décrire la forme des queues d'une distribution de données par rapport au centre.
L'aplatissement est une mesure des queues d'un ensemble de données, et non du sommet de l'ensemble de données !
Il existe trois principaux types d'aplatissement.
Les distributionsmésokurtiques ont \(\text{kurtosis} = 3\), et leurs queues sont généralement similaires à celles d'une distribution normale.
Les distributionsleptokurtiques ont un \(\text{kurtosis} > 3\). Le préfixe est "lepto" qui signifie "mince". Les distributions leptokurtiques ont des queues très longues des deux côtés de la distribution, ce qui fait que le centre semble très mince et très haut. La forme de ce type de distribution indique qu'il y a en fait des valeurs aberrantes des deux côtés de la moyenne !
N'oublie pas que ce qui est important dans les distributions leptokurtiques, c'est qu'elles ont de grosses queues, et non qu'elles ont des centres minces. Le kurtosis est une description des queues d'une distribution. Un exemple de distribution leptokurtique est une distribution \(t\) avec un faible degré de liberté.
Enfin, il existe des distributions platykurtiques, qui ont \ (\text{kurtosis} < 3\). Le préfixe est "platy", qui signifie "large". Les distributions platykurtiques ont des queues très courtes des deux côtés de la distribution, ce qui fait que le centre semble très court et large. Un exemple de distribution platykurtique est la distribution uniforme.
Dans le graphique ci-dessous, tu peux voir que chacune des distributions est symétrique, ce qui signifie qu'elles n'ont pas d'asymétrie. Cependant, la queue des distributions est différente dans chaque cas.
Fig. 4. Toutes ces distributions ont une asymétrie nulle, mais un aplatissement différent.
Tu peux donc constater que l'asymétrie et l'aplatissement n'ont rien à voir l'un avec l'autre !
L'asymétrie - Principaux enseignements
Si une distribution s'écarte de la distribution normale, on dit qu'elle est asymétrique.
Une distribution positivement asymétrique se caractérise par une moyenne supérieure à la médiane et une queue plus longue sur le côté droit du graphique.
Une distribution asymétrique négative a une moyenne plus petite que la médiane et une queue plus longue sur le côté gauche du graphique.
Le kurtosis est une façon de décrire la forme des queues d'une distribution de données par rapport au centre.
Lesdistributions mésokurtiquesont \(\text{kurtosis} = 3\), et sont similaires à la distribution normale.
Les distributions leptokurtiquesont \(\text{kurtosis} > 3\), et des queues très longues des deux côtés de la distribution, ce qui fait que le centre semble très mince et très haut.
Lesdistributions platykurtiques ont\(\text{kurtosis} < 3\), et des queues très courtes des deux côtés de la distribution, ce qui fait que le centre semble très court et large.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.