Si quelqu'un a une opinion très différente de la tienne, tu peux dire qu'il a un point de vue biaisé. En fait, tu pourrais dire qu'elle penche plus vers une direction que vers une autre. En statistiques, les distributions peuvent être décrites de la même façon. Dans quel sens tes données sont-elles asymétriques, quelle est l'ampleur de l'asymétrie et comment l'interpréter ? Lis la suite pour le savoir !
Merci de votre intérêt pour les préférences d’apprentissage !
Merci pour ton intérêt pour les différentes méthodes d’apprentissage ! Quelle méthode préfères-tu ? (par exemple, « Audio », « Vidéo », « Texte », « Pas de préférence »)
(optionnel)
Tout d'abord, examinons la définition de l'asymétrie.
Si une distribution s'écarte de la distribution normale, on dit qu'elle est asymétrique.
Le degré d'asymétrie de ta distribution t'indique à la fois à quel point la distribution est asymétrique et te donne une idée des valeurs aberrantes dans les données.
Existe-t-il des distributions qui ne sont pas asymétriques ? Bien sûr qu'il y en a :
la distribution normale ;
la distribution \(t\) ;
la distribution uniforme continue (rectangulaire) ; et
la distribution de Laplace ;
toutes ont une asymétrie nulle.
Regarde le graphique ci-dessous. Il montre une distribution normale et une distribution de données représentées ensemble. Comme tu peux le voir, la distribution normale est symétrique mais la distribution des données ne l'est pas. La distribution des données n'est pas symétrique comme la distribution normale, c'est pourquoi on dit que la distribution des données est asymétrique.
Fig. 1. La distribution normale n'est pas asymétrique, mais la distribution des données est asymétrique.
La plupart des logiciels statistiques calculent l'asymétrie pour toi. Mais en règle générale, une bonne formule pour mesurer l'asymétrie est la suivante
Une distribution positivement asymétrique est une distribution dont l'asymétrie est supérieure à zéro. En d'autres termes, la moyenne de la distribution est plus grande que la médiane. Tu peux aussi voir cette distribution comme étant asymétrique à droite. Tu peux voir dans le graphique ci-dessous que la moyenne, la médiane et le mode de la distribution normale se trouvent au même endroit, mais que la distribution positivement asymétrique a pour caractéristique de ne pas être asymétrique.
La distribution positivement asymétrique a une queue plus importante sur le côté droit du graphique, qui est la même que dans la direction positive sur l'axe \(x\).
Fig. 2. Distribution asymétrique positive comparée à une distribution normale.
Si tu peux avoir une asymétrie positive, tu peux bien sûr avoir une asymétrie négative aussi !
Distribution asymétrique négative
Une distribution à asymétrienégative est une distribution dont l'asymétrie est inférieure à zéro. En d'autres termes, la moyenne de la distribution est supérieure à la médiane. Tu peux aussi voir cette distribution comme étant asymétrique à gauche. Tu peux voir dans le graphique ci-dessous que la distribution asymétrique négative présente les caractéristiques suivantes
La distribution négativement asymétrique a une queue plus importante sur le côté gauche du graphique, ce qui correspond à la direction négative sur l'axe \(x\).
Fig. 3. Distribution asymétrique négative comparée à une distribution normale.
Maintenant, comment interpréter l'asymétrie ?
Interprétation de l'asymétrie
L'une des choses que tu peux apprendre de l'asymétrie de la distribution est l'endroit où se trouvent les valeurs aberrantes de l'ensemble des données. Dans toute distribution asymétrique, les valeurs aberrantes sont des points de données situés dans la longue queue de la distribution. Cela t'indique que :
dans une distribution à asymétrie positive, les valeurs aberrantes se trouvent dans la longue queue à droite de la moyenne ; et
dans une distribution asymétrique négative, les valeurs aberrantes se trouvent dans la longue queue à gauche de la moyenne.
Ce que l'asymétrie ne te dit pas, c'est le nombre de valeurs aberrantes !
L'asymétrie n'est pas toujours une mauvaise chose. Dans certains ensembles de données, il faut s'y attendre.
Supposons que tu aies recueilli des données concernant la longueur parcourue par une balle de baseball lorsqu'elle est frappée lors d'un match de baseball professionnel. La plupart des données indiquent que la balle parcourt une distance située quelque part entre le lanceur et les sièges du stade. Cependant, il arrive qu'un joueur fasse un amorti et que la balle ne parcourt qu'une courte distance.
Les coups d'amorti seraient des valeurs aberrantes, et les données seraient biaisées en faveur des distances plus longues parcourues. Cela signifie que la distribution des données est asymétrique. C'est ce que l'on attend de ce type de données, et ce n'est pas une indication que quelque chose ne va pas avec l'ensemble des données.
En plus de l'asymétrie, tu peux utiliser l'aplatissement pour obtenir des informations sur la distribution des données.
Asymétrie et aplatissement
L'aplatissement est une façon de décrire la forme des queues d'une distribution de données par rapport au centre.
L'aplatissement est une mesure des queues d'un ensemble de données, et non du sommet de l'ensemble de données !
Il existe trois principaux types d'aplatissement.
Les distributionsmésokurtiques ont \(\text{kurtosis} = 3\), et leurs queues sont généralement similaires à celles d'une distribution normale.
Les distributionsleptokurtiques ont un \(\text{kurtosis} > 3\). Le préfixe est "lepto" qui signifie "mince". Les distributions leptokurtiques ont des queues très longues des deux côtés de la distribution, ce qui fait que le centre semble très mince et très haut. La forme de ce type de distribution indique qu'il y a en fait des valeurs aberrantes des deux côtés de la moyenne !
N'oublie pas que ce qui est important dans les distributions leptokurtiques, c'est qu'elles ont de grosses queues, et non qu'elles ont des centres minces. Le kurtosis est une description des queues d'une distribution. Un exemple de distribution leptokurtique est une distribution \(t\) avec un faible degré de liberté.
Enfin, il existe des distributions platykurtiques, qui ont \ (\text{kurtosis} < 3\). Le préfixe est "platy", qui signifie "large". Les distributions platykurtiques ont des queues très courtes des deux côtés de la distribution, ce qui fait que le centre semble très court et large. Un exemple de distribution platykurtique est la distribution uniforme.
Dans le graphique ci-dessous, tu peux voir que chacune des distributions est symétrique, ce qui signifie qu'elles n'ont pas d'asymétrie. Cependant, la queue des distributions est différente dans chaque cas.
Fig. 4. Toutes ces distributions ont une asymétrie nulle, mais un aplatissement différent.
Tu peux donc constater que l'asymétrie et l'aplatissement n'ont rien à voir l'un avec l'autre !
L'asymétrie - Principaux enseignements
Si une distribution s'écarte de la distribution normale, on dit qu'elle est asymétrique.
Une distribution positivement asymétrique se caractérise par une moyenne supérieure à la médiane et une queue plus longue sur le côté droit du graphique.
Une distribution asymétrique négative a une moyenne plus petite que la médiane et une queue plus longue sur le côté gauche du graphique.
Le kurtosis est une façon de décrire la forme des queues d'une distribution de données par rapport au centre.
Lesdistributions mésokurtiquesont \(\text{kurtosis} = 3\), et sont similaires à la distribution normale.
Les distributions leptokurtiquesont \(\text{kurtosis} > 3\), et des queues très longues des deux côtés de la distribution, ce qui fait que le centre semble très mince et très haut.
Lesdistributions platykurtiques ont\(\text{kurtosis} < 3\), et des queues très courtes des deux côtés de la distribution, ce qui fait que le centre semble très court et large.
Comment tu t'assures que ton contenu est précis et digne de confiance ?
Chez StudySmarter, tu as créé une plateforme d'apprentissage qui sert des millions d'étudiants. Rencontre les personnes qui travaillent dur pour fournir un contenu basé sur des faits et pour veiller à ce qu'il soit vérifié.
Processus de création de contenu :
Lily Hulatt
Spécialiste du contenu numérique
Lily Hulatt est une spécialiste du contenu numérique avec plus de trois ans d’expérience en stratégie de contenu et en conception de programmes. Elle a obtenu son doctorat en littérature anglaise à l’Université de Durham en 2022, a enseigné au Département d’études anglaises de l’Université de Durham, et a contribué à plusieurs publications. Lily se spécialise en littérature anglaise, langue anglaise, histoire et philosophie.
Gabriel Freitas est un ingénieur en intelligence artificielle possédant une solide expérience en développement logiciel, en algorithmes d’apprentissage automatique et en IA générative, notamment dans les applications des grands modèles de langage (LLM). Diplômé en génie électrique de l’Université de São Paulo, il poursuit actuellement une maîtrise en génie informatique à l’Université de Campinas, avec une spécialisation en apprentissage automatique. Gabriel a un solide bagage en ingénierie logicielle et a travaillé sur des projets impliquant la vision par ordinateur, l’IA embarquée et les applications LLM.
StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.