Les diagrammes de Venn te permettent de comprendre comment des événements peuvent se produire en même temps.
Dessine un diagramme de Venn pour les données suivantes :
U = nombres inférieurs à 20
A = nombres pairs
B = Multiples de 3
Solutions :
Exemple de diagramme de Venn
Calcule \(P(A \cap B)\)
Solutions :
Il y a 19 nombres dans l'ensemble.
Il y a 3 nombres à l'intérieur de l'intersection.
Donc \(P(A \cap B) = \frac{3}{19}\)
Collecte des données
Ici, nous nous intéressons à l'échantillonnage, notamment aux différentes méthodes d'échantillonnage et aux différents types de données. Certaines personnes trouvent que les questions sur l'échantillonnage sont les plus faciles à répondre dans un examen, mais elles peuvent aussi être assez verbeuses, il est donc important d'être attentif - et tu comprendras alors précisément ce que l'on te demande de faire.
Il y a plusieurs façons de classer les données. Nous pouvons classer les données comme étant quantitatives ou qualitatives, ainsi que descriptives et déductives.
Il y a 400 élèves dans l'école, 250 filles et 150 garçons. Explique comment prélever un échantillon stratifié de 40 élèves dans l'école.
Solution.
Nous voulons choisir 25 filles et 15 garçons (de façon à avoir la même proportion que la population entière). Une méthode consiste à attribuer à toutes les filles un numéro compris entre 1 et 250. Ensuite, à l'aide d'un générateur de nombres aléatoires, génère 25 numéros, puis choisis ces 25 filles.
Répète la même chose pour les garçons : attribue-leur un numéro compris entre 1 et 150. Utilise ensuite ton générateur de nombres aléatoires pour générer 15 nombres, puis choisis ces 15 garçons.
Mesures de la localisation et de la propagation
Nous devons analyser les données que nous recueillons, et la meilleure façon de le faire est d'utiliser des mesures de localisation et de dispersion. Cela nous permet de comparer les données à l'aide des éléments suivants
La moyenne et l'écart type.
Utiliser des analyses de données simples telles que le mode et l'étendue.
Un jour choisi au hasard, chacun des 32 élèves d'une classe a noté à la minute près le temps (t) qu'il lui a fallu pour se rendre à l'école. Trouve la moyenne et l'écart type à partir des données suivantes :
Une partie essentielle des statistiques consiste à comprendre la distribution des données. Les distributions sont essentiellement des fonctions mathématiques qui donnent la probabilité qu'une fonction se produise. Nous examinerons deux distributions principales, la distribution binomiale et la distribution normale.
La distribution binomiale s'applique chaque fois qu'il y a deux résultats possibles mutuellement exclusifs d'une expérience. Si une expérience dont la probabilité que le résultat se produise est p est réalisée n fois, la probabilité que ce résultat se produise n fois est :
\(P(X = a) = \left( \begin{array} {c} n \\ a \end{array} \right) p^{a} (1-p)^{n-a}\) avec \(\left( \begin{array} {c} n \ a \end{array} \right) = \frac{n !}{a !(n-a)!}\N- (également écrit \N(^n{C}_a\N))
Un dé est lancé 10 fois. Le résultat du lancer de 5 présente une distribution binomiale : \(X \sim B(10, \frac{1}{6})\). Calcule \NP(P(X \leq 3)\N).
En faisant la somme de tous ces éléments, nous obtenons \(P(X \leq 3) = 0.9302721575\)
Dans certains examens, tu auras accès à un livret de formules avec une section dédiée aux statistiques. Vérifie sur le site Internet de ton jury d'examen si c'est le cas. Les formules les plus utiles sont celles de la distribution binomiale et de la probabilité mutualiste ; cependant, le livret contiendra également des tableaux statistiques. Tu n'en auras peut-être pas besoin si tu sais utiliser une calculatrice, mais ils indiquent les valeurs de probabilité aux niveaux de signification des distributions.
Tests d'hypothèses
Le test d'hypothèse consiste à utiliser la distribution pour calculer si une déclaration (une hypothèse) est vraie ou non. Dans le sujet sur les tests d'hypothèse, nous verrons comment effectuer des tests unilatéraux et bilatéraux et comment énoncer une hypothèse nulle.
Un café affirme qu'un quart des gâteaux qui lui sont envoyés n'ont pas de cerises sur le dessus. Pour tester cette affirmation, le nombre de gâteaux sans cerises dans un échantillon aléatoire de 40 est enregistré. En utilisant un niveau de signification de 5 %, trouve la région critique pour un test bilatéral de l'hypothèse selon laquelle la probabilité d'une cerise manquante est de 0,26.
Solutions :
Il s'agit d'un test bilatéral, ce qui signifie que nous devrons examiner les deux extrémités. Commence par un nombre aléatoire aux deux extrémités.
Extrémité inférieure :
P(X ≤ 6) = 0,07452108246
P(X ≤ 5) = 0.03207217407
P(X ≤ 4) = 0,01136083855
Comme il s'agit d'un test bilatéral, nous voulons être aussi proches que possible de 0,025 :
P(X ≤ 4) < 0,025 < P(X ≤ 5).
Extrémité supérieure :
P(X ≥ 16) = 1 - P(X ≤ 15) = 0,03703627013.
P(X ≥ 17) = 1 - P(X ≤ 16) = 0,0171086868649.
Encore une fois, nous voulons être aussi proches que possible de 0,025, donc :
P(X ≥ 17) < 0,025 < P(X ≥ 16).
Nos régions critiques sont donc P(X ≤ 4) et P(X ≥ 17).
Représenter les données
Dans le sujet sur la représentation des données, nous allons nous intéresser aux méthodes graphiques pour présenter les données. Il s'agit notamment des histogrammes, des diagrammes en boîte et des fréquences cumulées. Nous verrons également comment trouver des valeurs aberrantes dans les données et comment traiter les anomalies dans les données.
Si tu étudies pour des examens de niveau A, certains conseils d'examen prouvent un grand ensemble de données, par exemple une feuille de calcul contenant des données météorologiques provenant d'aéroports du Royaume-Uni et du monde entier. Tu n'as pas à mémoriser de données, mais tu dois te familiariser avec les différents types de données qu'il contient et les unités de ces données.
Statistiques - Principaux enseignements
Les statistiques peuvent être décomposées en de nombreux concepts.
Le processus mathématique des statistiques est le même que celui des mathématiques pures.
Apprends plus vite avec les 0 fiches sur Statistiques
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Statistiques
Qu'est-ce que les statistiques en mathématiques?
Les statistiques en mathématiques impliquent la collecte, l'analyse et l'interprétation de données pour tirer des conclusions et prendre des décisions.
Pourquoi les statistiques sont-elles importantes?
Les statistiques sont importantes car elles permettent de comprendre les tendances, de faire des prévisions et d'informer des décisions basées sur des données.
Quelle est la différence entre une moyenne et une médiane?
La moyenne est la somme des valeurs divisée par le nombre de valeurs, tandis que la médiane est la valeur centrale d'un ensemble de données ordonné.
Qu'est-ce qu'un écart-type?
Un écart-type mesure la dispersion des valeurs par rapport à la moyenne. Plus l'écart-type est élevé, plus les valeurs sont dispersées.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.