Moyenne arithmétique : \(\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i = \frac{\text{somme des valeurs}}{\text{nombre de valeurs}}\)
Valeurs : 5, 8, 12, 15, 20
Nombre de valeurs : n = 5
Somme = 5 + 8 + 12 + 15 + 20 = 60
\(\bar{x} = \frac{60}{5} = 12\)
La valeur moyenne de cette série est 12
La moyenne de la série est \(\bar{x} = 12\)
• Formule : \(\bar{x} = \frac{\sum x_i}{n}\)
• Calcul : Somme des valeurs divisée par le nombre de valeurs
• Interprétation : Valeur centrale représentative de la série
Médiane : Valeur qui partage la série ordonnée en deux groupes de même effectif.
La série est déjà ordonnée : 3, 7, 9, 12, 15, 18, 22
n = 7 (impair)
Pour n impair, la médiane est la valeur de rang \(\frac{n+1}{2} = \frac{7+1}{2} = 4\)
La 4ème valeur est 12
La médiane de la série est Me = 12
• Position : Pour n impair → médiane = valeur de rang (n+1)/2
• Interprétation : 50% des valeurs sont ≤ médiane, 50% ≥ médiane
• Avantage : Insensible aux valeurs extrêmes
Quartiles : Q₁ (25%), Q₂ (50% = médiane), Q₃ (75%). Divisent la série en 4 parties égales.
Série ordonnée : 2, 4, 6, 8, 10, 12, 14, 16 (n = 8)
Q₁ : position = \(\frac{1 \times n}{4} = \frac{8}{4} = 2\), donc Q₁ = 4
Q₂ : position = \(\frac{2 \times n}{4} = \frac{16}{4} = 4\), donc Q₂ = (8+10)/2 = 9
Q₃ : position = \(\frac{3 \times n}{4} = \frac{24}{4} = 6\), donc Q₃ = 12
Q₁ = 4, Q₂ = 9, Q₃ = 12
• Positions : Q₁ = (n/4)e, Q₂ = (n/2)e, Q₃ = (3n/4)e
• Interprétation : 25%, 50%, 75% des données sont ≤ aux quartiles
• Interval : [Q₁, Q₃] contient 50% des données
Écart-type : \(\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2}\). Mesure la dispersion des données.
\(\bar{x} = \frac{10+12+14+16+18}{5} = \frac{70}{5} = 14\)
(10-14)² = 16, (12-14)² = 4, (14-14)² = 0, (16-14)² = 4, (18-14)² = 16
\(V = \frac{16+4+0+4+16}{5} = \frac{40}{5} = 8\)
\(\sigma = \sqrt{8} = 2\sqrt{2} \approx 2.83\)
L'écart-type de la série est \(\sigma = 2\sqrt{2} \approx 2.83\)
• Formule : \(\sigma = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n}}\)
• Interprétation : Plus σ est grand, plus les données sont dispersées
• Relation : \(\sigma = \sqrt{V}\) où V est la variance
Effectif : Nombre de fois qu'une valeur apparaît. Fréquence : Effectif/nombre total.
Notes : 8, 10, 12, 14, 16
Effectifs : 3, 5, 7, 4, 1
N = 3 + 5 + 7 + 4 + 1 = 20
\(\bar{x} = \frac{8 \times 3 + 10 \times 5 + 12 \times 7 + 14 \times 4 + 16 \times 1}{20}\)
\(\bar{x} = \frac{24 + 50 + 84 + 56 + 16}{20} = \frac{230}{20} = 11.5\)
EC : 3, 8, 15, 19, 20
La médiane est la 10ème valeur (20/2), donc Me = 12
Moyenne = 11.5, Médiane = 12
• Moyenne pondérée : \(\bar{x} = \frac{\sum x_i \times n_i}{N}\)
• Effectifs cumulés : Pour déterminer la médiane
• Fréquence : \(f_i = \frac{n_i}{N}\)
Asymétrie : La moyenne est sensible aux valeurs extrêmes, la médiane non.
Exemple : 1, 2, 3, 4, 5, 6, 7, 8, 9, 100
\(\bar{x} = \frac{1+2+3+4+5+6+7+8+9+100}{10} = \frac{145}{10} = 14.5\)
Valeurs ordonnées : 1, 2, 3, 4, 5, 6, 7, 8, 9, 100
Me = (5+6)/2 = 5.5
\(\bar{x} = 14.5 >\) Me = 5.5 → asymétrie positive (queue à droite)
Dans une série asymétrique, la moyenne est influencée par les valeurs extrêmes
• Asymétrie positive : \(\bar{x} >\) Me (queue à droite)
• Asymétrie négative : \(\bar{x} <\) Me (queue à gauche)
• Comparaison : La médiane est plus robuste que la moyenne
Boxplot : Représente min, Q₁, Me, Q₃, max. Montre la distribution et les valeurs aberrantes.
Min, Q₁, Me, Q₃, Max
La boîte va de Q₁ à Q₃, contient 50% des données
Représentent les valeurs comprises dans [Q₁ - 1.5×IQR, Q₃ + 1.5×IQR]
Points en dehors des moustaches
Le boxplot montre la distribution, la dispersion et les valeurs aberrantes
• IQR : Écart interquartile = Q₃ - Q₁
• Moustaches : [Q₁ - 1.5×IQR, Q₃ + 1.5×IQR]
• Valeurs aberrantes : En dehors des moustaches
Variance : \(V = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2\). Mesure la dispersion autour de la moyenne.
Série : 5, 7, 9, 11, 13
\(\bar{x} = \frac{5+7+9+11+13}{5} = \frac{45}{5} = 9\)
(5-9)² = 16, (7-9)² = 4, (9-9)² = 0, (11-9)² = 4, (13-9)² = 16
\(V = \frac{16+4+0+4+16}{5} = \frac{40}{5} = 8\)
La variance de la série est V = 8
• Formule : \(V = \frac{\sum (x_i - \bar{x})^2}{n}\)
• Unité : Carré de l'unité des données
• Relation : \(\sigma = \sqrt{V}\)
Valeurs aberrantes : Éloignées du reste des données. Identifiées avec Q₁ - 1.5×IQR et Q₃ + 1.5×IQR.
Série : 2, 4, 6, 8, 10, 12, 14, 16, 100
Q₁ = 5, Q₂ = 10, Q₃ = 15
IQR = Q₃ - Q₁ = 15 - 5 = 10
Limite inférieure = Q₁ - 1.5×IQR = 5 - 15 = -10
Limite supérieure = Q₃ + 1.5×IQR = 15 + 15 = 30
La valeur 100 > 30 → valeur aberrante
La valeur 100 est une valeur aberrante dans cette série
• Seuils : [Q₁ - 1.5×IQR, Q₃ + 1.5×IQR]
• Aberration : Valeur en dehors de ces seuils
• Impact : Peut fortement influencer la moyenne
Résumé : Ensemble d'indicateurs (position, dispersion) pour caractériser une série.
Moyenne, médiane, mode
Écart-type, variance, étendue, IQR
Q₁, Q₂, Q₃
Symétrie, présence de valeurs aberrantes
Un résumé statistique complet inclut tous les indicateurs pertinents pour analyser une série
• Position : Moyenne, médiane, mode
• Dispersion : Écart-type, variance, IQR
• Distribution : Asymétrie, valeurs aberrantes