Moyenne arithmétique : Somme de toutes les valeurs divisée par le nombre total de valeurs.
- Additionner toutes les valeurs de la série
- Diviser par le nombre total de valeurs
- Arrondir si nécessaire
Exemple : 10, 15, 12, 18, 14
\( \bar{x} = \frac{\sum x_i}{n} = \frac{10 + 15 + 12 + 18 + 14}{5} \)
\( \sum x_i = 10 + 15 + 12 + 18 + 14 = 69 \)
\( \bar{x} = \frac{69}{5} = 13.8 \)
La moyenne de cette série est de 13.8
La moyenne arithmétique est de 13.8, ce qui signifie que si toutes les valeurs étaient identiques, elles auraient cette valeur.
• Formule : \( \bar{x} = \frac{\sum x_i}{n} \)
• Sensibilité : La moyenne est sensible aux valeurs extrêmes
• Unité : La moyenne a la même unité que les données
Médiane : Valeur qui divise la série ordonnée en deux parties égales.
Données : 10, 15, 12, 18, 14 → Ordonnée : 10, 12, 14, 15, 18
n = 5 (nombre impair)
Pour n impair : position = (n+1)/2 = (5+1)/2 = 3
La médiane est la 3ème valeur : Me = 14
Si n = 6, la médiane est la moyenne des 3ème et 4ème valeurs
La médiane est 14, ce qui signifie que 50% des valeurs sont inférieures à 14 et 50% sont supérieures.
• Position : Pour n impair → (n+1)/2, pour n pair → moyenne des deux valeurs centrales
• Robustesse : La médiane est insensible aux valeurs extrêmes
• Ordonnancement : Il faut toujours ordonner la série avant de calculer
Mode : Valeur qui apparaît le plus fréquemment dans une série.
Exemple : 10, 12, 12, 14, 15, 12, 18, 14
10: 1 fois, 12: 3 fois, 14: 2 fois, 15: 1 fois, 18: 1 fois
La valeur 12 apparaît 3 fois, plus que les autres
Une série peut avoir plusieurs modes (multimodale) ou aucun mode
Le mode représente la tendance dominante dans la distribution
Le mode est 12, car c'est la valeur qui apparaît le plus fréquemment (3 fois).
• Définition : La valeur la plus fréquente dans la série
• Multi-modalité : Une série peut avoir plusieurs modes
• Utilité : Particulièrement utile pour les données qualitatives
Comparaison : Analyse des différences entre moyenne, médiane et mode.
Exemple : 5, 8, 8, 10, 12, 15, 20, 50 (présence d'une valeur extrême)
\( \bar{x} = \frac{5+8+8+10+12+15+20+50}{8} = \frac{128}{8} = 16 \)
Série ordonnée : 5, 8, 8, 10, 12, 15, 20, 50
Position = (8+1)/2 = 4.5 → Me = (10+12)/2 = 11
Le mode est 8 (apparaît 2 fois)
Moyenne (16) > Médiane (11) > Mode (8) → Distribution asymétrique à droite
Les trois mesures diffèrent : moyenne = 16, médiane = 11, mode = 8. La valeur extrême (50) influence la moyenne mais pas la médiane.
• Sensibilité : La moyenne est sensible aux extrêmes, la médiane non
• Asymétrie : Si moyenne > médiane, distribution asymétrique à droite
• Choix : Médiane préférable pour données asymétriques
Interprétation : Signification des mesures en fonction de la forme de la distribution.
Moyenne ≈ Médiane ≈ Mode (distribution normale)
Moyenne > Médiane > Mode (queue à droite, valeurs extrêmes hautes)
Mode > Médiane > Moyenne (queue à gauche, valeurs extrêmes basses)
Deux modes distincts indiquant deux groupes dans la population
Symétrique → moyenne, Asymétrique → médiane, Catégorielle → mode
La forme de la distribution détermine la mesure la plus appropriée : moyenne pour distributions symétriques, médiane pour asymétriques, mode pour catégorielles.
• Symétrie : Moyenne = Médiane = Mode
• Asymétrie : Direction de la queue détermine l'ordre des mesures
• Choix : Dépend du type de données et de la distribution
Salaire : Rémunération d'un salarié, souvent distribué de façon asymétrique.
1200, 1500, 1600, 1800, 2000, 2200, 2500, 3000, 4000, 8000
\( \bar{x} = \frac{1200+1500+1600+1800+2000+2200+2500+3000+4000+8000}{10} = \frac{27800}{10} = 2780 \)
Série ordonnée : 1200, 1500, 1600, 1800, 2000, 2200, 2500, 3000, 4000, 8000
Position = (10+1)/2 = 5.5 → Me = (2000+2200)/2 = 2100
Aucun mode (toutes les valeurs sont uniques)
La moyenne (2780€) est influencée par le salaire élevé (8000€), la médiane (2100€) est plus représentative
Pour cette série de salaires : moyenne = 2780€, médiane = 2100€, pas de mode. La médiane est plus représentative du salaire typique.
• Asymétrie : Les salaires sont souvent asymétriques à droite
• Représentativité : La médiane est souvent plus représentative que la moyenne
• Écart : Grand écart entre moyenne et médiane indique asymétrie
Valeurs extrêmes : Observations très différentes des autres dans une série.
Données : 10, 12, 14, 15, 16, 18, 20
Moyenne = (10+12+14+15+16+18+20)/7 = 105/7 = 15
Nouvelle série : 10, 12, 14, 15, 16, 18, 20, 100
Moyenne = (105+100)/8 = 205/8 = 25.625
Augmentation de la moyenne : 25.625 - 15 = 10.625
Pourcentage d'augmentation : (10.625/15) × 100 = 70.83%
Sans extrême : Me = 15, Avec extrême : Me = (15+16)/2 = 15.5
La médiane n'a presque pas changé
La moyenne est fortement influencée par les valeurs extrêmes, contrairement à la médiane
La valeur extrême (100) a fait passer la moyenne de 15 à 25.625 (+70.83%), tandis que la médiane est restée presque inchangée (15 à 15.5).
• Sensibilité : La moyenne est sensible aux valeurs extrêmes
• Robustesse : La médiane est robuste aux valeurs extrêmes
• Choix : Médiane préférable en présence de valeurs extrêmes
Catégories socio-professionnelles (CSP) : Regroupements selon la profession et le statut.
3000, 3500, 4000, 4500, 5000, 6000, 8000
Moyenne = 4857€, Médiane = 4500€
1500, 1600, 1700, 1800, 1900, 2000, 2500
Moyenne = 1857€, Médiane = 1800€
1400, 1500, 1600, 1700, 1750, 1800, 2000
Moyenne = 1679€, Médiane = 1700€
Écart entre cadres et ouvriers : 4857 - 1679 = 3178€ (moyenne)
Les cadres ont des salaires nettement supérieurs
Les inégalités de revenus sont marquées entre CSP, avec une concentration des hauts salaires chez les cadres
Les cadres ont des salaires moyens de 4857€ (médiane 4500€), les employés 1857€ (médiane 1800€), les ouvriers 1679€ (médiane 1700€), montrant des inégalités marquées.
• Hiérarchie : Salaires augmentent avec le niveau de qualification
• Inégalités : Grand écart entre CSP
• Évolution : Analyse des tendances selon le statut professionnel
Comparaison internationale : Analyse des différences entre pays pour une variable donnée.
France : 42000, Allemagne : 46000, Royaume-Uni : 43000, Italie : 35000, Espagne : 30000
Moyenne = (42000+46000+43000+35000+30000)/5 = 39200$
Série ordonnée : 30000, 35000, 42000, 43000, 46000
Médiane = 42000$
Écart entre max (46000) et min (30000) = 16000$
Écart-type élevé indique des différences marquées
Les écarts de développement économique sont importants entre les pays européens
Le PIB par habitant moyen en Europe est de 39200$, mais varie de 30000$ (Espagne) à 46000$ (Allemagne), montrant des écarts de développement.
• Comparaison : Permet d'analyser les écarts entre pays
• Indicateurs : Moyenne et médiane révèlent des tendances
• Écarts : Grandes différences peuvent indiquer des déséquilibres
Choix de la mesure : Sélection de la mesure de tendance centrale selon le type de données.
Exemple : salaires, prix, températures
Préférer la moyenne (si distribution symétrique) ou la médiane (si asymétrique)
Exemple : nombre d'enfants, nombre de logements
La moyenne, médiane et mode peuvent tous être utilisés
Exemple : niveaux de satisfaction (mauvais, moyen, bon)
Utiliser la médiane ou le mode
Exemple : professions, catégories socio-professionnelles
Utiliser le mode
Si distribution asymétrique, utiliser la médiane qui est plus robuste
Le choix de la mesure dépend du type de données : moyenne pour données continues symétriques, médiane pour asymétriques, mode pour catégorielles.
• Quantitatif continu symétrique : Moyenne
• Quantitatif continu asymétrique : Médiane
• Qualitatif : Mode ou médiane selon l'ordre possible