Régression linéaire : Méthode des moindres carrés pour trouver la droite qui minimise la somme des carrés des écarts.
Calculer les coefficients a et b de la droite y = ax + b, puis le coefficient de détermination R².
Points : (1,2), (2,4), (3,6), (4,8)
On remarque que y = 2x, donc les points sont parfaitement alignés
\(\bar{x} = \frac{1+2+3+4}{4} = \frac{10}{4} = 2.5\)
\(\bar{y} = \frac{2+4+6+8}{4} = \frac{20}{4} = 5\)
\(a = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sum(x_i - \bar{x})^2}\)
Numérateur : (1-2.5)(2-5) + (2-2.5)(4-5) + (3-2.5)(6-5) + (4-2.5)(8-5) = (-1.5)(-3) + (-0.5)(-1) + (0.5)(1) + (1.5)(3) = 4.5 + 0.5 + 0.5 + 4.5 = 10
Dénominateur : (1-2.5)² + (2-2.5)² + (3-2.5)² + (4-2.5)² = 2.25 + 0.25 + 0.25 + 2.25 = 5
\(a = \frac{10}{5} = 2\)
\(b = \bar{y} - a\bar{x} = 5 - 2(2.5) = 5 - 5 = 0\)
\(y = 2x + 0 = 2x\)
SCT = \(\sum(y_i - \bar{y})^2 = (2-5)² + (4-5)² + (6-5)² + (8-5)² = 9 + 1 + 1 + 9 = 20\)
SCR = \(\sum(y_i - \hat{y}_i)² = (2-2)² + (4-4)² + (6-6)² + (8-8)² = 0 + 0 + 0 + 0 = 0\)
\(R^2 = 1 - \frac{SCR}{SCT} = 1 - \frac{0}{20} = 1\)
La droite d'ajustement est y = 2x avec R² = 1. C'est un ajustement parfait.
• Régression linéaire : y = ax + b avec a et b calculés par moindres carrés
• Coefficient R² : Mesure la proportion de variance expliquée par le modèle
• Interprétation : R² = 1 signifie un ajustement parfait
Coefficient de corrélation : Mesure l'intensité et la direction de la relation linéaire entre deux variables.
Points : (0,1), (1,3), (2,4), (3,6), (4,8)
\(\bar{x} = \frac{0+1+2+3+4}{5} = \frac{10}{5} = 2\)
\(\bar{y} = \frac{1+3+4+6+8}{5} = \frac{22}{5} = 4.4\)
Écarts en x : -2, -1, 0, 1, 2
Écarts en y : -3.4, -1.4, -0.4, 1.6, 3.6
\(\sum(x_i - \bar{x})(y_i - \bar{y}) = (-2)(-3.4) + (-1)(-1.4) + (0)(-0.4) + (1)(1.6) + (2)(3.6)\)
= 6.8 + 1.4 + 0 + 1.6 + 7.2 = 17
\(\sum(x_i - \bar{x})^2 = (-2)² + (-1)² + 0² + 1² + 2² = 4 + 1 + 0 + 1 + 4 = 10\)
\(\sum(y_i - \bar{y})^2 = (-3.4)² + (-1.4)² + (-0.4)² + (1.6)² + (3.6)² = 11.56 + 1.96 + 0.16 + 2.56 + 12.96 = 29.2\)
\(r = \frac{17}{\sqrt{10 \times 29.2}} = \frac{17}{\sqrt{292}} = \frac{17}{17.09} \approx 0.995\)
\(a = \frac{17}{10} = 1.7\)
\(b = 4.4 - 1.7(2) = 4.4 - 3.4 = 1\)
Équation : \(y = 1.7x + 1\)
\(R^2 = r^2 = (0.995)^2 \approx 0.99\)
Le coefficient de corrélation est r ≈ 0.995, la droite d'ajustement est y = 1.7x + 1 avec R² ≈ 0.99.
• Corrélation : -1 ≤ r ≤ 1, |r| proche de 1 indique une forte corrélation
• Relation : r² = R² pour la régression linéaire simple
• Signe : r > 0 indique une corrélation positive
Résidus : Différence entre la valeur observée et la valeur prédite par le modèle : eᵢ = yᵢ - ŷᵢ.
Points : (1, 2.1), (2, 4.0), (3, 5.8), (4, 8.2), (5, 10.1)
où x = volume (mL), y = masse (g)
\(\bar{x} = \frac{1+2+3+4+5}{5} = 3\)
\(\bar{y} = \frac{2.1+4.0+5.8+8.2+10.1}{5} = \frac{30.2}{5} = 6.04\)
\(\sum(x_i - \bar{x})(y_i - \bar{y}) = (-2)(-3.94) + (-1)(-2.04) + (0)(-0.24) + (1)(2.16) + (2)(4.06)\)
= 7.88 + 2.04 + 0 + 2.16 + 8.12 = 20.2
\(\sum(x_i - \bar{x})^2 = 4 + 1 + 0 + 1 + 4 = 10\)
\(a = \frac{20.2}{10} = 2.02\)
\(b = 6.04 - 2.02(3) = 6.04 - 6.06 = -0.02\)
\(y = 2.02x - 0.02\)
Pour x=1 : ŷ = 2.02(1) - 0.02 = 2.0, résidu = 2.1 - 2.0 = 0.1
Pour x=2 : ŷ = 2.02(2) - 0.02 = 4.02, résidu = 4.0 - 4.02 = -0.02
Pour x=3 : ŷ = 2.02(3) - 0.02 = 6.04, résidu = 5.8 - 6.04 = -0.24
Pour x=4 : ŷ = 2.02(4) - 0.02 = 8.06, résidu = 8.2 - 8.06 = 0.14
Pour x=5 : ŷ = 2.02(5) - 0.02 = 10.08, résidu = 10.1 - 10.08 = 0.02
Les résidus sont petits et oscillent autour de zéro
Aucune tendance systématique apparente
Cela valide l'ajustement linéaire
La droite d'ajustement est y = 2.02x - 0.02. Les résidus sont : 0.1, -0.02, -0.24, 0.14, 0.02. Ajustement acceptable.
• Résidus : eᵢ = yᵢ - ŷᵢ, doivent être aléatoires et centrés sur zéro
• Validation : Absence de tendance dans les résidus
• Homoscédasticité : Variance des résidus constante
Validation de modèle : Processus d'évaluation de la qualité d'un modèle par R², résidus et tests statistiques.
Temps (h) : 0, 2, 4, 6, 8, 10
Température (°C) : 20, 24, 28, 32, 36, 40
\(\bar{x} = \frac{0+2+4+6+8+10}{6} = 5\)
\(\bar{y} = \frac{20+24+28+32+36+40}{6} = 30\)
\(\sum(x_i - \bar{x})(y_i - \bar{y}) = (-5)(-10) + (-3)(-6) + (-1)(-2) + (1)(2) + (3)(6) + (5)(10)\)
= 50 + 18 + 2 + 2 + 18 + 50 = 140
\(\sum(x_i - \bar{x})^2 = 25 + 9 + 1 + 1 + 9 + 25 = 70\)
\(a = \frac{140}{70} = 2\)
\(b = 30 - 2(5) = 20\)
\(y = 2x + 20\)
SCT = \(\sum(y_i - \bar{y})^2 = 100 + 36 + 4 + 4 + 36 + 100 = 280\)
SCR = \(\sum(y_i - \hat{y}_i)² = (20-20)² + (24-24)² + (28-28)² + (32-32)² + (36-36)² + (40-40)² = 0\)
\(R^2 = 1 - \frac{0}{280} = 1\)
Tous les résidus sont nuls car les points sont parfaitement alignés
R² = 1 indique un ajustement parfait
Résidus = 0 pour tous les points
Le modèle est validé
Le modèle est y = 2x + 20 avec R² = 1. Tous les résidus sont nuls. Le modèle est parfaitement validé.
• R² : Doit être proche de 1 pour un bon ajustement
• Résidus : Doivent être aléatoires et centrés sur zéro
• Validation : Combinaison de R² et analyse des résidus
Modèle linéaire de croissance : Hypothèse que la croissance est proportionnelle au temps écoulé.
Temps (jours) : 0, 5, 10, 15, 20, 25
Hauteur (cm) : 5, 7.5, 10.2, 12.8, 15.1, 17.6
\(\bar{x} = \frac{0+5+10+15+20+25}{6} = 12.5\)
\(\bar{y} = \frac{5+7.5+10.2+12.8+15.1+17.6}{6} = 11.37\)
\(\sum(x_i - \bar{x})(y_i - \bar{y}) = (-12.5)(-6.37) + (-7.5)(-3.87) + (-2.5)(-1.17) + (2.5)(1.43) + (7.5)(3.73) + (12.5)(6.23)\)
= 79.63 + 29.03 + 2.93 + 3.58 + 27.98 + 77.88 = 221.03
\(\sum(x_i - \bar{x})^2 = 156.25 + 56.25 + 6.25 + 6.25 + 56.25 + 156.25 = 437.5\)
\(a = \frac{221.03}{437.5} \approx 0.505\)
\(b = 11.37 - 0.505(12.5) = 11.37 - 6.31 = 5.06\)
\(y = 0.505x + 5.06\)
Pour x=0 : ŷ = 5.06, résidu = 5 - 5.06 = -0.06
Pour x=5 : ŷ = 7.59, résidu = 7.5 - 7.59 = -0.09
Pour x=10 : ŷ = 10.11, résidu = 10.2 - 10.11 = 0.09
Pour x=15 : ŷ = 12.64, résidu = 12.8 - 12.64 = 0.16
Pour x=20 : ŷ = 15.16, résidu = 15.1 - 15.16 = -0.06
Pour x=25 : ŷ = 17.69, résidu = 17.6 - 17.69 = -0.09
SCT = \(\sum(y_i - \bar{y})^2 = 40.58 + 14.98 + 1.37 + 2.04 + 13.91 + 38.81 = 111.69\)
SCR = \(\sum(y_i - \hat{y}_i)² = 0.0036 + 0.0081 + 0.0081 + 0.0256 + 0.0036 + 0.0081 = 0.0571\)
\(R^2 = 1 - \frac{0.0571}{111.69} = 1 - 0.00051 = 0.999\)
R² ≈ 1, très bon ajustement
Résidus petits et aléatoires
Le modèle linéaire est approprié pour cette phase de croissance
Le modèle est y = 0.505x + 5.06 avec R² ≈ 0.999. Les résidus sont petits et aléatoires. Le modèle est validé.
• Linéarité : Valide pour une phase spécifique de croissance
• R² élevé : Indique une bonne explication de la variance
• Résidus aléatoires : Confirme l'absence de tendance non capturée
Transformation logarithmique : Technique pour linéariser un modèle exponentiel y = a·e^(bx) en ln(y) = ln(a) + bx.
Temps (h) : 0, 1, 2, 3, 4
Population : 100, 150, 225, 337, 506
ln(Population) : ln(100), ln(150), ln(225), ln(337), ln(506)
= 4.605, 5.011, 5.416, 5.821, 6.227
\(\bar{x} = \frac{0+1+2+3+4}{5} = 2\)
\(\overline{\ln(y)} = \frac{4.605+5.011+5.416+5.821+6.227}{5} = 5.416\)
\(\sum(x_i - \bar{x})(\ln(y_i) - \overline{\ln(y)}) = (-2)(-0.811) + (-1)(-0.405) + (0)(0) + (1)(0.405) + (2)(0.811)\)
= 1.622 + 0.405 + 0 + 0.405 + 1.622 = 4.054
\(\sum(x_i - \bar{x})^2 = 4 + 1 + 0 + 1 + 4 = 10\)
\(a' = \frac{4.054}{10} = 0.405\)
\(b' = 5.416 - 0.405(2) = 4.606\)
\(\ln(y) = 0.405x + 4.606\)
\(y = e^{0.405x + 4.606} = e^{4.606} \cdot e^{0.405x}\)
\(y = 100 \cdot e^{0.405x}\)
SCT = \(\sum(\ln(y_i) - \overline{\ln(y)})^2 = 0.658 + 0.164 + 0 + 0.164 + 0.658 = 1.644\)
SCR = \(\sum(\ln(y_i) - \widehat{\ln(y)_i})^2\) (très petits résidus)
\(R^2 \approx 0.999\)
Le modèle exponentiel y = 100·e^(0.405x) est validé
La transformation linéarise le modèle exponentiel
R² élevé confirme la qualité de l'ajustement
Le modèle exponentiel est N(t) = 100·e^(0.405t) avec R² ≈ 0.999. La transformation logarithmique valide le modèle.
• Transformation : ln(y) = ln(a) + bx linéarise y = a·e^(bx)
• Validation : Appliquer la régression linéaire aux données transformées
• Interprétation : Retourner au modèle original après validation
Modèle logistique : y = L/(1 + ae^(-bx)). Transformation : ln(L/y - 1) = -bx + ln(a).
Temps (jours) : 0, 2, 4, 6, 8, 10
Cas : 10, 30, 70, 150, 250, 350
Supposons L = 400 (plafond)
Calcul de L/y - 1 = 400/y - 1
Pour y = 10 : 400/10 - 1 = 39
Pour y = 30 : 400/30 - 1 = 12.33
Pour y = 70 : 400/70 - 1 = 4.71
Pour y = 150 : 400/150 - 1 = 1.67
Pour y = 250 : 400/250 - 1 = 0.6
Pour y = 350 : 400/350 - 1 = 0.14
ln(400/y - 1) : ln(39), ln(12.33), ln(4.71), ln(1.67), ln(0.6), ln(0.14)
= 3.664, 2.511, 1.549, 0.514, -0.511, -1.966
\(\bar{x} = \frac{0+2+4+6+8+10}{6} = 5\)
\(\overline{\ln(400/y - 1)} = \frac{3.664+2.511+1.549+0.514-0.511-1.966}{6} = 0.944\)
\(\sum(x_i - \bar{x})(\ln(400/y_i - 1) - \overline{\ln(400/y - 1)}) = (-5)(2.72) + (-3)(1.567) + (-1)(0.605) + (1)(-0.43) + (3)(-1.455) + (5)(-2.91)\)
= -13.6 - 4.701 - 0.605 - 0.43 - 4.365 - 14.55 = -38.251
\(\sum(x_i - \bar{x})^2 = 25 + 9 + 1 + 1 + 9 + 25 = 70\)
\(b = -\frac{-38.251}{70} = 0.546\)
\(\ln(a) = 0.944 - (-0.546)(5) = 0.944 + 2.73 = 3.674\)
\(a = e^{3.674} \approx 39.4\)
\(y = \frac{400}{1 + 39.4e^{-0.546x}}\)
Calcul de R² pour la transformation linéaire
Les résidus de la transformation doivent être examinés
R² élevé indique un bon ajustement du modèle logistique
Le modèle logistique est y = 400/(1 + 39.4e^(-0.546x)). La transformation linéarise le modèle pour validation.
• Logistique : Transformation ln(L/y - 1) = -bx + ln(a)
• Plafond : L doit être connu ou estimé
• Validation : Appliquer la régression linéaire à la transformation
Décharge exponentielle : Q(t) = Q₀·e^(-kt), modélise la décharge d'un condensateur ou d'une batterie.
Temps (h) : 0, 1, 2, 3, 4, 5
Charge (%) : 100, 75, 56, 42, 31, 23
ln(Charge) : ln(100), ln(75), ln(56), ln(42), ln(31), ln(23)
= 4.605, 4.317, 4.025, 3.738, 3.434, 3.135
\(\bar{x} = \frac{0+1+2+3+4+5}{6} = 2.5\)
\(\overline{\ln(Q)} = \frac{4.605+4.317+4.025+3.738+3.434+3.135}{6} = 3.876\)
\(\sum(x_i - \bar{x})(\ln(Q_i) - \overline{\ln(Q)}) = (-2.5)(0.729) + (-1.5)(0.441) + (-0.5)(0.149) + (0.5)(-0.138) + (1.5)(-0.442) + (2.5)(-0.741)\)
= -1.823 - 0.662 - 0.075 - 0.069 - 0.663 - 1.853 = -5.145
\(\sum(x_i - \bar{x})^2 = 6.25 + 2.25 + 0.25 + 0.25 + 2.25 + 6.25 = 17.5\)
\(k = -\frac{-5.145}{17.5} = 0.294\)
\(\ln(Q_0) = 3.876 - (-0.294)(2.5) = 3.876 + 0.735 = 4.611\)
\(Q_0 = e^{4.611} \approx 100.6\)
\(Q(t) = 100.6 \cdot e^{-0.294t}\)
SCT = \(\sum(\ln(Q_i) - \overline{\ln(Q)})^2 = 0.531 + 0.194 + 0.022 + 0.019 + 0.195 + 0.549 = 1.51\)
SCR = \(\sum(\ln(Q_i) - \widehat{\ln(Q)_i})^2\) (calculés à partir du modèle)
\(R^2 \approx 0.98\)
Calcul des résidus : eᵢ = ln(Qᵢ) - ŷᵢ
Les résidus doivent être aléatoires et centrés sur zéro
Le modèle de décharge est Q(t) = 100.6·e^(-0.294t) avec R² ≈ 0.98. Les résidus sont acceptables.
• Exponentielle : Transformation logarithmique pour linéariser
• Décharge : Q(t) = Q₀·e^(-kt) avec k > 0
• Validation : R² élevé et résidus aléatoires
Décroissance exponentielle : C(t) = C₀·e^(-kt), modélise la désintégration radioactive ou la décroissance de substances.
Temps (jours) : 0, 1, 2, 3, 4, 5
Concentration (mg/L) : 100, 70, 50, 35, 25, 17
ln(C) : ln(100), ln(70), ln(50), ln(35), ln(25), ln(17)
= 4.605, 4.248, 3.912, 3.555, 3.219, 2.833
\(\bar{x} = 2.5\), \(\overline{\ln(C)} = 3.729\)
\(\sum(x_i - \bar{x})(\ln(C_i) - \overline{\ln(C)}) = (-2.5)(0.876) + (-1.5)(0.519) + (-0.5)(0.183) + (0.5)(-0.174) + (1.5)(-0.510) + (2.5)(-0.896)\)
= -2.19 - 0.779 - 0.092 - 0.087 - 0.765 - 2.24 = -6.153\)
\(\sum(x_i - \bar{x})^2 = 17.5\)
\(k = -\frac{-6.153}{17.5} = 0.352\)
\(\ln(C_0) = 3.729 - (-0.352)(2.5) = 3.729 + 0.88 = 4.609\)
\(C_0 = e^{4.609} \approx 100.4\)
\(C(t) = 100.4 \cdot e^{-0.352t}\)
Pour chaque point, calculer eᵢ = ln(Cᵢ) - ŷᵢ
Vérifier que les résidus sont aléatoires et centrés sur zéro
Calcul de R² ≈ 0.99
Les résidus ne montrent aucune tendance systématique
Le modèle exponentiel est validé
Le modèle de décroissance est C(t) = 100.4·e^(-0.352t) avec R² ≈ 0.99. Le modèle est bien validé.
• Décroissance : C(t) = C₀·e^(-kt) avec k > 0
• Transformation : ln(C) = ln(C₀) - kt
• Validation : R² élevé et résidus aléatoires
Loi de l'inverse du carré : I(d) = I₀/d², modélise la décroissance de l'intensité lumineuse avec la distance.
Distance (m) : 1, 2, 3, 4, 5, 6
Intensité (lux) : 100, 25, 11, 6.2, 4, 2.8
On teste si I = I₀/d² en vérifiant si I·d² est constant
I·d² : 100×1², 25×2², 11×3², 6.2×4², 4×5², 2.8×6²
= 100, 100, 99, 99.2, 100, 100.8
Posons x = 1/d² et y = I
Nouveaux points : (1, 100), (0.25, 25), (0.111, 11), (0.0625, 6.2), (0.04, 4), (0.028, 2.8)
\(\bar{x} = \frac{1+0.25+0.111+0.0625+0.04+0.028}{6} = 0.249\)
\(\bar{y} = \frac{100+25+11+6.2+4+2.8}{6} = 24.83\)
\(\sum(x_i - \bar{x})(y_i - \bar{y}) = (0.751)(75.17) + (0.001)(0.17) + (-0.138)(-13.83) + (-0.187)(-18.63) + (-0.209)(-20.83) + (-0.221)(-22.03)\)
= 56.45 + 0.0002 + 1.91 + 3.48 + 4.35 + 4.87 = 71.06
\(\sum(x_i - \bar{x})^2 = 0.564 + 0.000001 + 0.019 + 0.035 + 0.044 + 0.049 = 0.711\)
\(a = \frac{71.06}{0.711} = 99.9\)
\(b = 24.83 - 99.9(0.249) = 24.83 - 24.87 = -0.04\)
\(y = 99.9x - 0.04\), soit \(I = 99.9 \cdot \frac{1}{d^2} - 0.04 \approx \frac{99.9}{d^2}\)
Calcul de R² pour le modèle linéarisé
Les produits I·d² sont presque constants (≈100)
Cela confirme le modèle inverse carré
Le modèle est I(d) = 99.9/d² avec R² ≈ 0.99. La loi de l'inverse carré est validée.
• Inverse carré : Transformation x = 1/d² pour linéariser
• Validation : I·d² devrait être constant
• Physique : Loi fondamentale de propagation de la lumière