Par Thomas BourdinMise à jour le 30 août 2022
Tevarak/iStock/GettyImages
La régression linéaire est la pierre angulaire de l'analyse statistique, nous permettant d'estimer la relation entre une variable prédictive x et une variable de réponse y en utilisant l'équation y = mx + b . Bien que la ligne ajustée capture souvent la tendance sous-jacente, elle traverse rarement parfaitement chaque point de données. Les écarts qui en résultent, appelés résidus, introduisent une incertitude dans nos estimations de paramètres, en particulier la pente m . L'erreur standard de la pente quantifie cette incertitude, permettant des intervalles de confiance et des tests d'hypothèses.
SSR est la somme des carrés des différences entre les y observés valeurs et les valeurs prédites par la ligne ajustée. Par exemple, si les valeurs observées sont de 2,7, 5,9 et 9,4 et que le modèle prédit 3, 6 et 9, les carrés des résidus sont respectivement de 0,09, 0,01 et 0,16. En les additionnant, vous obtenez un SSR de 0,26.
Divisez le SSR par les degrés de liberté, qui correspondent au nombre d'observations moins deux (pour la pente et l'origine). Dans l'exemple, avec trois observations, le diviseur est 1, ce qui donne une estimation de la variance de 0,26. Appelez cette valeur A .
La racine carrée de A (√0,26) est égal à 0,51. Cette valeur représente l'écart type des résidus et sera utilisée dans le calcul final.
x
L'ESS mesure la variabilité de la variable prédictive autour de sa moyenne. Pour x valeurs de 1, 2 et 3, la moyenne est 2. En soustrayant la moyenne et en mettant au carré chaque différence, on obtient 1, 0 et 1, dont la somme est 2. Ainsi, ESS =2.
La racine carrée de ESS (√2) est 1,41. Désignons cela par B .
Divisez la racine carrée de l'estimation de la variance (étape 3) par la racine carrée de l'ESS (étape 5) :0,51 ÷ 1,41 =0,36. Cette valeur — 0,36 — est l'erreur standard de la pente.
Pour les ensembles de données volumineux, automatisez le calcul pour éviter les erreurs manuelles et gagner du temps.