La régression linéaire est un processus en mathématiques statistiques. Il donne une mesure numérique de la force d'une relation entre des variables, dont l'une, la variable indépendante, est supposée avoir une association avec l'autre, la variable dépendante. Notez que cette relation n'est pas supposée être une relation de cause à effet - bien qu'elle puisse l'être - mais simplement une relation de corrélation.
Un exemple
Disons que vous avez une liste de coureurs sur une équipe de piste, avec leurs journaux d'entraînement individuels et les temps de course 5K. Vous pouvez supposer que le nombre de miles qu'ils parcourent à l'entraînement, M, influence leur performance 5K, T. Avec M comme variable indépendante et T comme variable dépendante, vous pouvez tracer un graphique de T vs. M et utiliser ce graphique comme une estimation visuelle de l'existence d'une relation.
La ligne de régression
Comme pour toute droite, une ligne de régression prend la forme y = ax + b, où y est la variable dépendante , a est la pente de la ligne, x est la variable indépendante et b est le point sur l'axe des y auquel la ligne la traverse.