Une équation de régression linéaire modélise la ligne générale des données pour montrer la relation entre les variables x et y. De nombreux points des données réelles ne seront pas sur la ligne. Les valeurs aberrantes sont des points qui sont très éloignés des données générales et qui sont généralement ignorés lors du calcul de l'équation de régression linéaire. Il est possible de trouver l'équation de régression linéaire en traçant une ligne de meilleur ajustement, puis en calculant l'équation pour cette droite.
Tracez les points. Dessinez un graphique des points de l'ensemble donné.
Dessinez une ligne qui correspond le mieux aux données. Regardez les données et décidez si elles sont ascendantes ou descendantes dans l'ensemble, puis placez une ligne la plus proche du plus grand nombre de points. Par exemple, étant donné les points {(2,3) (5,7) (1,2) (4,8)}, l'équation de régression linéaire sera ascendante, ou en d'autres termes, les points vont généralement monter de de gauche à droite sur le graphique.
Calculez l'équation de la ligne. Choisissez deux points sur la ligne pour calculer la pente avec et notez l'ordonnée à l'origine. Sur la ligne de meilleur ajustement pour les points {(2,3) (5,7) (1,2) (4,8)}, un point est (0,5,1,25) et un autre est l'ordonnée à l'origine (0, 0,5). Utilisez la formule de la pente d'une ligne, m = (y2 - y1) /(x2 - x1), pour trouver la pente. En branchant les valeurs de points, m = (0,5 - 1,25) /(0 - 0,5) = 1,5. Donc, avec l'ordonnée à l'origine et la pente, l'équation de régression linéaire peut être écrite comme y = 1.5x + 0.5.