L'un des outils les plus élémentaires pour l'ingénierie ou l'analyse scientifique est la régression linéaire. Cette technique commence avec un ensemble de données dans deux variables. La variable indépendante est généralement appelée "x" et la variable dépendante est généralement appelée "y". Le but de la technique est d'identifier la ligne, y = mx + b, qui se rapproche de l'ensemble de données. Cette ligne de tendance peut montrer, graphiquement et numériquement, les relations entre les variables dépendantes et indépendantes. À partir de cette analyse de régression, une valeur de corrélation est également calculée.
Identifiez et séparez les valeurs x et y de vos points de données. Si vous utilisez une feuille de calcul, entrez-les dans des colonnes adjacentes. Il devrait y avoir le même nombre de valeurs x et y. Si ce n'est pas le cas, le calcul sera inexact ou la fonction de feuille de calcul renverra une erreur. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Calculer la valeur moyenne pour les valeurs x et y en divisant la somme de toutes les valeurs par le nombre total de valeurs de l'ensemble. Ces moyennes seront appelées «x_avg» et «y_avg». X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) /7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) /7 = 5
Créez deux nouveaux ensembles de données en soustrayant la valeur x_avg de chaque valeur x et la valeur y_avg de chaque valeur y. X1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
Multiplie chaque valeur de x1 par chaque valeur de y1, dans l'ordre: x1y1 = (0 * -3, -1 * -2, 5 * 4, ...) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Place chaque valeur x1 x1 ^ 2 = (0 ^ 2 , 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
Calculer les sommes des valeurs x1y1 et x1 ^ 2 valeurs sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Diviser "sum_x1y1" par " sum_x1 ^ 2 "pour obtenir le coefficient de régression sum_x1y1 /sum_x1 ^ 2 = 11/36 = 0.306
TL; DR (trop long; n'a pas lu)
Pour ceux qui préfèrent travailler directement avec l'équation, je t est m = somme [(x_i - x_avg) (y_i - y_avg)] /somme [(x_i - x_avg) ^ 2].
Beaucoup de tableurs auront une variété de fonctions de régression linéaire. Dans Microsoft Excel, vous pouvez utiliser la fonction "Pente" pour prendre la moyenne des colonnes x et y, et la feuille de calcul effectuera automatiquement tous les calculs restants.