Le coefficient de corrélation, ou r, se situe toujours entre -1 et 1 et évalue la relation linéaire entre deux ensembles de points de données tels que x et y. Vous pouvez calculer le coefficient de corrélation en divisant la somme corrigée de l'échantillon, ou S, de carrés pour (x fois y) par la racine carrée de la somme corrigée de l'échantillon de x2 fois y2. Dans la forme de l'équation, cela signifie: Sxy /[√ (Sxx * Syy)].
Calcul de la somme corrigée de l'échantillon
Vous dérivez S en mettant au carré la somme de vos points de données, divisant par le nombre total de points de données, puis soustrayant cette valeur de la somme des points de données au carré. Par exemple, pour un ensemble de x points de données: 3, 5, 7 et 9, vous devez calculer la valeur Sxx en ajustant d'abord chaque point, puis en ajoutant ces carrés, ce qui donne 164. Ensuite, soustrayez de cette valeur le carré somme de ces points de données divisée par le nombre de points de données, ou (24 * 24) /4, ce qui équivaut à 144. Cela donne Sxx = 20. Étant donné un ensemble de points de données y: 2, 4, 6 et 10, vous procéderait de la même manière pour calculer Syy = 156 - [(22 * 22) /4], ce qui équivaut à 35, et Sxy = 158 - [(24 * 22) /4], ce qui équivaut à 26.
Calcul final du coefficient de corrélation
Vous pouvez ensuite insérer les valeurs établies pour Sxx, Syy et Sxy dans l'équation Sxy /[√ (Sxx * Syy)]. En utilisant les valeurs ci-dessus, cela donne 26 /[√ (20 * 35)], ce qui équivaut à 0,983. Puisque cette valeur est très proche de 1, cela suggère une forte relation linéaire entre ces deux ensembles de données.