• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Autres
    Comment trouver le coefficient de corrélation pour R dans un nuage de points

    Trouver la force de l'association entre deux variables est une compétence importante pour les scientifiques de tous types. Si deux variables sont corrélées l'une à l'autre, cela montre qu'il existe un lien entre elles. Une corrélation positive signifie que lorsqu'une variable augmente, l'autre aussi, et une corrélation négative signifie que lorsqu'une variable augmente, l'autre diminue. Les corrélations ne prouvent pas la causalité, bien qu'il soit possible que d'autres tests prouvent une relation causale entre les variables. Le coefficient de corrélation R montre la force de la relation entre les deux variables, et s'il s'agit d'une corrélation positive ou négative.

    TL; DR (Trop long; n'a pas lu)

    Appel une variable x et une variable y. Calculez la valeur de R à l'aide de la formule:

    R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2− (Σx) 2] [ , 3, [[n Σy 2− (Σy) 2]}

    Où n est la taille de votre échantillon.

    1. Créez un tableau de vos données

      Faites un tableau de vos données. Cela devrait inclure une colonne pour le numéro de participant, une colonne pour la première variable (étiquetée x) et une colonne pour la deuxième variable (étiquetée y). Par exemple, si vous cherchez à savoir s'il existe une corrélation entre la taille et la pointure, une colonne identifierait chaque personne que vous mesurez, une colonne montrerait la taille de chaque personne et une autre montrerait leur pointure. Créez trois colonnes supplémentaires, une pour xy, une pour x 2 et une pour y 2.

    2. Calculez les valeurs des colonnes vides

      Utilisez vos données pour remplir les trois colonnes supplémentaires. Par exemple, imaginez que votre première personne mesure 75 pouces de hauteur et a une taille de 12 pieds. La colonne x (hauteur) afficherait 75 et la colonne y (pointure) afficherait 12. Vous devez trouver xy, x 2 et y 2. Donc, en utilisant cet exemple:

      xy \u003d 75 × 12 \u003d 900

      x 2 \u003d 75 2 \u003d 5,625

      y 2 \u003d 12 2 \u003d 144

      Effectuez ces calculs pour chaque personne pour laquelle vous avez des données.

    3. Trouvez la somme de chaque colonne

      Créez une nouvelle ligne sur le bas de votre tableau pour les sommes de chaque colonne. Additionnez toutes les valeurs x, toutes les valeurs y, toutes les valeurs xy, toutes les valeurs x 2 et toutes les valeurs y 2, puis placez les résultats au bas de la colonne correspondante dans votre nouvelle ligne. Vous pouvez étiqueter votre nouvelle ligne «somme» ou utiliser un symbole sigma (Σ).

    4. Calculer R en utilisant la formule

      Vous trouvez R à partir de vos données en utilisant la formule:

      R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2− (Σx) 2] [nΣy 2− (Σy) 2]}

      Cela semble un peu intimidant, vous pouvez donc le diviser en deux parties, que nous appellerons s et t.

      s \u003d n (Σxy) - (Σx) ( Σy)

      t \u003d √ {[n Σx 2− (Σx) 2] [n Σy 2− (Σy) 2]}

      Dans ces équations, n est le nombre de participants que vous avez (la taille de votre échantillon). Le reste des parties de l'équation sont les sommes que vous avez calculées à la dernière étape. Donc pour s, multipliez la taille de votre échantillon par la somme de la colonne xy, puis soustrayez la somme de la colonne x multipliée par la somme de la colonne y.

      Pour t, il y a quatre principales étapes. Tout d'abord, calculez n multiplié par la somme de votre colonne x 2, puis soustrayez la somme de votre colonne x au carré (multipliée par elle-même) de cette valeur. Deuxièmement, faites exactement la même chose, mais avec la somme de la colonne y 2 et la somme de la colonne y au carré à la place des x parties (c'est-à-dire, n × Σy 2 - [Σy × Σy]) . Troisièmement, multipliez ces deux résultats (pour les x et les y) ensemble. Quatrièmement, prenez la racine carrée de cette réponse.

      Si vous avez travaillé en plusieurs parties, vous pouvez calculer R simplement R \u003d s ÷ t. Vous obtiendrez une réponse entre -1 et 1. Une réponse positive montre une corrélation positive, tout ce qui dépasse 0,7 étant généralement considéré comme une relation forte. Une réponse négative montre une corrélation négative, tout ce qui dépasse −0,7 étant considéré comme une forte relation négative. De même, ± 0,5 est considéré comme une relation modérée et ± 0,3 est considéré comme une relation faible. Tout ce qui est proche de 0 montre un manque de corrélation.

    © Science https://fr.scienceaq.com