• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Mathen
    Comment trouver le coefficient de corrélation pour R dans un diagramme de dispersion

    Trouver la force de l'association entre deux variables est une compétence importante pour les scientifiques de tous types. Si deux variables sont corrélées entre elles, cela montre qu'il existe un lien entre elles. Une corrélation positive signifie que lorsqu'une variable augmente, l'autre le fait aussi, et une corrélation négative signifie que lorsqu'une variable augmente, l'autre diminue. Les corrélations ne prouvent pas la causalité, bien qu'il soit possible que d'autres tests prouvent une relation causale entre les variables. Le coefficient de corrélation R montre la force de la relation entre les deux variables, et s'il s'agit d'une corrélation positive ou négative.

    TL; DR (Trop long; N'a pas lu)

    Appel une variable x et une variable y. Calculer la valeur de R en utilisant la formule:

    R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2- (Σx) 2] [ ,null,null,3],n Σy 2- (Σy) 2]}

    Où n est la taille de votre échantillon.

    Créer une table de vos données

    Faire une table de vos données. Cela devrait inclure une colonne pour le numéro de participant, une colonne pour la première variable (étiquetée x) et une colonne pour la deuxième variable (étiquetée y). Par exemple, si vous cherchez à voir s'il existe une corrélation entre la taille et la pointure, une colonne identifierait chaque personne que vous mesurez, une colonne indiquerait la taille de chaque personne et une autre indiquerait la taille de la chaussure. Faites trois colonnes supplémentaires, une pour xy, une pour x 2 et une pour y 2.

    Calculer les valeurs pour les colonnes vides

    Utilisez vos données pour remplir les trois colonnes supplémentaires. Par exemple, imaginez votre première personne mesure 75 pouces de hauteur et a 12 pieds de taille. La colonne x (height) affichera 75, et la colonne y (shoe size) montrera 12. Vous devez trouver xy, x 2 et y 2. Donc en utilisant cet exemple:

    xy = 75 × 12 = 900

    x 2 = 75 2 = 5 625

    y 2 = 12 2 = 144

    Terminez ces calculs pour chaque personne pour qui vous avez des données.

    Trouvez la somme de chaque colonne

    Créez une nouvelle ligne au bas de votre table pour les sommes de chaque colonne. Ajouter ensemble toutes les valeurs x, toutes les valeurs y, toutes les valeurs xy, toutes les valeurs x 2 et toutes les valeurs y 2, puis placer les résultats au bas de la colonne correspondante dans votre nouvelle ligne. Vous pouvez étiqueter votre nouvelle ligne "sum" ou utiliser un symbole sigma (Σ).

    Calculer R à l'aide de la formule

    Vous trouvez R à partir de vos données en utilisant la formule:

    R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2- (Σx) 2] [nΣy 2- (Σy) 2]}

    Cela semble un peu décourageant, donc vous pouvez le diviser en deux parties, que nous appellerons s et t.

    s = n (Σxy) - (Σx) (Σy)

    t = √ {[n Σx 2- (Σx) 2] [n Σy 2- (Σy) 2]}

    Dans ces équations, n est le nombre de participants que vous avez (la taille de votre échantillon). Le reste des parties de l'équation sont les sommes que vous avez calculées dans la dernière étape. Donc pour s, multipliez la taille de votre échantillon par la somme de la colonne xy, puis soustrayez la somme de la colonne x multipliée par la somme de la colonne y de cela.

    Pour t, il y a quatre principales étapes. Tout d'abord, calculez n multiplié par la somme de votre colonne x 2, puis soustrayez la somme de votre colonne x au carré (multipliée par elle-même) de cette valeur. Deuxièmement, faites exactement la même chose mais avec la somme de la colonne y 2 et la somme de la colonne y au carré à la place des parties x (ie, n × Σy 2 - [Σy × Σy]) . Troisièmement, multipliez ces deux résultats (pour les x et y) ensemble. Quatrièmement, prenez la racine carrée de cette réponse.

    Si vous avez travaillé en parties, vous pouvez calculer R simplement R = s ÷ t. Vous obtiendrez une réponse entre -1 et 1. Une réponse positive montre une corrélation positive, tout élément supérieur à 0,7 étant généralement considéré comme une relation forte. Une réponse négative montre une corrélation négative, tout ce qui est supérieur à -0,7 étant considéré comme une relation négative forte. De même, ± 0,5 est considéré comme une relation modérée et ± 0,3 est considéré comme une relation faible. Quelque chose près de 0 montre un manque de corrélation.

    © Science http://fr.scienceaq.com