• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Mathen
    Comment calculer une matrice de corrélation

    La corrélation (r) est une mesure de la relation linéaire entre deux variables. Par exemple, la longueur des jambes et la longueur du torse sont fortement corrélées; la hauteur et le poids sont moins fortement corrélés, et la hauteur et la longueur du nom (en lettres) ne sont pas corrélées.

    Une corrélation positive parfaite: r = 1. (Quand l'un monte, l'autre monte) Une corrélation négative parfaite: r = -1 (Quand l'un monte, l'autre descend) Aucune corrélation: r = 0 (Il n'y a pas de relation linéaire)

    Une matrice de corrélation est une matrice de plusieurs corrélations.

    Calcul d'une matrice de corrélation avec R

    Récupère les données. Si vos données sont dans Excel, la méthode la plus simple consiste à les enregistrer sous forme de fichier .csv (Dans Excel 7, cliquez sur "Fichier", puis sur "Enregistrer sous", puis sur "Autres formats". jusqu'à CSV (valeurs séparées par des virgules) Chaque ligne doit avoir des données sur un sujet, et chaque colonne doit être une variable.

    Lire les données dans R en utilisant read.csv Par exemple, si vos données sont en "c: \\ mydisk \\ mydir \\ data.csv" entrez mydata < - read.csv ("c: /mydisk/mydir/data.csv").

    Calculez la matrice de corrélation en utilisant cor (). Par exemple: cor (mydata) Ou vous pouvez stocker la matrice de corrélation en tant qu'objet pour une utilisation ultérieure, en utilisant: cormat < - cor (mydata).

    Calculer une matrice de corrélation avec SAS

    Obtenir les données SAS peut lire les données dans de nombreux formats Si vous stockez vos données dans Excel, ayez un sujet sur chaque ligne et une variable dans chaque colonne

    Lisez les données dans SAS. Cliquez sur "Fichier", puis sur "Importer des données", puis choisissez un type de données à l'aide du menu déroulant. nu. Cliquez sur "Suivant" et accédez à vos données, puis cliquez sur "Terminer".

    Calculez la matrice de corrélation. Si vos données sont enregistrées dans SAS en tant que données, avec les variables VAR1, VAR2 et VAR3, alors tapez: PROC CORR data = mydata; VAR var1 var2 var3; RUN;

    Astuce

    Dans SAS et R, il existe des options pour différents types de corrélations (par exemple, Pearson &Spearman &#;. Rappelez-vous que les corrélations ne trouvent que des relations linéaires. Si la relation entre deux corrélations n'est pas linéaire, les corrélations ne sont pas un bon choix. Pour obtenir plus d'aide sur R, démarrez R, puis tapez? Cor.

    Avertissement

    Si la deuxième référence ci-dessous (R Help) ne fonctionne pas, lancez R et tapez? Cor

    © Science https://fr.scienceaq.com