Les analyses bivariées et multivariées sont des méthodes statistiques pour étudier les relations entre les échantillons de données. L'analyse bivariée examine deux ensembles de données appariés, étudiant s'il existe une relation entre eux. L'analyse multivariée utilise au moins deux variables et analyses qui, le cas échéant, sont corrélées avec un résultat spécifique. L'objectif dans ce dernier cas est de déterminer quelles variables influencent ou provoquent le résultat.
Analyse bivariée
L'analyse bivariée étudie la relation entre deux ensembles de données, avec une paire d'observations tirées d'un seul échantillon ou individu . Cependant, chaque échantillon est indépendant. Vous analysez les données à l'aide d'outils tels que les tests t et les tests du chi carré, pour voir si les deux groupes de données sont en corrélation. Si les variables sont quantitatives, vous les représentez généralement sur un nuage de points. L'analyse bivariée examine également la force de toute corrélation.
Exemples d'analyse bivariée
Un exemple d'analyse bivariée est une équipe de recherche qui enregistre l'âge du mari et de la femme dans un mariage unique. Ces données sont appariées parce que les deux âges proviennent du même mariage, mais indépendantes car l'âge d'une personne ne cause pas l'âge d'une autre personne. Vous tracez les données pour montrer une corrélation: les maris plus âgés ont des femmes plus âgées. Un deuxième exemple est l'enregistrement des mesures de la force de préhension et de la force des bras des individus. Les données sont appariées car les deux mesures proviennent d'une seule personne, mais indépendantes car différents muscles sont utilisés. Vous tracez des données provenant de nombreuses personnes pour montrer une corrélation: les personnes avec une force de préhension plus élevée ont une force de bras plus élevée.
Analyse multivariée
L'analyse multivariée examine plusieurs variables pour voir si une ou plusieurs d'entre elles sont prédictives d'un certain résultat. Les variables prédictives sont des variables indépendantes et le résultat est la variable dépendante. Les variables peuvent être continues, ce qui signifie qu'elles peuvent avoir une plage de valeurs, ou elles peuvent être dichotomiques, ce qui signifie qu'elles représentent la réponse à une question oui ou non. L'analyse de régression multiple est la méthode la plus couramment utilisée dans l'analyse multivariée pour trouver des corrélations entre les ensembles de données. D'autres incluent la régression logistique et l'analyse multivariée de la variance.
Exemple d'analyse multivariée
L'analyse multivariée a été utilisée par des chercheurs dans une étude du Journal of Pediatrics de 2009 pour déterminer si des événements négatifs de la vie, l'environnement familial, la violence familiale, les médias la violence et la dépression sont des prédicteurs de l'agression et de l'intimidation des jeunes. Dans ce cas, les événements négatifs de la vie, l'environnement familial, la violence familiale, la violence médiatique et la dépression étaient les variables prédictives indépendantes, et l'agressivité et l'intimidation étaient les variables de résultat dépendantes. Plus de 600 sujets, âgés en moyenne de 12 ans, ont reçu des questionnaires pour déterminer les variables prédictives de chaque enfant. Une enquête a également déterminé les variables de résultats pour chaque enfant. Des équations de régression multiples et une modélisation d'équations structurelles ont été utilisées pour étudier l'ensemble de données. Les événements négatifs de la vie et la dépression se sont révélés être les prédicteurs les plus puissants de l'agression des jeunes.