Le test Tukey HSD ("honnêtement différence significative" ou "honnête différence significative") est un outil statistique utilisé pour déterminer si la relation entre deux ensembles de données est statistiquement significative - c'est-à-dire, s'il existe une forte probabilité qu'un changement numérique observé dans une valeur soit lié de façon causale à un changement observé dans une autre valeur. En d'autres termes, le test de Tukey est un moyen de tester une hypothèse expérimentale.
Le test de Tukey est invoqué lorsque vous devez déterminer si l'interaction entre trois variables ou plus est mutuellement statistiquement significative, ce qui n'est malheureusement pas simplement une somme ou un produit des niveaux de signification individuels.
Pourquoi pas un test t?
Les problèmes statistiques simples impliquent d'examiner les effets d'une variable (indépendante), comme le nombre d'heures étudiées par chacun l'élève d'une classe pour un test particulier, sur une seconde variable (dépendante), comme les scores de l'élève au test. Dans de tels cas, vous définissez généralement votre seuil de signification statistique à P <0,05, où l'expérience révèle une probabilité supérieure à 95% que les variables en question soient réellement liées. Ensuite, vous vous référez à une table en t qui prend en compte le nombre de paires de données dans votre expérience pour voir si votre hypothèse était correcte.
Parfois, cependant, l'expérience peut examiner plusieurs variables indépendantes ou dépendantes simultanément. Par exemple, dans l'exemple ci-dessus, les heures de sommeil de chaque élève la nuit précédant le test et sa note de classe peuvent être incluses. De tels problèmes multivariés nécessitent autre chose qu'un test t en raison du nombre absolu si les relations varient indépendamment.
L'ANOVA
ANOVA signifie "analyse de variance" et traite précisément le problème qui vient d'être décrit. Elle tient compte des degrés de liberté en expansion rapide dans un échantillon à mesure que des variables sont ajoutées. Par exemple, regarder les heures par rapport aux scores est un appariement, le sommeil par rapport aux scores en est un autre, les notes par rapport aux scores est un troisième et pendant ce temps, toutes ces variables indépendantes interagissent également les unes avec les autres.
Dans un Test ANOVA, la variable d'intérêt après l'exécution des calculs est F, qui est la variation trouvée des moyennes de toutes les paires ou groupes, divisée par la variation attendue de ces moyennes. Plus ce nombre est élevé, plus la relation est forte et la «signification» est généralement fixée à 0,95. La génération de rapports sur les résultats ANOVA nécessite généralement l'utilisation d'une calculatrice intégrée telle que celles trouvées dans Microsoft Excel ainsi que de programmes statistiques dédiés tels que SPSS.
Le test Tukey HSD
John Tukey a proposé le test qui porte son nom quand il a réalisé les pièges mathématiques d'essayer d'utiliser des valeurs de P indépendantes pour déterminer l'utilité d'une hypothèse à variables multiples dans son ensemble. À l'époque, des tests t étaient appliqués à trois groupes ou plus, et il considérait cela comme malhonnête - d'où une "différence honnêtement significative".
Ce que fait son test, c'est comparer les différences entre les moyennes des valeurs plutôt que de comparer paires de valeurs. La valeur du test de Tukey est donnée en prenant la valeur absolue de la différence entre les paires de moyennes et en la divisant par l'erreur standard de la moyenne (SE) telle que déterminée par un test ANOVA unidirectionnel. Le SE est à son tour la racine carrée de (variance divisée par la taille de l'échantillon). Un exemple de calculatrice en ligne est répertorié dans la section Ressources.
Le test de Tukey est un test post hoc dans la mesure où les comparaisons entre variables sont effectuées après que les données ont déjà été collectées. Cela diffère d'un test a priori, dans lequel ces comparaisons sont faites à l'avance. Dans le premier cas, vous pourriez regarder les temps de parcours des élèves dans trois classes physiques différentes pendant un an. Dans ce dernier cas, vous pouvez affecter des élèves à l'un des trois enseignants, puis les faire parcourir un mile chronométré.