Expérimentation des tests de prédiction. Ces prédictions sont souvent numériques, ce qui signifie que, lorsque les scientifiques collectent des données, ils s'attendent à ce que les chiffres se décomposent d'une certaine manière. Les données du monde réel correspondent rarement exactement aux prédictions des scientifiques, les scientifiques ont besoin d'un test pour leur dire si la différence entre les nombres observés et attendus est due au hasard ou à un facteur imprévu qui forcera le scientifique à ajuster la théorie sous-jacente. . Un test du khi-deux est un outil statistique que les scientifiques utilisent à cette fin.
Le type de données requis
Vous avez besoin de données catégoriques pour utiliser un test du khi-deux. Un exemple de données catégoriques est le nombre de personnes ayant répondu à une question «oui» par rapport au nombre de personnes ayant répondu à la question «non» (deux catégories) ou le nombre de grenouilles dans une population verte, jaune ou grise ( trois catégories). Vous ne pouvez pas utiliser un test du chi carré sur des données continues, comme cela pourrait être le cas dans un sondage demandant aux gens de mesurer leur taille. D'une telle enquête, vous obtiendriez un large éventail de hauteurs. Toutefois, si vous divisez les hauteurs en catégories telles que «moins de 6 pieds de haut» et «6 pieds de haut et plus», vous pouvez alors utiliser un test du chi carré sur les données.
La bonté-de- Test d'adéquation
Un test d'adéquation est un test courant, et peut-être le plus simple, effectué à l'aide de la statistique du khi-deux. Dans un test d'adéquation, la scientifique fait une prédiction spécifique sur les nombres qu'elle s'attend à voir dans chaque catégorie de ses données. Elle collecte ensuite des données du monde réel - appelées données observées - et utilise le test du chi carré pour voir si les données observées correspondent à ses attentes.
Par exemple, imaginez qu'un biologiste étudie les modèles d'héritage dans un espèce de grenouille. Parmi les 100 descendants d'un ensemble de parents de grenouilles, le modèle génétique du biologiste l'amène à s'attendre à 25 descendants jaunes, 50 descendants verts et 25 descendants gris. Ce qu'elle observe réellement est 20 progéniture jaune, 52 progéniture verte et 28 progéniture grise. Sa prédiction est-elle soutenue ou son modèle génétique est-il incorrect? Elle peut utiliser un test du chi carré pour le savoir.
Calculer la statistique du chi carré
Commencez à calculer la statistique du chi carré en soustrayant chaque valeur attendue de sa valeur observée correspondante et en la mettant au carré résultat. Le calcul de l'exemple de la progéniture de grenouille ressemblerait à ceci:
jaune = (20 - 25) ^ 2 = 25 vert = (52 - 50) ^ 2 = 4 gris = (28 - 25) ^ 2 = 9
Maintenant, divisez chaque résultat par sa valeur attendue correspondante.
jaune = 25 ÷ 25 = 1 vert = 4 ÷ 50 = 0,08 gris = 9 ÷ 25 = 0,36
Enfin, additionner les réponses de l'étape précédente.
chi-carré = 1 + 0.08 + 0.36 = 1.44
Interpréter la statistique du chi-carré
Le chi La statistique -square vous indique la différence entre vos valeurs observées et vos valeurs prédites. Plus le nombre est élevé, plus la différence est grande. Vous pouvez déterminer si la valeur de votre khi-deux est trop élevée ou trop faible pour soutenir votre prédiction en vérifiant si elle est inférieure à une certaine valeur critique sur une table de distribution du khi-carré. Cette table correspond aux valeurs du chi-carré avec des probabilités, appelées p-values. Plus précisément, le tableau vous indique la probabilité que les différences entre vos valeurs observées et attendues sont simplement dues au hasard ou à la présence d'un autre facteur. Pour un test d'adéquation, si la valeur p est inférieure ou égale à 0,05, vous devez rejeter votre prédiction.
Vous devez déterminer les degrés de liberté (df) dans vos données avant de pouvoir rechercher la valeur critique du khi-deux dans une table de distribution. Les degrés de liberté sont calculés en soustrayant 1 du nombre de catégories dans vos données. Il y a trois catégories dans cet exemple, donc il y a 2 degrés de liberté. Un coup d'œil sur cette table de distribution du khi-carré vous indique que, pour 2 degrés de liberté, la valeur critique pour une probabilité de 0,05 est 5,99. Cela signifie que tant que votre valeur chi-deux calculée est inférieure à 5,99, vos valeurs attendues, et donc la théorie sous-jacente, sont valides et supportées. Puisque la statistique du khi carré pour les données sur la progéniture de grenouille était de 1,44, le biologiste peut accepter son modèle génétique.