La détermination de la véracité d'un paramètre ou d'une hypothèse telle qu'elle s'applique à une grande population peut être impossible ou impossible pour un certain nombre de raisons, il est donc courant de la déterminer pour un plus petit groupe, appelé échantillon. Une taille d'échantillon trop petite réduit la puissance de l'étude et augmente la marge d'erreur, ce qui peut rendre l'étude vide de sens. Les chercheurs peuvent être contraints de limiter la taille de l'échantillonnage pour des raisons économiques et autres. Pour garantir des résultats significatifs, ils ajustent généralement la taille de l'échantillon en fonction du niveau de confiance et de la marge d'erreur requis, ainsi que de l'écart attendu entre les résultats individuels.
La petite taille de l'échantillon diminue la puissance statistique
La puissance de une étude est sa capacité à détecter un effet quand il y en a un à détecter. Cela dépend de la taille de l'effet car les effets importants sont plus faciles à remarquer et augmentent la puissance de l'étude.
La puissance de l'étude est également une mesure de sa capacité à éviter les erreurs de type II. Une erreur de type II se produit lorsque les résultats confirment l'hypothèse sur laquelle l'étude était fondée alors qu'en fait, une autre hypothèse est vraie. Une taille d'échantillon trop petite augmente la probabilité d'une erreur de type II faussant les résultats, ce qui diminue la puissance de l'étude.
Calcul de la taille de l'échantillon
Pour déterminer une taille d'échantillon qui fournira le plus significatif résultats, les chercheurs déterminent d'abord la marge d'erreur préférée (ME) ou le montant maximum qu'ils souhaitent que les résultats s'écartent de la moyenne statistique. Il est généralement exprimé en pourcentage, en plus ou moins 5%. Les chercheurs ont également besoin d'un niveau de confiance, qu'ils déterminent avant de commencer l'étude. Ce nombre correspond à un score Z, qui peut être obtenu à partir des tableaux. Les niveaux de confiance communs sont de 90%, 95% et 99%, ce qui correspond aux scores Z de 1,645, 1,96 et 2,576 respectivement. Les chercheurs expriment le standard d'écart attendu (ET) dans les résultats. Pour une nouvelle étude, il est courant de choisir 0,5.
Après avoir déterminé la marge d'erreur, le score Z et le standard d'écart, les chercheurs peuvent calculer la taille idéale de l'échantillon en utilisant la formule suivante:
(Z-score) 2 x SD x (1-SD) /ME 2 \u003d Taille de l'échantillon Dans la formule, la taille de l'échantillon est directement proportionnelle au score Z et inversement proportionnelle à la marge d'erreur. Par conséquent, la réduction de la taille de l'échantillon réduit le niveau de confiance de l'étude, qui est lié au score Z. La diminution de la taille de l'échantillon augmente également la marge d'erreur. En bref, lorsque les chercheurs sont contraints à une petite taille d'échantillon pour des raisons économiques ou logistiques, ils peuvent avoir à se contenter de résultats moins concluants. Que ce soit ou non un problème important dépend en fin de compte de l'ampleur de l'effet qu'ils étudient. Par exemple, une petite taille d'échantillon donnerait des résultats plus significatifs dans un sondage auprès des personnes vivant à proximité d'un aéroport qui sont affectées négativement par le trafic aérien que dans un sondage sur leurs niveaux d'éducation.
Effets de la petite taille de l'échantillon