La taille de l'échantillon représente le nombre d'observations effectuées pour effectuer une analyse statistique. La taille des échantillons peut être composée de personnes, d'animaux, de lots d'aliments, de machines, de piles ou de toute autre population évaluée.
Échantillonnage aléatoire
L'échantillonnage aléatoire est une méthode de collecte d'échantillons aléatoires population afin d'estimer l'information sur la population sans être biaisée. Par exemple, si vous voulez savoir quel type de personnes vivent dans une certaine ville, vous devez interviewer /mesurer différentes personnes au hasard. Cependant, si vous utilisiez tout le monde de la bibliothèque, vous n'auriez pas une estimation juste /impartiale de ce que sont la population générale qui occupe la ville, juste les gens qui vont à la bibliothèque.
Précision
>
À mesure que la taille des échantillons augmente, les estimations deviennent plus précises. Par exemple, si nous sélectionnions au hasard 10 hommes adultes, nous pourrions trouver leur taille moyenne à 6 pieds-3 pouces, peut-être parce qu'il y a un joueur de basketball qui gonfle notre estimation. Si, par contre, nous mesurions deux millions d'hommes mâles adultes, nous aurions un meilleur prédicteur de la taille moyenne des mâles car les extrêmes s'équilibreraient et la moyenne réelle éclipserait toute déviation par rapport à la moyenne.
Intervalles de confiance
Quand un statisticien fait une prédiction sur un résultat, il construit souvent un intervalle autour de son estimation. Par exemple, si nous mesurons le poids de 100 femmes, nous pourrions dire que nous sommes convaincus à 90 p. 100 que le poids moyen réel des femmes se situe entre 103 et 129 livres. (Ceci, bien sûr, dépend d'autres facteurs comme la variabilité des mesures.) Lorsque la taille de l'échantillon augmente, nous devenons plus confiants quant à notre estimation, et nos intervalles deviennent plus petits. Par exemple, avec un million de femmes, nous pouvons dire que nous sommes confiants à 98% que le poids moyen réel des femmes se situe entre 115 et 117 livres. En d'autres termes, lorsque la taille de l'échantillon augmente, notre confiance dans nos mesures augmente et la taille de nos intervalles de confiance diminue.
Erreur standard
La variation est une mesure de la propagation des données autour de la moyenne . L'écart-type est la racine carrée de la variation et permet d'estimer quel pourcentage de la population se situe entre une plage de valeurs relative à la moyenne. À mesure que la taille de l'échantillon augmente, l'erreur type, qui dépend de l'écart-type et de la taille de l'échantillon, diminue. Par conséquent, les estimations augmentent en précision et la recherche basée sur ces estimations est considérée comme plus fiable (avec moins de risque d'erreur).
Difficulté à utiliser de plus grandes tailles d'échantillons
De plus grandes tailles d'échantillons produisent évidemment des estimations précises sur les populations, mais il y a plusieurs problèmes avec les chercheurs qui utilisent des échantillons de plus grande taille. Tout d'abord, il peut être difficile de trouver un échantillon aléatoire de personnes désireuses d'essayer un nouveau médicament. Lorsque vous le faites, il devient plus coûteux de fournir le médicament à plus de gens et de surveiller plus de gens au fil du temps. De plus, il faut plus d'efforts pour obtenir et maintenir une taille d'échantillon plus grande. Même si des échantillons de plus grande taille produisent des statistiques plus précises, le coût et l'effort supplémentaires ne sont pas toujours nécessaires, car des tailles d'échantillon plus petites peuvent également produire des résultats significatifs.