La taille de l'échantillon est un compte des échantillons individuels ou des observations dans n'importe quel contexte statistique, comme une expérience scientifique ou un sondage d'opinion publique. Bien que ce soit un concept relativement simple, le choix de la taille de l'échantillon est une détermination cruciale pour un projet. Un échantillon trop petit donne des résultats peu fiables, alors qu'un échantillon trop volumineux demande beaucoup de temps et de ressources.
TL; DR (trop long; pas lu)
La taille de l'échantillon est un comptage direct du nombre d'échantillons mesurés ou d'observations effectuées.
Définition de la taille de l'échantillon
La taille de l'échantillon mesure le nombre d'échantillons individuels mesurés ou d'observations utilisées dans une enquête ou une expérience. Par exemple, si vous testez 100 échantillons de sol pour détecter des pluies acides, la taille de votre échantillon est de 100. Si un sondage en ligne a renvoyé 30 500 questionnaires remplis, la taille de votre échantillon est de 30 500. En statistique, la taille de l'échantillon est généralement représentée par la variable «n».
Calcul de la taille de l'échantillon
Pour déterminer la taille de l'échantillon nécessaire à une expérience ou à un sondage, les chercheurs prennent un certain nombre de facteurs en compte. Tout d'abord, la taille totale de la population étudiée doit être considérée - une enquête qui cherche à tirer des conclusions sur l'ensemble de l'État de New York, par exemple, nécessitera une taille d'échantillon beaucoup plus grande que celle spécifiquement axée sur Rochester. Les chercheurs devront également prendre en compte la marge d'erreur, la fiabilité que les données recueillies sont généralement exactes; et le niveau de confiance, la probabilité que votre marge d'erreur soit exacte. Enfin, les chercheurs doivent tenir compte de l'écart type qu'ils s'attendent à voir dans les données. L'écart-type mesure la quantité de données individuelles par rapport aux données moyennes mesurées. Par exemple, les échantillons de sol d'un parc auront probablement un écart-type beaucoup plus petit dans leur teneur en azote que les sols recueillis dans tout un comté.
Dangers de petite taille d'échantillon
De grandes tailles d'échantillon sont nécessaire pour qu'une statistique soit précise et fiable, en particulier si ses résultats doivent être extrapolés à une plus grande population ou à un groupe de données. Supposons que vous meniez un sondage sur l'exercice et que vous ayez interrogé cinq personnes, dont deux ont déclaré courir un marathon chaque année. Si vous prenez cette enquête pour représenter la population du pays dans son ensemble, alors, selon votre recherche, 40% des gens courent au moins un marathon par an - un pourcentage étonnamment élevé. Plus la taille de votre échantillon est petite, plus les points aberrants> - éléments de données inhabituels - sont susceptibles de fausser vos résultats. Taille de l'échantillon et marge d'erreur L'échantillon La taille d'une enquête statistique est également directement liée à la marge d'erreur de l'enquête. La marge d'erreur est un pourcentage qui exprime la probabilité que les données reçues soient exactes. Par exemple, dans une enquête sur les croyances religieuses, la marge d'erreur est le pourcentage de répondants qui peuvent fournir la même réponse si le sondage était répété. Pour déterminer la marge d'erreur, divisez 1 par la racine carrée de la taille de l'échantillon, puis multipliez par 100 pour obtenir un pourcentage. Par exemple, un échantillon de 2 400 aura une marge d'erreur de 2,04%.