Par Jon Zamboni | Mis à jour le 30 août 2022
ALFSnaiper/iStock/GettyImages
En recherche, le nombre d'observations, souvent noté n - est essentiel pour des résultats fiables. Un échantillon plus grand donne une image plus claire de la population, réduit l'influence des données anormales et réduit la marge d'erreur.
Les échantillons de grande taille donnent des moyennes plus précises, mettent en évidence les véritables valeurs aberrantes et réduisent les intervalles de confiance, ce qui rend les résultats plus fiables.
La taille de l'échantillon fait référence au nombre de points de données collectés dans le cadre d'une enquête ou d'une expérience. Par exemple, tester 100 échantillons d’eau de mer pour détecter les résidus d’hydrocarbures signifie une taille d’échantillon de 100 ; interroger 20 000 personnes sur l’anxiété donne un échantillon de 20 000 personnes. Alors que des échantillons plus volumineux nécessitent plus de ressources, le résultat est des données plus riches et plus robustes.
Le calcul de la moyenne (la moyenne arithmétique) devient plus précis à mesure que n grandit. Pensez à mesurer la taille :avec 40 participants, la moyenne pourrait être de 5 pieds 4 pouces, mais avec 100 participants, elle pourrait passer à 5 pieds 3 pouces, offrant une estimation plus représentative. Un ensemble de données plus vaste expose également de véritables valeurs aberrantes (des valeurs qui s'écartent nettement de la moyenne), fournissant ainsi des informations précieuses pour une enquête plus approfondie.
Les petits échantillons sont vulnérables aux résultats faussés. Sonder seulement quatre personnes sur leur affiliation politique et trouver un électeur indépendant suggérerait à tort que 25 % de la population est indépendante. L'élargissement de l'échantillon dilue l'impact de ces anomalies, garantissant ainsi que les statistiques reflètent la réalité.
La taille de l’échantillon influence directement la marge d’erreur d’une statistique. Pour les questions binaires (par exemple, possession d'une voiture), la marge d'erreur est d'environ 100÷√n . Un échantillon de 100 donne une marge de 10 %. Pour les mesures continues (par exemple la hauteur), multipliez ce chiffre par deux fois l'écart type pour capturer la variabilité. Dans tous les cas, un n plus grand réduit la marge, renforçant la confiance dans les résultats.