Un échantillon moyen est la moyenne d'un ensemble de données. Les moyennes des échantillons sont importantes en ce qu'elles peuvent donner une idée de la tendance centrale, c'est-à-dire une idée de la tendance générale d'un ensemble de nombres. Grâce à l'analyse statistique utilisant la moyenne de l'échantillon, les statisticiens peuvent calculer des éléments tels que l'écart-type et la variance. La moyenne de l'échantillon peut être utilisée dans des contextes tels que les salles de classe pour déterminer le score moyen d'un test, ou au baseball pour déterminer la moyenne au bâton d'un joueur.
Déterminer l'ensemble de données. Cela peut être presque n'importe quoi - un ensemble de hauteurs, poids, salaires ou le montant des factures d'épicerie, par exemple.
Considérons le cas d'un gestionnaire qui tente de décider de placer une annonce dans un journal local ou un national pour une ouverture d'emploi. Pour ce faire, il serait utile de savoir si les personnes travaillant dans l'entreprise sont nées à proximité ou sont venues de loin. Si vous voulez déterminer la distance moyenne entre les lieux de naissance de vos collègues et le lieu de travail, vous collecterez d'abord les données. Ce pourrait être une liste composée des distances suivantes: 44 milles, 17 milles, 522 milles, 849 milles, 71 milles, 64 milles, 486 milles et 235 milles.
Additionnez les nombres dans l'ensemble de données.
Pour l'exemple des distances, vous devez ajouter 44 + 17 + 522 + 849 + 71 + 64 + 486 + 235, ce qui correspond à 2288 miles.
Diviser la somme des données par le nombre d'entrées dans l'ensemble de données.
Dans l'exemple, vous avez huit nombres dans votre ensemble de données, donc vous divisez la somme de 2288 miles par 8, ce qui vous donne 286 miles.
Bien que la moyenne soit souvent un nombre très utile pour représenter un ensemble de données, vous pouvez également trouver d'autres mesures de tendance centrale utiles. Par exemple, la médiane est la valeur exactement à mi-chemin entre le plus bas et le plus haut dans l'ensemble de données. Une autre mesure est le mode. C'est la valeur la plus courante dans un ensemble de données. L'utilisation du mode aidera à donner une valeur qui n'est pas faussée par quelques valeurs très hautes ou très basses. Dans une distribution normale, c'est-à-dire une courbe en cloche parfaite, la moyenne, la médiane et le mode seront tous les mêmes. C'est quand une distribution est biaisée qu'ils diffèrent, et ensuite vous devez faire attention à ce que vous recherchez exactement et choisissez votre mesure en conséquence.