Les statistiques consistent à tirer des conclusions face à l'incertitude. Chaque fois que vous prenez un échantillon, vous ne pouvez pas être absolument certain que votre échantillon reflète vraiment la population dont il est issu. Les statisticiens gèrent cette incertitude en tenant compte des facteurs qui pourraient avoir une incidence sur l'estimation, en quantifiant leur incertitude et en effectuant des tests statistiques pour tirer des conclusions de ces données incertaines.
Les statisticiens utilisent des intervalles de confiance pour spécifier une plage de valeurs qui est susceptibles de contenir la «vraie» moyenne de la population sur la base d'un échantillon et d'exprimer leur niveau de certitude à cet égard par le biais des niveaux de confiance. Bien que le calcul des niveaux de confiance ne soit pas souvent utile, le calcul des intervalles de confiance pour un niveau de confiance donné est une compétence très utile.
TL; DR (Trop long; n'a pas lu)
Calculer un intervalle de confiance pour un niveau de confiance donné en multipliant l'erreur standard par le score Z Répétez le même processus mais avec le score t Trouvez un niveau de confiance pour un ensemble de données en prenant la moitié de la taille de l'intervalle de confiance, en le multipliant par la racine carrée de la taille de l'échantillon, puis en le divisant par l'écart-type de l'échantillon. Recherchez le score Z Lorsque vous voyez un statistique citée, il y a parfois une fourchette indiquée après, avec l'abréviation «CI» (pour «intervalle de confiance») ou simplement un symbole plus-moins suivi d'un chiffre. Par exemple, «le poids moyen d'un homme adulte est de 180 livres (CI: 178.14 à 181.86)» ou «le poids moyen d'un homme adulte est de 180 ± 1,86 livres». Ces deux informations vous donnent les mêmes informations: sur la base de l'échantillon utilisé, le poids moyen d'un homme se situe probablement dans une certaine fourchette. La plage elle-même est appelée intervalle de confiance. Si vous voulez être aussi sûr que possible que la plage contient la valeur réelle, vous pouvez élargir la plage. Cela augmenterait votre «niveau de confiance» dans l'estimation, mais la fourchette couvrirait davantage de poids potentiels. La plupart des statistiques (y compris celle citée ci-dessus) sont données sous forme d'intervalles de confiance à 95%, ce qui signifie qu'il y a 95% de chances que la vraie valeur moyenne se situe dans la plage. Vous pouvez également utiliser un niveau de confiance de 99% ou un niveau de confiance de 90%, selon vos besoins. Lorsque vous utilisez un niveau de confiance dans les statistiques, vous avez généralement besoin pour calculer un intervalle de confiance. C'est un peu plus facile à faire si vous avez un grand échantillon, par exemple, plus de 30 personnes, car vous pouvez utiliser le score Z Prenez vos données brutes et calculez la moyenne de l'échantillon (additionnez simplement les résultats individuels et divisez par le nombre de résultats). Calculez l'écart-type en soustrayant la moyenne de chaque résultat individuel pour trouver la différence, puis mettez cette différence au carré. Additionnez toutes ces différences, puis divisez le résultat par la taille de l'échantillon moins 1. Prenez la racine carrée de ce résultat pour trouver l'écart-type de l'échantillon (voir Ressources). Déterminez l'intervalle de confiance en trouvant d'abord le erreur standard: SE Où s SE Pour trouver l'intervalle de confiance à partir de cela, recherchez le niveau de confiance pour lequel vous souhaitez calculer l'intervalle dans un Z Moyenne ± Z Ici, ± 1,86 livres correspond à l'intervalle de confiance à 95%. Si vous disposez plutôt de ces informations, ainsi que de la taille de l'échantillon et de l'écart-type, vous pouvez calculer le niveau de confiance à l'aide de la formule suivante: Z La taille du l'intervalle de confiance n'est que le double de la valeur ±, donc dans l'exemple ci-dessus, nous savons que 0,5 fois c'est 1,86. Cela donne: Z Cela nous donne une valeur pour Z Pour les petits échantillons, il existe un processus similaire pour calculer l'intervalle de confiance. Tout d'abord, soustrayez 1 de la taille de votre échantillon pour trouver vos «degrés de liberté». Dans les symboles: df Pour un échantillon n Trouvez votre valeur alpha en soustrayant la version décimale du niveau de confiance ( c'est-à-dire votre niveau de confiance en pourcentage divisé par 100) de 1 et en divisant le résultat par 2, ou en symboles: α α Recherchez votre valeur alpha et vos degrés de liberté dans une table de distribution t Comme à l'étape précédente, calculez l'intervalle de confiance en multipliant ce nombre par l'erreur standard, qui est déterminée en utilisant l'écart-type et la taille de l'échantillon de la même manière. La seule différence est qu'au lieu du score Z
pour le niveau de confiance que vous avez choisi. Soustrayez ce résultat de la moyenne de votre échantillon pour obtenir la limite inférieure et ajoutez-le à la moyenne de l'échantillon pour trouver la limite supérieure. (Voir Ressources)
à la place du score Z
pour les échantillons plus petits ( n
<30
ou t
résultant dans un tableau pour trouver le niveau.
La différence entre le niveau de confiance et l'intervalle de confiance
Calcul des intervalles ou des niveaux de confiance pour les grands échantillons
pour votre estimation plutôt que des scores t
plus compliqués.
\u003d s
/√ n
est votre écart type d'échantillon et n
est votre taille d'échantillon. Par exemple, si vous preniez un échantillon de 1 000 hommes pour déterminer le poids moyen d'un homme et obteniez un écart-type de 30, cela donnerait:
\u003d 30 /√1000 \u003d 30 /31,62 \u003d 0,95
-score et multipliez cette valeur par le score Z
. Pour un niveau de confiance de 95%, le Z
-score est de 1,96. En utilisant l'exemple, cela signifie:
× SE
\u003d 180 livres ± 1,96 × 0,95 \u003d 180 ± 1,86 livres
\u003d 0,5 × taille de l'intervalle de confiance × √ n
/ s
\u003d 1,86 × √1000 /30 \u003d 1,96
, que vous pouvez rechercher dans un tableau de scores Z
pour trouver le niveau de confiance correspondant.
Calcul des intervalles de confiance pour les petits échantillons
\u003d n
−1
\u003d 10, cela donne df
\u003d 9.
\u003d (1 - niveau de confiance décimal) /2
Donc, pour un niveau de confiance de 95% (0,95):
\u003d (1 - 0,95) /2 \u003d 0,05 /2 \u003d 0,025
(une queue) et notez le résultat. Sinon, omettez la division par 2 ci-dessus et utilisez une valeur t
bilatérale. Dans cet exemple, le résultat est 2,262.
, vous utilisez le score t
.