• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  Science >> Science >  >> Physique
    Que sont les intervalles de confiance dans les statistiques ?
    Si vous lancez une pièce, 10 queues d'affilée pourraient être assez improbables. Mais après 10 lancers, la probabilité d’obtenir pile au prochain lancer sera toujours de 50 pour cent. Monty Rakusen/Getty Images

    Les statistiques sont un peu un mélange entre les mathématiques et les probabilités. Le but des statistiques est de décrire les processus que vous pouvez observer dans le monde – la hauteur des chênes ou la probabilité qu’un vaccin soit efficace pour lutter contre les maladies – sans avoir à mesurer chaque chêne du monde ou à vacciner chaque personne avant de décider comment. un médicament est efficace.

    Parce que la probabilité décrit des choses qui impliquent le hasard, nous devons accepter que quel que soit le processus que nous utilisons pour mesurer les statistiques, nous n'obtiendrons jamais une image complète.

    Contenu
    1. Pourquoi utiliser les statistiques ?
    2. Intervalles de confiance
    3. Les limites des statistiques

    Pourquoi utiliser les statistiques ?

    Supposons que vous lancez une pièce quatre fois. Vous obtenez trois têtes et une queue. Sans utiliser de statistiques, nous pourrions conclure que la probabilité d’obtenir face est de 75 %, alors que la probabilité réelle d’obtenir face lors d’un tirage au sort est de 1 : 1, soit une chance de 50-50. Si nous faisions 40 lancers de pièces à la place, nous nous rapprocherions certainement d'un ratio de 1:1 entre pile et face, et l'utilisation de statistiques refléterait cela.

    "Une grande partie des statistiques concernent le raisonnement à partir d'un échantillon - les observations réelles - jusqu'aux caractéristiques de la population - toutes les observations possibles", explique John Drake, professeur-chercheur au Centre d'écologie des maladies infectieuses de l'Université de Géorgie. dans un e-mail. "Par exemple, nous pourrions être intéressés par la hauteur des chênes. Nous ne pouvons pas mesurer tous les chênes du monde, mais nous pouvons en mesurer certains. Nous pouvons calculer la hauteur moyenne des chênes de l'échantillon, mais cela ne fonctionnera pas. " Ce n'est pas nécessairement la même chose que la moyenne de tous les chênes."

    Intervalles de confiance

    Comme nous ne pouvons pas mesurer tous les chênes du monde, les statisticiens proposent une fourchette estimée de hauteurs basée sur la probabilité et toutes les données dont ils disposent. Cette plage est appelée intervalle de confiance et se compose de deux nombres :un qui est probablement plus petit que la vraie valeur et un qui est probablement plus grand. La vraie valeur se situe probablement quelque part entre les deux.

    "Un 'intervalle de confiance à 95 pour cent' signifie que 95 fois sur 100 lorsque l'intervalle de confiance est construit de cette façon, l'intervalle inclura la vraie valeur", explique Drake. "Si nous mesurions des échantillons de chênes 100 fois, l'intervalle de confiance basé sur les données collectées dans 95 de ces expériences inclurait la moyenne de la population, ou la hauteur moyenne de tous les chênes. Ainsi, un intervalle de confiance est une mesure de la précision d'une estimation. L'estimation devient de plus en plus précise à mesure que vous collectez plus de données. C'est pourquoi les intervalles de confiance diminuent à mesure que davantage de données sont disponibles."

    Ainsi, un intervalle de confiance permet de montrer à quel point l’estimation est bonne ou mauvaise. Lorsque nous tirons à pile ou face seulement quatre fois, notre estimation de 75 pour cent a un large intervalle de confiance car la taille de notre échantillon est très petite. Notre estimation avec 40 tirages au sort aurait un intervalle de confiance beaucoup plus étroit.

    La véritable signification d’un intervalle de confiance est liée à la répétition d’une expérience encore et encore. Dans le cas des quatre lancers de pièces, un intervalle de confiance de 95 % signifie que si nous répétons l'expérience de tirage au sort 100 fois, dans 95 d'entre elles, notre probabilité d'obtenir face se situera dans cet intervalle de confiance.

    Les limites des statistiques

    Il y a des limites aux statistiques. Vous devez concevoir une bonne étude :les statistiques ne peuvent pas vous dire quelque chose que vous n'avez pas demandé.

    Supposons que vous étudiiez l'efficacité d'un vaccin, mais que vous n'ayez pas inclus les enfants dans votre étude. Vous pouvez établir un intervalle de confiance basé sur les données que vous avez collectées, mais cela ne vous dira rien sur la façon dont le vaccin protège les enfants.

    "En plus de disposer de suffisamment de données, l'échantillon doit également être représentatif", explique Drake. "Habituellement, cela signifie avoir un échantillon aléatoire ou un échantillon aléatoire stratifié. En supposant que les 1 000 participants à votre hypothétique essai vaccinal soient représentatifs de la population, il est alors raisonnable de conclure que la véritable efficacité du vaccin se situe dans l'intervalle de confiance rapporté. Si l'échantillon n'est pas représentatif – s'il n'inclut pas d'enfants – alors il n'y a aucune base statistique permettant de tirer des conclusions sur la partie non représentée de la population. "

    Maintenant, c'est intéressant :

    Florence Nightingale était l'une des statisticiennes les plus importantes de l'histoire, utilisant la science dont elle a été la pionnière pour sauver la vie des soldats pendant la guerre de Crimée.




    © Science https://fr.scienceaq.com