Par Gina Putt • Mis à jour le 30 août 2022
Lorsque des données naturelles, telles que la taille, le QI ou la tension artérielle, sont tracées sur un histogramme, les fréquences des scores forment généralement une courbe symétrique en forme de cloche appelée distribution normale (ou gaussienne). Cette forme permet aux statisticiens de faire des prédictions puissantes sur la probabilité d'observer un score particulier.
La moyenne arithmétique d’une distribution normale se situe au centre de la courbe et correspond au 50e centile :la moitié de toutes les observations se situent au-dessus et l’autre moitié en dessous. La courbe étant parfaitement symétrique, la médiane coïncide avec la moyenne, marquant le point de plus grande fréquence.
L’écart type quantifie dans quelle mesure, en moyenne, les scores individuels se situent par rapport à la moyenne. Un écart type plus grand produit une courbe plus plate et plus étalée, tandis qu’un écart type plus petit donne une forme raide et étroite. Chaque incrément d'écart type vous éloigne de la moyenne et réduit la probabilité qu'un score aléatoire y tombe.
Dans une distribution normale, la règle empirique donne les probabilités marquantes suivantes :
Ces pourcentages constituent l’épine dorsale de l’inférence statistique. Par exemple, si un essai clinique révèle que les patients prenant un nouveau médicament hypocholestérolémiant ont des taux moyens inférieurs de deux écarts types à la moyenne de la population, il est peu probable que le résultat soit dû au seul hasard.