Le biais est l'erreur dans les estimations due à des erreurs systématiques qui conduisent à des résultats systématiquement élevés ou faibles par rapport aux valeurs réelles. Le biais individuel d'une estimation connue pour être biaisée est la différence entre les valeurs estimées et réelles. Si l'estimation n'est pas connue pour être biaisée, la différence pourrait également être due à une erreur aléatoire ou à d'autres inexactitudes. Contrairement au biais, qui agit toujours dans un sens, ces erreurs peuvent être positives ou négatives.
Pour calculer le biais d'une méthode utilisée pour de nombreuses estimations, recherchez les erreurs en soustrayant chaque estimation de la valeur réelle ou observée . Additionnez toutes les erreurs et divisez par le nombre d'estimations pour obtenir le biais. Si les erreurs s'additionnent à zéro, les estimations étaient non biaisées et la méthode fournit des résultats non biaisés. Si les estimations sont biaisées, il peut être possible de trouver la source du biais et de l'éliminer pour améliorer la méthode.
TL; DR (trop long; n'a pas lu)
Calculez le biais en trouvant la différence entre une estimation et la valeur réelle. Pour trouver le biais d'une méthode, effectuez de nombreuses estimations et additionnez les erreurs dans chaque estimation par rapport à la valeur réelle. La division par le nombre d'estimations donne le biais de la méthode. En statistiques, il peut y avoir de nombreuses estimations pour trouver une seule valeur. Le biais est la différence entre la moyenne de ces estimations et la valeur réelle.
Fonctionnement du biais
Lorsque les estimations sont biaisées, elles sont systématiquement erronées dans une direction en raison d'erreurs dans le système utilisé pour les estimations. Par exemple, une prévision météorologique peut toujours prévoir des températures plus élevées que celles réellement observées. La prévision est biaisée et quelque part dans le système, il y a une erreur qui donne une estimation trop élevée. Si la méthode de prévision n'est pas biaisée, elle peut toujours prévoir des températures qui ne sont pas correctes, mais les températures incorrectes seront parfois supérieures et parfois inférieures aux températures observées.
Le biais statistique fonctionne de la même manière mais est généralement basé sur un grand nombre d'estimations, d'enquêtes ou de prévisions. Ces résultats peuvent être représentés graphiquement dans une courbe de distribution et le biais est la différence entre la moyenne de la distribution et la valeur réelle. S'il y a un biais, il y aura toujours une différence même si certaines estimations individuelles peuvent tomber d'un côté ou de l'autre de la valeur réelle. campagnes électorales, mais les résultats de leurs sondages surestiment systématiquement les résultats d'un parti politique par rapport aux résultats réels des élections. Le biais peut être calculé pour chaque élection en soustrayant le résultat réel de la prévision du sondage. Le biais moyen de la méthode d'interrogation utilisée peut être calculé en trouvant la moyenne des erreurs individuelles. Si le biais est important et cohérent, la société de sondage peut essayer de découvrir pourquoi sa méthode est biaisée.
Le biais peut provenir de deux sources principales. Soit la sélection des participants au sondage est biaisée, soit le biais résulte de l'interprétation des informations reçues des participants. Par exemple, les sondages Internet sont intrinsèquement biaisés parce que les participants au sondage qui remplissent les formulaires Internet ne sont pas représentatifs de l'ensemble de la population. Il s'agit d'un biais de sélection.
Les sociétés de sondage sont conscientes de ce biais de sélection et compensent en ajustant les chiffres. Si les résultats sont toujours biaisés, il s'agit d'un biais d'information car les entreprises n'ont pas correctement interprété les informations. Dans tous ces cas, un calcul de biais montre dans quelle mesure les valeurs estimées sont utiles et quand les méthodes doivent être ajustées.