Lorsque vous créez des modèles dans des statistiques, vous les testez généralement pour vous assurer qu'ils correspondent aux situations réelles. Le résidu est un nombre qui vous aide à déterminer à quel point votre modèle théorisé est proche du phénomène dans le monde réel. Les résidus ne sont pas trop difficiles à comprendre: ce sont juste des nombres qui représentent la distance entre un point de données et ce qu'il devrait être selon le modèle prédit. Définition mathématique
Mathématiquement, un résidu est la différence entre un point de données observé et la valeur attendue - ou estimée - pour ce que ce point de données aurait dû être. La formule pour un résidu est R = O - E, où «O» signifie la valeur observée et «E» signifie la valeur attendue. Cela signifie que les valeurs positives de R indiquent des valeurs supérieures aux prévisions, tandis que les valeurs négatives indiquent des valeurs inférieures aux prévisions. Par exemple, vous pourriez avoir un modèle statistique qui dit que lorsqu'un homme pèse 140 livres, sa taille devrait être de 6 pieds ou 72 pouces. Lorsque vous collectez des données, vous pouvez trouver quelqu'un qui pèse 140 livres mais mesure 5 pieds 9 pouces ou 69 pouces. Le résidu est alors de 69 pouces moins 72 pouces, ce qui vous donne une valeur négative de 3 pouces. En d'autres termes, le point de données observé se trouve à 3 pouces sous la valeur attendue.
Vérification des modèles
Les résidus sont particulièrement utiles lorsque vous souhaitez vérifier si votre modèle théorisé fonctionne dans le monde réel. Lorsque vous créez un modèle et calculez ses valeurs attendues, vous théorisez. Mais lorsque vous allez collecter des données, vous pouvez constater que les données ne correspondent pas au modèle. Une façon de trouver cette discordance entre votre modèle et le monde réel consiste à calculer les résidus. Par exemple, si vous constatez que vos résidus sont toujours éloignés de vos valeurs estimées, il se peut que votre modèle ne repose pas sur une théorie sous-jacente solide. Une méthode simple pour utiliser les résidus de cette manière consiste à les représenter.
Sciencing Video Vault
Créer le support (presque) parfait: Voici comment créer le support (presque) parfait: Voici comment tracer Résidus
Lorsque vous calculez les résidus, vous avez une poignée de chiffres, ce qui est difficile à interpréter pour les humains. Tracer les résidus peut souvent vous montrer des modèles. Ces modèles peuvent vous amener à déterminer si le modèle convient bien. Deux aspects des résidus peuvent vous aider à analyser un graphique des résidus. Premièrement, les résidus d’un bon modèle doivent être dispersés des deux côtés de zéro. C'est-à-dire qu'un graphique des résidus devrait avoir à peu près la même quantité de résidus négatifs que les résidus positifs. Deuxièmement, les résidus devraient sembler être aléatoires. Si vous voyez un modèle dans votre tracé résiduel, par exemple un motif clair ou un motif incurvé, votre modèle d'origine peut comporter une erreur.
Résidus spéciaux: valeurs aberrantes
Valeurs aberrantes ou résidus de valeurs extrêmement grandes. , apparaissent exceptionnellement loin des autres points de votre parcelle de résidus. Lorsque vous trouvez un résidu qui est une valeur aberrante dans votre ensemble de données, vous devez y réfléchir attentivement. Certains scientifiques recommandent de supprimer les valeurs aberrantes car il s’agit d’anomalies ou de cas particuliers. D'autres recommandent des recherches plus poussées pour savoir pourquoi vous avez un si grand résidu. Par exemple, vous pouvez créer un modèle de la façon dont le stress affecte les notes scolaires et théoriser que plus de stress signifie généralement de mauvaises notes. Si vos données montrent que cela est vrai, sauf pour une personne qui a très peu de stress et de très mauvaises notes, vous pouvez vous demander pourquoi. Une telle personne pourrait simplement ne se soucier de rien, y compris de l'école, ce qui explique le grand résidu. Dans ce cas, vous pouvez envisager de supprimer le résidu de votre ensemble de données, car vous souhaitez modéliser uniquement les élèves qui se soucient de l'école.