Lorsque vous insérez une ligne droite dans un ensemble de données, vous pouvez déterminer si la ligne résultante correspond aux données. Une façon de faire est de calculer l'erreur de somme des carrés (SSE). Cette valeur fournit une mesure de la façon dont la ligne de meilleur ajustement se rapproche de l'ensemble de données. Le SSE est important pour l'analyse des données expérimentales et est déterminé en quelques étapes seulement.
Trouvez une ligne de meilleur ajustement pour modéliser les données en utilisant la régression. La ligne de meilleur ajustement a la forme y = ax + b, où a et b sont les paramètres que vous devez déterminer. Vous pouvez trouver ces paramètres en utilisant une analyse de régression linéaire simple. Par exemple, supposons que la ligne de meilleur ajustement a la forme y = 0.8x + 7.
Utilisez l'équation pour déterminer la valeur de chaque valeur y prédite par la ligne de meilleur ajustement. Vous pouvez le faire en substituant chaque valeur x dans l'équation de la ligne. Par exemple, si x est égal à 1, le substituer dans l'équation y = 0.8x + 7 donne 7.8 pour la valeur y.
Déterminer la moyenne des valeurs prédites à partir de la ligne d'équation la meilleure. Vous pouvez le faire en additionnant toutes les valeurs y prédites à partir des équations, et en divisant le nombre résultant par le nombre de valeurs. Par exemple, si les valeurs sont 7.8, 8.6 et 9.4, additionner ces valeurs donne 25.8, et en divisant ce nombre par le nombre de valeurs, 3 dans ce cas, donne 8.6.
Soustraire chacune des valeurs individuelles de la moyenne, et placez le nombre résultant. Dans notre exemple, si nous soustrayons la valeur 7.8 de la moyenne 8.6, le nombre résultant est 0.8. La mise au carré de cette valeur donne 0,64.
Somme toutes les valeurs au carré de l'étape 4. Si vous appliquez les instructions de l'étape 4 aux trois valeurs de notre exemple, vous trouverez les valeurs de 0,64, 0 et 0,64. La somme de ces valeurs donne 1,28. C'est la somme des carrés d'erreur.
Avertissement
Les nombres des données sont seulement utilisés pour déterminer l'équation pour la ligne de meilleur ajustement. Utiliser les valeurs de la ligne de meilleur ajustement lors du calcul de la somme des carrés d'erreur.