Un nuage de points est un graphique qui montre la relation entre deux ensembles de données. Parfois, il est utile d'utiliser les données contenues dans un nuage de points pour obtenir une relation mathématique entre deux variables. L'équation d'un nuage de points peut être obtenue à la main, en utilisant l'une des deux méthodes principales: une technique graphique ou une technique appelée régression linéaire.
Création d'un nuage de points
Utilisez du papier millimétré pour créer un nuage de points . Dessinez les axes x et y, assurez-vous qu'ils se croisent et étiquetez l'origine. Assurez-vous que les axes x et y ont également des titres corrects. Ensuite, tracez chaque point de données dans le graphique. Toute tendance entre les ensembles de données tracés devrait maintenant être évidente.
Ligne de meilleur ajustement
Une fois qu'un nuage de points a été créé, en supposant qu'il existe une corrélation linéaire entre deux ensembles de données, nous pouvons utiliser une méthode graphique pour obtenir l'équation. Prenez une règle et tracez une ligne aussi près que possible de tous les points. Essayez de vous assurer qu'il y a autant de points au-dessus de la ligne qu'en-dessous de la ligne. Une fois la ligne tracée, utilisez des méthodes standard pour trouver l'équation de la ligne droite
Équation de la ligne droite
Une fois qu'une ligne de meilleur ajustement a été placée sur un diagramme de dispersion, il est facile de trouver la équation. L'équation générale d'une droite est:
y \u003d mx + c
Où m est la pente (gradient) de la ligne et c est l'ordonnée à l'origine. Pour obtenir le gradient, trouvez deux points sur la ligne. Pour cet exemple, supposons que les deux points sont (1,3) et (0,1). Le gradient peut être calculé en prenant la différence des coordonnées y et en divisant par la différence des coordonnées x:
m \u003d (3 - 1) /(1 - 0) \u003d 2/1 \u003d 2
Le gradient dans ce cas est égal à 2. Jusqu'à présent, l'équation de la droite est
y \u003d 2x + c
La valeur de c peut être obtenue en substituant dans les valeurs un point connu. Suivant l'exemple, l'un des points connus est (1,3). Branchez-le dans l'équation et réorganisez pour c:
3 \u003d (2 * 1) + c
c \u003d 3 - 2 \u003d 1
L'équation finale dans ce cas est:
y \u003d 2x + 1
Régression linéaire
La régression linéaire est une méthode mathématique qui peut être utilisée pour obtenir l'équation linéaire d'un nuage de points. Commencez par placer vos données dans un tableau. Pour cet exemple, supposons que nous avons les données suivantes:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Calculez la somme des valeurs x:
x_sum \u003d 4.1 + 6.5 + 12.6 \u003d 23.2
Ensuite, calculez la somme des valeurs y:
y_sum \u003d 2.2 + 4.4 + 10.4 \u003d 17
Additionnez maintenant les produits de chaque ensemble de points de données:
xy_sum \u003d (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) \u003d 168.66
Ensuite, calculez la somme des valeurs x au carré et des valeurs y au carré:
x_square_sum \u003d (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) \u003d 217.82
y_square_sum \u003d (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) \u003d 133,25
Enfin, comptez le nombre de points de données dont vous disposez. Dans ce cas, nous avons trois points de données (N \u003d 3). Le gradient de la droite la mieux ajustée peut être obtenu à partir de:
m \u003d (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) \u003d (3 * 168,66) - (23,2 * 17) /(3 * 217,82) - (23,2 * 23,2) \u003d 0,968
L'interception de la ligne la mieux ajustée peut être obtenue à partir de:
c \u003d (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)
\\ \u003d (217.82 17) - (23.2 L'équation finale est donc: y \u003d 0.968x - 1.82
168.66) /(3 * 217.82) - (23.2
168.66) /(3 * 217.82) - (23.2 * 23.2) \\ \u003d -1.82