La plage interquartile, souvent abrégée en IQR, représente la plage allant du 25e centile au 75e centile, ou les 50 pour cent du milieu, d'un ensemble de données donné. La plage interquartile peut être utilisée pour déterminer quelle serait la plage moyenne de performance d'un test: vous pouvez l'utiliser pour voir où les scores de la plupart des gens à un certain test chutent, ou déterminer combien d'argent l'employé moyen d'une entreprise gagne chaque mois. . La plage interquartile peut être un outil d'analyse de données plus efficace que la moyenne ou la médiane d'un ensemble de données, car elle vous permet d'identifier la plage de dispersion plutôt qu'un simple nombre.
TL; DR (Too Long ; N'a pas lu)
La plage interquartile (IQR) représente les 50% du milieu d'un ensemble de données. Pour le calculer, triez d'abord vos points de données du plus petit au plus grand, puis déterminez vos positions de premier et troisième quartile en utilisant les formules (N + 1) /4 et 3 * (N + 1) /4 respectivement, où N est le nombre de points dans l'ensemble de données. Enfin, soustrayez le premier quartile du troisième quartile pour déterminer la plage interquartile de l'ensemble de données.
Commander des points de données
Le calcul de la plage interquartile est une tâche simple, mais avant de calculer, vous devrez organiser les divers points de votre ensemble de données. Pour ce faire, commencez par classer vos points de données du plus petit au plus grand. Par exemple, si vos points de données étaient 10, 19, 8, 4, 9, 12, 15, 11 et 20, vous les réorganiseriez comme ceci: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Une fois que vos points de données ont été classés comme ceci, vous pouvez passer à l'étape suivante.
Déterminer la position du premier quartile
Ensuite, déterminer la position du premier quartile en utilisant la formule suivante: (N + 1 ) /4, où N est le nombre de points dans l'ensemble de données. Si le premier quartile se situe entre deux nombres, prenez la moyenne des deux nombres comme score de votre premier quartile. Dans l'exemple ci-dessus, comme il y a neuf points de données, vous ajouteriez 1 à 9 pour obtenir 10, puis divisez par 4 pour obtenir 2,5. Étant donné que le premier quartile se situe entre la deuxième et la troisième valeur, vous devez prendre la moyenne de 8 et 9 pour obtenir une position de premier quartile de 8,5.
Déterminer la position du troisième quartile
Une fois que vous avez déterminé votre premier quartile, déterminez la position du troisième quartile à l'aide de la formule suivante: 3 * (N + 1) /4 où N est à nouveau le nombre de points dans l'ensemble de données. De même, si le troisième quartile se situe entre deux nombres, prenez simplement la moyenne comme vous le feriez lors du calcul du score du premier quartile. Dans l'exemple ci-dessus, puisqu'il y a neuf points de données, vous ajouteriez de 1 à 9 pour obtenir 10, multipliez par 3 pour obtenir 30, puis divisez par 4 pour obtenir 7,5. Étant donné que le premier quartile se situe entre la septième et la huitième valeur, vous devez prendre la moyenne de 15 et 19 pour obtenir un score de troisième quartile de 17.
Calculer l'intervalle interquartile
Une fois que vous avez déterminé votre premier et troisième quartile, calculez l'intervalle interquartile en soustrayant la valeur du premier quartile de la valeur du troisième quartile. Pour terminer l'exemple utilisé au cours de cet article, vous devez soustraire 8,5 de 17 pour constater que la plage interquartile de l'ensemble de données est égale à 8,5.
Avantages et inconvénients de l'IQR
La plage interquartile a un avantage de pouvoir identifier et éliminer les valeurs aberrantes aux deux extrémités d'un ensemble de données. L'IQR est également une bonne mesure de la variation dans les cas de distribution de données asymétrique, et cette méthode de calcul de l'IQR peut fonctionner pour des ensembles de données groupés, tant que vous utilisez une distribution de fréquence cumulée pour organiser vos points de données. La formule de l'intervalle interquartile pour les données groupées est la même que pour les données non groupées, l'IQR étant égal à la valeur du premier quartile soustraite de la valeur du troisième quartile. Cependant, il présente plusieurs inconvénients par rapport à l'écart-type: moins de sensibilité à quelques scores extrêmes et une stabilité d'échantillonnage qui n'est pas aussi forte que l'écart-type.