L’intervalle interquartile, souvent abrégé en IQR, représente l’intervalle allant du 25e au 75e centile, ou au milieu, aux 50%, d’un ensemble de données donné. La plage interquartile peut être utilisée pour déterminer la plage moyenne de performance d'un test: vous pouvez l'utiliser pour voir où se situent les scores de la plupart des gens lors d'un test donné, ou pour déterminer le montant que l'employé moyen d'une entreprise gagne chaque mois. . La plage interquartile peut constituer un outil d’analyse des données plus efficace que la moyenne ou la médiane d’un ensemble de données, car elle vous permet d’identifier la plage de dispersion plutôt qu’un seul nombre.
TL; DR (Too Long ; N’a pas lu)
L’intervalle interquartile (IQR) représente les 50% moyens d’un jeu de données. Pour le calculer, commencez par classer vos points de données du plus petit au plus grand, puis déterminez vos positions du premier et du troisième quartiles en utilisant les formules (N + 1) /4 et 3 * (N + 1) /4 respectivement, où N est le nombre. de points dans le jeu de données. Enfin, soustrayez le premier quartile du troisième quartile pour déterminer la plage interquartile de l'ensemble de données.
Points de données de commande
Le calcul de la plage interquartile est une tâche simple. Avant de procéder au calcul, vous devez organiser les différentes points de votre ensemble de données. Pour ce faire, commencez par classer vos points de données du plus petit au plus grand. Par exemple, si vos points de données étaient 10, 19, 8, 4, 9, 12, 15, 11 et 20, vous les réorganiseriez comme suit: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Une fois que vos points de données ont été classés ainsi, vous pouvez passer à l'étape suivante.
Déterminer la position du premier quartile
Ensuite, déterminez la position du premier quartile à l'aide de la formule suivante: (N + 1 ) /4, où N est le nombre de points de l’ensemble de données. Si le premier quartile se situe entre deux nombres, prenez la moyenne des deux nombres comme score du premier quartile. Dans l'exemple ci-dessus, puisqu'il y a neuf points de données, vous ajouteriez 1 à 9 pour obtenir 10, puis divisez par 4 pour obtenir 2,5. Le premier quartile se situant entre les deuxième et troisième valeurs, il vous faudrait en moyenne 8 et 9 pour obtenir un premier quartile de 8,5.
Sciencing Video Vault
Créez la parenthèse (presque) parfaite: Voici comment < Voici comment déterminer la position du troisième quartile
Une fois que vous avez déterminé votre premier quartile, déterminez la position du troisième quartile à l'aide de la formule suivante: 3 * ( N + 1) /4 où N est à nouveau le nombre de points de l'ensemble de données. De même, si le troisième quartile se situe entre deux chiffres, prenez simplement la moyenne comme vous le feriez pour calculer le score du premier quartile. Dans l'exemple ci-dessus, puisqu'il y a neuf points de données, vous devez ajouter 1 à 9 pour obtenir 10, multiplier par 3 pour obtenir 30, puis diviser par 4 pour obtenir 7,5. Le premier quartile se situant entre les septième et huitième valeurs, il vous faudrait en moyenne 15 et 19 pour obtenir un troisième quartile de 17.
Calculez l'intervalle interquartile
Une fois que vous avez déterminé votre premier et troisième quartile, calculez l'intervalle interquartile en soustrayant la valeur du premier quartile de la valeur du troisième quartile. Pour terminer l'exemple utilisé au cours de cet article, vous devez soustraire 8,5 sur 17 pour constater que l'intervalle interquartile de l'ensemble de données est égal à 8,5.
Avantages et inconvénients d'IQR
L'intervalle interquartile a un avantage de pouvoir identifier et éliminer les valeurs aberrantes aux deux extrémités d’un ensemble de données. IQR constitue également une bonne mesure de variation dans les cas de distribution de données asymétrique, et cette méthode de calcul de IQR peut fonctionner pour des ensembles de données groupés, à condition que vous utilisiez une distribution de fréquence cumulative pour organiser vos points de données. La formule de la plage interquartile pour les données groupées est la même que pour les données non groupées, avec un IQR égal à la valeur du premier quartile soustraite de la valeur du troisième quartile. Cependant, il présente plusieurs inconvénients par rapport à l’écart type: une sensibilité moindre à quelques scores extrêmes et une stabilité d’échantillonnage moins forte que l’écart type.