• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Mathen
    Comment calculer les valeurs aberrantes

    Une valeur aberrante est une valeur dans un ensemble de données éloigné des autres valeurs. Les valeurs aberrantes peuvent être causées par des erreurs expérimentales ou de mesure, ou par une population à longue queue. Dans les premiers cas, il peut être souhaitable d'identifier les valeurs aberrantes et de les retirer des données avant d'effectuer une analyse statistique, car elles peuvent rejeter les résultats de sorte qu'ils ne représentent pas exactement la population de l'échantillon. La méthode la plus simple pour identifier les valeurs aberrantes est la méthode du quartile.

    Triez les données dans l'ordre croissant. Par exemple, prenez l'ensemble de données {4, 5, 2, 3, 15, 3, 3, 5}. Trié, l'exemple de jeu de données est {2, 3, 3, 3, 4, 5, 5, 15}.

    Trouve la médiane. C'est le nombre auquel la moitié des points de données sont plus grands et la moitié sont plus petits. S'il y a un nombre pair de points de données, les deux moyennes sont moyennées. Pour l'exemple de jeu de données, les points centraux sont 3 et 4, donc la médiane est (3 + 4) /2 = 3.5.

    Trouve le quartile supérieur, Q2; c'est le point de données auquel 25% des données sont plus grandes. Si l'ensemble de données est pair, faites la moyenne des 2 points autour du quartile. Pour l'exemple de jeu de données, c'est (5 + 5) /2 = 5.

    Trouve le quartile inférieur, Q1; C'est le point de données auquel 25% des données sont plus petites. Si l'ensemble de données est pair, faites la moyenne des 2 points autour du quartile. Pour les données d'exemple, (3 + 3) /2 = 3.

    Soustraire le quartile inférieur du quartile supérieur pour obtenir la fourchette interquartile, QI. Pour l'exemple de jeu de données, Q2 - Q1 = 5 - 3 = 2.

    Multipliez la plage interquartile par 1,5. Ajoutez ceci au quartile supérieur et soustrayez-le du quartile inférieur. Tout point de données en dehors de ces valeurs est une valeur aberrante légère. Pour l'exemple, 1,5 x 2 = 3; donc 3 - 3 = 0 et 5 + 3 = 8. Donc toute valeur inférieure à 0 ou supérieure à 8 serait une aberration légère. Cela signifie que 15 correspond à une valeur aberrante.

    Multipliez la plage interquartile par 3. Ajoutez cette valeur au quartile supérieur et soustrayez-la du quartile inférieur. Tout point de données en dehors de ces valeurs est une aberration extrême. Pour l'ensemble d'exemples, 3 x 2 = 6; donc 3 - 6 = -3 et 5 + 6 = 11. Donc toute valeur inférieure à -3 ou supérieure à 11 serait un aberrant extrême. Cela signifie que 15 se qualifie comme une valeur aberrante extrême.

    Astuce

    Les valeurs aberrantes extrêmes sont plus indicatives d'un point de données incorrect qu'une valeur aberrante légère.

    © Science https://fr.scienceaq.com