Tout ensemble de données accumulé à des fins statistiques, comme le recensement américain, contient des informations qui doivent être résumées et agrégées. Il serait impossible d'énumérer les attributs tels que le revenu et la taille de la famille pour chaque individu. Les statisticiens utilisent donc des graphiques de distribution de fréquence pour représenter les données de manière globale, comme un histogramme, qui divise les données en intervalles de classe et compte la fréquence à laquelle tous les membres appartenant à cet intervalle de classe se produisent. Bien qu'il n'y ait pas de règles strictes sur la façon de calculer la taille et le nombre d'intervalles de classe, certains critères conventionnels sont utiles.
Calculer la plage de données. La plage correspond à la différence entre les points de données les plus élevés et les plus bas. Par exemple, supposons que la personne la mieux rémunérée aux États-Unis gagne 30 milliards de dollars par an et que la plus faible gagne zéro. La plage est égale à 30 - 0, ce qui équivaut à 30 milliards de dollars.
Détermine le nombre de classes à partir de la taille de l'échantillon. En règle générale, cinq à sept classes sont utilisées pour la taille de l'échantillon jusqu'à 50, huit à 10 classes pour la taille de l'échantillon entre 50 et 100, 10 à 15 classes pour la taille de l'échantillon entre 100 et 250 et 15 à 20 classes pour la taille de l'échantillon supérieur à 250.
Calculez l'intervalle de classe à l'aide de la formule suivante: Intervalle de classe = plage /nombre de classes. Pour calculer l'intervalle de classe pour la distribution du revenu dans l'exemple, divisez 30 par 15, ce qui équivaut à 2 milliards de dollars. Souvent, les statisticiens ignorent les chiffres extrêmement hauts et bas et se concentrent sur les fréquences moyennes. Pour cette raison, la distribution des revenus aux États-Unis est présentée dans des intervalles plus petits de 10 000 $ avec des revenus supérieurs à un certain chiffre, généralement un million, regroupés dans un même intervalle de classe. Utilisez votre discrétion pour calculer l'intervalle de classe. Le Saint-Graal d'un graphique tel qu'un histogramme est de transmettre des informations pertinentes d'une manière significative et simple. Choisissez vos intervalles de classe pour transmettre l'information que vous estimez digne de l'attention des lecteurs.