Les tableaux de fréquences peuvent être utiles pour décrire le nombre d'occurrences d'un type particulier de donnée dans un ensemble de données. Les tables de fréquences, également appelées distributions de fréquence, sont l'un des outils les plus élémentaires pour afficher des statistiques descriptives. Les tableaux de fréquences sont largement utilisés comme référence d'un coup d'œil dans la distribution des données; ils sont faciles à interpréter et ils peuvent afficher de grands ensembles de données d'une manière assez concise. Les tableaux de fréquences peuvent aider à identifier les tendances évidentes dans un ensemble de données et peuvent être utilisés pour comparer des données entre des ensembles de données du même type. Cependant, les tableaux de fréquences ne sont pas appropriés pour chaque application. Ils peuvent masquer des valeurs extrêmes (plus de X ou moins de Y), et ils ne se prêtent pas à des analyses de l'asymétrie et de l'aplatissement des données.
Visualisation rapide des données
Les tableaux de fréquences peuvent rapidement révéler des valeurs aberrantes et même des tendances significatives dans un ensemble de données avec pas beaucoup plus qu'une inspection superficielle. Par exemple, un enseignant peut afficher les notes des élèves à mi-parcours sur une table de fréquence afin d'avoir un aperçu rapide de ce que fait sa classe en général. Le nombre dans la colonne de fréquence représenterait le nombre d'étudiants recevant cette note; Pour une classe de 25 élèves, la distribution de fréquence des notes reçues pourrait ressembler à ceci: Grade Fréquence A .............. 7 B ........... ..13 C .............. 3 D .............. 2
Visualiser l'abondance relative
Les tableaux de fréquences peuvent aider les chercheurs à examiner l'abondance relative de chaque donnée cible particulière dans leur échantillon. L'abondance relative représente la proportion de l'ensemble de données qui comprend les données cibles. L'abondance relative est souvent représentée sous la forme d'un histogramme de fréquence, mais peut facilement être affichée dans un tableau de fréquence. Considérez la même distribution de fréquence des catégories à mi-parcours. L'abondance relative est simplement le pourcentage d'élèves qui ont obtenu une note particulière et peut être utile pour conceptualiser des données sans trop y réfléchir. Par exemple, avec la colonne ajoutée qui affiche le pourcentage d'occurrence de chaque note, vous pouvez facilement voir que plus de la moitié de la classe a obtenu un B, sans avoir à examiner les données de manière détaillée.
Grade Frequency Relative Abondance (% fréquence) A .............. 7 .............. 28% B ............ .13 ............ 52% C .............. 3 ............. 12% D .. ............ 2 .............. 8%
Les ensembles de données complexes peuvent avoir besoin d'être classés dans des intervalles
One inconvénient est qu'il est difficile de comprendre les ensembles de données complexes qui sont affichés sur une table de fréquence. Les grands ensembles de données peuvent être divisés en classes d'intervalle pour une visualisation facile en utilisant une table de fréquences. Par exemple, si vous demandez aux 100 personnes suivantes de voir leur âge, vous obtiendrez probablement un large éventail de réponses allant de trois à quatre-vingt-treize. Plutôt que d'inclure des lignes pour chaque âge dans votre tableau des fréquences, vous pouvez classer les données en intervalles, tels que 0 - 10 ans, 11 - 20 ans, 21 - 30 ans et ainsi de suite. Cela peut également être appelé une distribution de fréquence groupée.
Les tableaux de fréquences peuvent masquer l'obliquité et l'aplatissement
À moins d'être affichés sur un histogramme, l'asymétrie et l'aplatissement des données peuvent ne pas être facilement visibles dans une fréquence table. L'asymétrie vous indique dans quelle direction tendent vos données. Si les notes étaient affichées sur l'axe X d'un graphique montrant la fréquence des notes à mi-parcours pour nos 25 étudiants ci-dessus, la distribution serait faussée vers les A et les B. Kurtosis vous informe sur le pic central de vos données - si elles tombent dans la ligne d'une distribution normale, qui est une belle courbe en cloche, ou si elles sont grandes et pointues. Si vous gravez les notes de mi-parcours dans notre exemple, vous trouverez un pic élevé en B avec une forte diminution de la distribution des grades inférieurs.