• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Mathen
    Qu'est-ce que la distribution gaussienne

    En statistique, la distribution gaussienne ou normale est utilisée pour caractériser des systèmes complexes avec de nombreux facteurs. Comme décrit dans l'Histoire des statistiques de Stephen Stigler, Abraham De Moivre a inventé la distribution qui porte le nom de Karl Fredrick Gauss. La contribution de Gauss réside dans son application de la distribution à la méthode des moindres carrés pour minimiser l'erreur d'ajustement des données avec une ligne de meilleur ajustement. Il en a ainsi fait la distribution d'erreur la plus importante dans les statistiques.

    Motivation

    Quelle est la distribution d'un échantillon de données? Que faire si vous ne connaissez pas la distribution sous-jacente des données? Existe-t-il un moyen de tester des hypothèses sur les données sans connaître la distribution sous-jacente? Grâce au théorème de la limite centrale, la réponse est oui.

    Énoncé du théorème

    Il indique qu'un échantillon d'une population infinie est approximativement normal, ou gaussien, avec la même signification que la population sous-jacente et la variance égale à la variance de la population divisée par la taille de l'échantillon. L'approximation s'améliore à mesure que la taille de l'échantillon devient grande.

    L'instruction d'approximation est parfois erronée en tant que conclusion sur la convergence vers une distribution normale. Puisque la distribution normale approximative change à mesure que la taille de l'échantillon augmente, une telle déclaration est trompeuse.

    Le théorème a été développé par Pierre Simon Laplace.

    Pourquoi c'est partout

    Distributions normales sont omniprésents. La raison vient du théorème de la limite centrale. Souvent, quand une valeur est mesurée, c'est l'effet de somme de nombreuses variables indépendantes. Par conséquent, la valeur mesurée elle-même a une qualité moyenne d'échantillon. Par exemple, une distribution des performances de l'athlète peut avoir une forme de cloche, en raison de différences dans l'alimentation, l'entraînement, la génétique, le coaching et la psychologie. Même les hauteurs des hommes ont une distribution normale, étant fonction de nombreux facteurs biologiques.

    Dérivation

    Le théorème de limite centrale peut être prouvé en plusieurs lignes en analysant la fonction génératrice du moment (mgf) de (échantillon moyenne - moyenne de la population) /? (variance de la population /taille de l'échantillon) en fonction de la mgf de la population sous-jacente. La partie approximation du théorème est introduite en augmentant la mgf de la population sous-jacente en tant que série de puissance, puis en montrant que la plupart des termes sont insignifiants lorsque la taille de l'échantillon devient grande.

    Cela peut être prouvé en beaucoup moins expansion sur l'équation caractéristique de la même fonction et agrandissement de la taille de l'échantillon.

    Commodité pratique

    Certains modèles statistiques supposent que les erreurs sont gaussiennes. Cela permet d'utiliser des distributions de fonctions de variables normales, comme la distribution du chi-carré et du F, dans les tests d'hypothèse. Plus précisément, dans le test F, la statistique F est composée d'un rapport de distributions chi-deux, qui sont elles-mêmes des fonctions d'un paramètre de variance normale. Le rapport des deux entraîne l'annulation de la variance, ce qui permet des tests d'hypothèses sans connaissance des variances, indépendamment de leur normalité et de leur constance.

    © Science https://fr.scienceaq.com