• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Autres
    Des chercheurs évaluent les changements de confidentialité des données du recensement de 2020

    Crédit :CC0 Domaine Public

    Après que le Bureau du recensement des États-Unis a annoncé qu'il changeait la façon dont il protège l'identité des individus pour le recensement de 2020, une équipe de recherche dirigée par Penn State a commencé à évaluer comment ces changements peuvent affecter l'intégrité des données de recensement.

    Le Census Bureau propose d'utiliser la confidentialité différentielle, une nouvelle méthode qui tente de protéger l'identité des individus lors de la publication de données publiques. Les données du recensement sont utilisées pour répartir le financement fédéral qui a un impact sur les communautés et détermine également la représentation au Congrès.

    Alexis Santos, professeur adjoint de développement humain et d'études familiales à Penn State, avec les chercheurs Jeffrey Howard, professeur assistant à l'Université du Texas à San Antonio, et Ashton Verdery, maître de conférences en sociologie, démographie, et l'analyse des données sociales à Penn State, ont examiné les taux de mortalité en 2010. Les chercheurs ont comparé les deux méthodes de protection de la vie privée et l'implication de ce changement pour mieux comprendre les disparités en matière de santé aux États-Unis. L'ouvrage a été publié récemment dans Actes de l'Académie nationale des sciences .

    L'équipe de recherche a découvert que lorsque la méthode de confidentialité différentielle était utilisée sur les données du recensement, il a produit des changements dramatiques dans les décomptes de population pour les minorités raciales et ethniques par rapport aux méthodes traditionnelles.

    « Nous nous sommes concentrés sur les estimations des taux de mortalité parce qu'elles constituent une mesure essentielle au niveau de la population pour laquelle des données sont collectées et diffusées au niveau national et parce que les taux de mortalité sont un indicateur essentiel de la santé de la population, " dit Santos.

    L'équipe de recherche a ensuite exploré les changements dans les taux de mortalité résultant des deux systèmes d'évitement de divulgation selon les classifications métropolitaines.

    "Nous avons découvert qu'en utilisant la confidentialité différentielle, il y a eu à la fois des cas de sous-dénombrement et de surdénombrement de la population. Dans les zones rurales, il y avait un sous-dénombrement des minorités raciales et ethniques, alors que dans les zones urbaines il y avait un surdénombrement de ces populations, " a déclaré Santos.

    Les chercheurs ont constaté que certains écarts entre les deux méthodes d'analyse des données dépassaient une différence de 10 %.

    "C'est très préoccupant car cela pourrait avoir un impact sur le montant des programmes de financement reçus pour une zone géographique spécifique, ", a déclaré Santos. "Ces écarts pourraient entraîner des risques pour la santé sous-estimés dans certaines régions, et tout en exagérant dans d'autres où il n'y a pas un grand besoin."

    Selon Santos, les résultats mettent en évidence les conséquences de la mise en œuvre de la confidentialité différentielle et démontrent les défis liés à l'utilisation des produits de données dérivés de cette méthode.

    "Le Census Bureau a été très réceptif à nos recherches, et s'est montré préoccupé par l'exactitude des données, " a déclaré Santos. " Nous prévoyons d'aller de l'avant avec des recherches supplémentaires pour déterminer comment la confidentialité différentielle peut affecter les estimations de la croissance de la population et les changements de population d'une année de recensement à l'autre. Nous avons encore le temps de peaufiner l'algorithme de confidentialité différentielle, et nos recherches aideront à identifier les domaines d'amélioration. »


    © Science https://fr.scienceaq.com