• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  Science >> Science >  >> Autres
    L'étude d'une nouvelle méthode utilisée pour préserver la confidentialité des données du recensement américain suggère que l'exactitude en a souffert
    Erreur quadratique moyenne estimée (RMSE) pour les décomptes de population d'un groupe racial/ethnique, à chaque niveau géographique. Le RMSE quantifie l’ampleur moyenne de l’erreur pour une géographie donnée pour une unité géographique particulière. Les triangles pour le RMSE indiquent que l’erreur quadratique moyenne estimée était négative et a donc été fixée à zéro. Crédit :Progrès scientifiques (2024). DOI :10.1126/sciadv.adl2524

    Une petite équipe de politologues, de statisticiens et de data scientists de l'Université Harvard, de l'Université de New York et de l'Université de Yale, a découvert qu'en adoptant une nouvelle méthode pour mieux protéger la vie privée, le Département américain du recensement a introduit des facteurs qui réduisent l'exactitude dans certains cas. .



    Dans leur article publié dans la revue Science Advances , le groupe décrit comment il a analysé un fichier fourni par les responsables du recensement pour mesurer l'exactitude des données de recensement accessibles au public et de leurs résultats.

    Avant le recensement américain de 2020, les responsables du US Census Bureau, soucieux de la vie privée des personnes qui fournissent des réponses au recensement, ont choisi de modifier la méthode par laquelle ils garantissaient la sécurité des données.

    L’ancienne méthode s’appelait « l’échange ». Cela impliquait d’échanger les données des personnes vivant dans un pâté de maisons d’une ville avec celles d’un autre pâté de maisons, empêchant ainsi les personnes d’être identifiées sur la base de leurs données. La nouvelle méthode est appelée « confidentialité différentielle » et consiste à ajouter ce que le Bureau décrit comme du « bruit » à chaque élément de données collecté.

    Dans ce nouvel effort, l’équipe de recherche n’a trouvé aucun exemple d’entité extérieure menant des recherches pour déterminer si la nouvelle méthode offrait effectivement plus de confidentialité ou si les données traitées étaient plus ou moins précises que ce n’était le cas lorsque l’échange était utilisé. Alors, ils ont commencé le leur.

    L’étude a commencé lorsque l’équipe de recherche a demandé au Census Bureau de leur donner accès à ce qu’on appelle le fichier de mesure bruyant (NMF), celui utilisé pour le recensement de 2020. Le Bureau a rejeté la demande, ce qui a conduit l'équipe à les poursuivre en justice. Finalement, le procès a été abandonné lorsque le Bureau a accepté de donner à l'équipe le NMF associé au recensement beaucoup plus petit de 2010, qui a été réalisé comme un moyen de tester la nouvelle méthode et impliquait à la fois un échange et une différenciation.

    Les chercheurs ont ensuite analysé ce fichier afin d'étudier l'impact sur la précision du passage au nouveau système. Ce faisant, ils ont constaté que, dans l’ensemble, les deux systèmes offraient une précision à peu près égale à grande échelle. Mais ils ont également trouvé des preuves d'une réduction de la précision au niveau des blocs, d'un type qui pourrait avoir un impact négatif sur les minorités et les populations multiraciales.

    Plus d'informations : Christopher T. Kenny et al, Évaluation des biais et du bruit induits par les méthodes de protection de la vie privée du Bureau du recensement des États-Unis, Science Advances (2024). DOI :10.1126/sciadv.adl2524

    Informations sur le journal : Progrès scientifiques

    © 2024 Réseau Science X




    © Science https://fr.scienceaq.com