Ce 23 mars, 2018, La photo d'archive montre une enveloppe contenant une lettre du recensement de 2018 envoyée par la poste à un résident américain dans le cadre de la seule série d'essais du recensement de 2020. La Cour suprême décidera si le recensement de 2020 peut inclure une question sur la citoyenneté qui pourrait affecter l'attribution des sièges à la Chambre des représentants et la distribution de milliards de dollars de fonds fédéraux. (AP Photo/Michelle R. Smith, Déposer)
Une équipe interne du Census Bureau a découvert que les informations personnelles de base recueillies auprès de plus de 100 millions d'Américains au cours du dénombrement de 2010 pouvaient être reconstituées à partir de données obscurcies, mais avec beaucoup d'erreurs, un haut responsable de l'agence a révélé samedi.
L'âge, genre, emplacement, la race et l'origine ethnique de 138 millions de personnes étaient potentiellement vulnérables. Jusque là, cependant, seules les équipes de piratage internes ont découvert de tels détails à risque possible, et aucun groupe extérieur n'est connu pour avoir récupéré des données destinées à rester privées pendant 72 ans, a déclaré le scientifique en chef John Abowd lors d'une conférence scientifique.
Le Census Bureau abandonne maintenant son ancienne technique de protection des données pour une méthode de pointe qui, selon Abowd, est bien meilleure que celle de Google ou d'Apple.
Certains anciens chefs d'agence craignent que le problème potentiel de confidentialité n'ajoute aux inquiétudes que les gens évitent de répondre ou de mentir à l'enquête une fois tous les 10 ans en raison de la tentative de l'administration Trump d'ajouter une question de citoyenneté très controversée.
La Cour suprême a annoncé vendredi qu'elle se prononcerait sur cette question proposée, qui a été critiqué pour son caractère politique et n'a pas été correctement testé sur le terrain. Le dénombrement est extrêmement important, aider à l'attribution des sièges à la Chambre des représentants et à la distribution de milliards de dollars d'argent fédéral.
Les 8 milliards de statistiques contenues dans les données du recensement sont censées être mélangées de manière à ce que ce qui est publié publiquement pour la recherche ne puisse identifier les individus pendant plus de sept décennies. En 2010, le Census Bureau l'a fait en échangeant des informations similaires sur les ménages d'une ville à une autre, selon le professeur de statistiques de l'Université Duke, Jerome Reiter.
Dans les tests internes, Abowd a dit, les responsables ont pu faire correspondre 45 pour cent des personnes ayant répondu au recensement de 2010 avec des informations provenant d'ensembles de données publics et commerciaux tels que Facebook. Mais des erreurs dans cette technique signifiaient que seules les données de 52 millions de personnes seraient tout à fait correctes, soit un peu plus d'un sur six de la population américaine.
Il a déclaré que le recensement de 2010 a utilisé la meilleure protection de la vie privée disponible, mais les pirates informatiques depuis lors sont devenus plus habiles à reconstruire des données. Pour contrer leurs capacités croissantes, l'agence a complètement changé le système pour 2020 et offrira le "gold standard" de la vie privée quel que soit le sort de la question de citoyenneté, dit Abowd.
Les gens « veulent savoir que les tableaux statistiques ne vont pas revenir les hanter, " Abowd a déclaré lors de la réunion annuelle de l'Association américaine pour l'avancement des sciences. "Je promets au peuple américain qu'ils auront la vie privée qu'ils méritent."
Robert Groves, recteur de l'université de Georgetown, qui a dirigé le recensement de 2010, a déclaré que le décompte avait la confidentialité appropriée et que chaque recensement s'améliore. Il a salué les nouvelles étapes.
L'ancien chef d'agence Kenneth Prewitt, professeur de politique à l'Université Columbia, dit les informations de base telles que l'âge et l'origine ethnique, même s'il est révélé publiquement, n'est pas aussi grave que les autres violations de données.
« Il y a une anxiété généralisée en matière de confidentialité qui est très liée à Facebook et Google et ainsi de suite, " a déclaré Prewitt. "Je suis beaucoup plus inquiet du fait que mon iPhone me suive tous les jours."
Dans un rapport, Fred Sainz d'Apple a contesté ces problèmes de confidentialité :« L'iPhone ne vous suit pas toute la journée, Apple n'a aucune idée de l'endroit où vous êtes et nous ne nous en soucions pas. Et Apple ne vend pas d'informations aux entreprises. Il a noté, cependant, que les consommateurs peuvent choisir des applications qui connaissent leur emplacement.
Abowd a déclaré que "le recensement de 2020 sera le plus sûr et le mieux protégé de tous les temps. Et ce n'est pas aussi facile qu'il y paraît".
Le nouveau système implique des algorithmes mathématiques complexes qui injectent du « bruit » dans les données, rendant plus difficile l'obtention d'informations précises et offrant « une très forte garantie » de confidentialité, a déclaré Ashwin Machanavajjhala, professeur d'informatique à l'Université Duke.
Cela augmente la confidentialité tout en réduisant la précision pour les chercheurs qui utilisent les statistiques. Considérez-le comme un ensemble de boutons activés tandis qu'un second est composé en même temps.
La décision sur le paramètre officiel de confidentialité/précision pour 2020 n'a pas été prise. Abowd a déclaré que les responsables politiques, pas des ingénieurs ou des scientifiques, fera cet appel.
Le Census Bureau a essayé ce système dans une enquête de 2018 en utilisant un paramètre de confidentialité ultra-strict qui, sans être directement comparable à Google ou Apple, est des centaines, voire des milliers de fois plus sécurisé pour la confidentialité que ce qui est maintenant utilisé sur les données des recherches utilisant Google Chrome ou l'iPhone d'Apple, dit Duke's Reiter.
Prewitt a suggéré que le public pourrait ne pas comprendre les efforts supplémentaires en cours pour le décompte de 2020, mais serait effrayé par la divulgation de la vulnérabilité de la vie privée, rendre les gens plus réticents à se conformer au prochain recensement.
Si l'administration réussit à ajouter la question de citoyenneté, « il y aura une énorme évasion (le recensement) et une certaine utilisation abusive de celui-ci, " a déclaré Prewitt.
Que certains évitent l'enquête à cause de cela ou mentent, ce n'est pas non plus un bon résultat, rendre les données moins exploitables, dit Prewitt.
Groves a déclaré que les experts techniques ont de sérieux problèmes avec la question de la citoyenneté parce qu'elle n'a pas été testée sur le terrain, comme le sont généralement toutes les questions du recensement. Il a comparé cela à la mise sur le marché d'un nouveau médicament avant les tests nécessaires.
"Une formulation très subtile et des changements de position dans une chose comme le recensement peuvent avoir un impact énorme bien au-delà de ce que nous, humains, pouvons prédire, " a dit Groves
© 2019 La Presse Associée. Tous les droits sont réservés.