Alors que les lois d'identification des électeurs (ID) des États à travers le pays sont contestées au milieu de questions sur l'intégrité du processus de vote, les chercheurs ont développé une nouvelle méthode statistique qui non seulement fait correspondre plusieurs enregistrements avec précision, mais peut également identifier l'étendue de la discrimination lorsqu'elle est appliquée aux lois sur l'identification des électeurs. Récemment présenté dans la revue Statistics and Public Policy de l'American Statistical Association, la recherche intitulée « ADGN :un algorithme pour le couplage d'enregistrements utilisant l'adresse, Date de naissance, Sexe et nom" a été appliqué à une loi de 2011 sur l'identification des électeurs du Texas (S.B. 14), sur lequel le ministère de la Justice des États-Unis a enquêté comme possiblement discriminatoire.
"Nos preuves suggèrent qu'un plus petit nombre de personnes n'ont pas de carte d'identité que ne le suggèrent les données d'enquêtes récentes, et il suggère également un effet discriminatoire de la loi, conformément aux préoccupations de ceux qui pensent que ces lois affectent de manière disproportionnée les minorités, " a noté Eitan Hersh, professeur agrégé de sciences politiques à l'Université Tufts et co-auteur de l'article. "Spécifiquement, nous avons constaté que les électeurs blancs inscrits sont beaucoup plus susceptibles de posséder une carte d'identité d'électeur que les électeurs afro-américains ou hispaniques."
Hersh et son collègue chercheur Stephen Ansolabehere, professeur de gouvernement à l'Université Harvard, conçu un moyen de lier des enregistrements individuels à travers des bases de données. Une telle liaison est difficile car les bases de données ont tendance à contenir des erreurs et des valeurs manquantes et manquent souvent d'identifiants uniques tels que les numéros de sécurité sociale. Leurs efforts utilisant des combinaisons d'adresse (A), date de naissance (D), genre (G), et le nom (N) correspond aux enregistrements à peu près aussi précisément que s'ils avaient le numéro de sécurité sociale d'un individu.
« Les lois sur l'identification des électeurs sont devenues une source de débats et de controverses, et nous pensons que c'est la preuve la plus solide à ce jour sur l'ampleur et l'effet discriminatoire des lois sur les minorités protégées par rapport aux électeurs blancs, " continua Hersh.
Typiquement, les lois sur l'identification des électeurs sont étudiées en réalisant et en analysant les données d'enquêtes, bien que sonder les gens pour savoir s'ils ont des pièces d'identité valides - et si une pièce d'identité non valide les a empêchés de voter - reste difficile. Dans le cas de la loi sur l'identification des électeurs du Texas, les résultats ont été le résultat de l'appariement de 13 millions d'électeurs inscrits à toutes les formes d'identification pouvant être utilisées par les électeurs présentant une pièce d'identité.
L'application du modèle ADGN ne se limite pas au contentieux de l'inscription et de l'identification des électeurs. En réalité, Hersh et Ansolabehere pensent que la possibilité de lier des enregistrements avec un haut degré de précision est instructive pour la recherche, en général, ainsi qu'à des applications dans une gamme de domaines tels que la santé publique, criminologie, marketing et recensements gouvernementaux.