Le professeur de sciences politiques de l'Université Purdue Eric Waltenburg et le professeur adjoint d'informatique Dan Goldwasser se sont associés pour concevoir un modèle de prévision qui utilise la science des données pour déterminer les votes des législateurs des États. Crédit :Université Purdue
Lorsque les États-Unis se sont retirés de l'Accord de Paris sur le climat l'année dernière, 20 États, dont New York et la Californie, ont décidé de former un nouveau accord non fédéral pour lutter contre le changement climatique et les émissions de gaz à effet de serre.
Selon le professeur de science politique de l'Université Purdue Eric Waltenburg, de nombreuses décisions politiques significatives comme celle-ci ont lieu au niveau de l'État mais sont largement ignorées par le public. Il collabore avec Dan Goldwasser, professeur assistant en informatique, aider les gens à mieux comprendre l'impact des décisions prises au niveau de l'État. Ensemble, ils dirigent un projet axé sur le développement d'un modèle de prévision pour prédire le comportement de vote des législateurs de l'État.
"Si notre projet fonctionne comme je l'espère, cela ouvrira le processus d'élaboration des politiques et les gens auront une meilleure idée de ce que peuvent être les résultats législatifs, " Waltenburg a déclaré. " Cela démystifierait le processus législatif de l'État pour le public. "
Les assemblées législatives des États sont des assemblées de membres élus qui votent sur les lois et les politiques de leur État. Lors d'un vote par appel nominal, le nom de chaque législateur est appelé, et ils doivent indiquer officiellement s'ils sont pour ou contre une loi particulière. En utilisant des sources publiques telles que Twitter, blogs politiques, comptes de journaux et données historiques sur les appels de la dernière décennie, les informaticiens travaillant avec Waltenburg utiliseront des techniques d'apprentissage automatique pour prédire de quelle manière un législateur peut voter sur un projet de loi particulier.
"Ce que nous essayons de faire, c'est d'identifier les forces clés - je les appelle préférences révélées - parmi les législateurs et d'utiliser ces préférences pour prédire les résultats, " Waltenburg a déclaré. "Nous avons d'énormes quantités de données historiques d'appels nominaux au niveau de l'État, et avec ces données, nous sommes en mesure de produire des matrices relationnelles sur la façon dont chaque législateur vote par rapport à tous les autres membres de la législature."
Finalement, ils visent à produire un site Web où les gens pourraient aller pour prédire le résultat d'un projet de loi particulier. Goldwasser a ajouté que l'impact des décisions prises au niveau de l'État est plus important que les gens ne le pensent, malgré le fait qu'ils n'auront pas la même couverture que ceux réalisés au niveau national.
"Nous espérons vraiment que ce serait un service public qui permettrait aux gens de demander des comptes à leurs représentants et au moins de prendre des décisions plus éclairées lorsqu'ils se rendent aux urnes, " a déclaré Goldwasser.
A la fin de l'été, leur projet se sera étendu au-delà de l'état de l'Indiana jusqu'à l'Oregon et le Wisconsin, où ils testeront leur modèle de prévision sur les chambres de niveau inférieur de ces États. Finalement, ils aimeraient transformer leur modèle de statique en dynamique, apporter des données en temps réel de Twitter et d'autres sources en ligne afin que le modèle puisse adapter la matrice relationnelle au fur et à mesure que les préférences révélées entrent en jeu.
« L'une des questions que nous nous posons est, comment pouvons-nous utiliser des ressources en ligne telles que Twitter ou la couverture de l'actualité pour mettre à jour dynamiquement le modèle que nous avons à propos de ces préférences ?", a déclaré Goldwasser. « Quand le comportement d'un législateur d'État n'est pas explicitement mentionné, nous pouvons apprendre à déduire leur comportement."
L'équipe dispose d'un modèle statique pour l'Indiana House, mais souhaite finalement développer un modèle de prévision pour tous les États et leurs chambres. Leur projet était l'un des huit sélectionnés par la Purdue's Integrative Data Science Initiative pour être financé pour une période de deux ans. L'initiative encouragera la collaboration interdisciplinaire et s'appuiera sur les forces de Purdue pour positionner l'université en tant que chef de file de la recherche en science des données et se concentrer sur l'un des quatre domaines suivants :soins de santé ; la défense; éthique, société et politique; et fondamentaux, méthodes, et algorithmes. Les axes de recherche de l'Initiative de science des données intégratives sont hébergés par le Discovery Park de Purdue.
"Bien que l'idée de prédire les votes législatifs soit un sujet de science politique assez conventionnel, L'expertise de Dan nous permet de développer un modèle de prévision qui va bien au-delà de ce que la plupart des politologues ont obtenu, " a déclaré Waltenburg. " Le projet sur lequel nous travaillons est un excellent exemple de la façon dont les ressources et le corps professoral de Purdue s'entraident pour mettre en œuvre des idées et collaborer à travers le campus et les disciplines. "