Les électeurs peuvent interagir à la fois au sein des États et entre eux, ainsi potentiellement influencer les opinions politiques des uns et des autres. Crédit :Figure reproduite avec l'aimable autorisation d'Alexandria Volkening, Daniel F. Linder, Mason A. Porter, et Grzegorz A. Rempala.
La prévision des élections est un problème à enjeux élevés. Les politiciens et les électeurs sont souvent désespérés de connaître l'issue d'une course serrée, mais leur fournir des prédictions incomplètes ou inexactes peut être trompeur. Et la prévision des élections est déjà un défi intrinsèquement difficile - le processus de modélisation est truffé d'incertitudes, information incomplète, et des choix subjectifs, tout cela doit être habilement manipulé. Les experts politiques et les chercheurs ont mis en œuvre un certain nombre d'approches réussies pour prévoir les résultats des élections, avec divers degrés de transparence et de complexité. Cependant, les prévisions électorales peuvent être difficiles à interpréter et peuvent laisser de nombreuses questions sans réponse après des courses serrées.
Ces défis ont conduit les chercheurs à se demander si l'application d'un modèle de maladie aux élections pourrait élargir la communauté impliquée dans la prévision politique. Dans un journal qui publie aujourd'hui dans Revue SIAM , Alexandria Volkening (Université Northwestern), Daniel F. Linder (Université Augusta), Mason A. Porter (Université de Californie, Los Angeles), et Grzegorz A. Rempala (The Ohio State University) a emprunté des idées à l'épidémiologie pour développer une nouvelle méthode de prévision des élections. L'équipe espérait élargir la communauté qui s'engage avec les données de sondage et soulever des questions de recherche sous un nouvel angle ; la nature multidisciplinaire de leur modèle de maladies infectieuses était une vertu à cet égard. "Notre travail est entièrement open-source, " a déclaré Porter. " J'espère que cela encouragera d'autres à s'appuyer davantage sur nos idées et à développer leurs propres méthodes de prévision des élections. "
Dans leur nouveau papier, les auteurs proposent un modèle mathématique basé sur les données de l'évolution des opinions politiques lors des élections américaines. Ils ont trouvé les paramètres de leur modèle en utilisant des données de sondage agrégées, ce qui leur a permis de suivre les pourcentages d'électeurs démocrates et républicains au fil du temps et de prévoir les marges de vote dans chaque État. Les auteurs ont mis l'accent sur la simplicité et la transparence dans leur approche et considèrent ces traits comme des atouts particuliers de leur modèle. "Les modèles compliqués doivent tenir compte de l'incertitude dans de nombreux paramètres à la fois, " a déclaré Rempala.
Prévisions des élections présidentielles de 2012 et 2016, développé en utilisant les données des sondages jusqu'au jour du scrutin. Les barres de couleur plus foncée montrent les prévisions du modèle, et les barres de couleur plus claire sont les résultats des élections. Les états pour lesquels le modèle a produit des prédictions incorrectes sont écrits avec du texte vert. Crédit :Figure reproduite avec l'aimable autorisation d'Alexandria Volkening, Daniel F. Linder, Mason A. Porter, et Grzegorz A. Rempala.
Cette étude s'est principalement concentrée sur l'influence que les électeurs de différents États peuvent exercer les uns sur les autres, car la comptabilisation précise des interactions entre les états est cruciale pour la production de prévisions fiables. Les résultats des élections dans les États à démographie similaire sont souvent corrélés, et les États peuvent également s'influencer de manière asymétrique; par exemple, les électeurs de l'Ohio peuvent influencer plus fortement les électeurs de Pennsylvanie que l'inverse. La force de l'influence d'un État peut dépendre d'un certain nombre de facteurs, y compris le temps que les candidats passent à faire campagne là-bas et la couverture de l'État dans les nouvelles. Pour développer leur approche prévisionnelle, l'équipe a réutilisé les idées de la modélisation compartimentale des maladies biologiques. Les mathématiciens utilisent souvent des modèles compartimentés, qui classent les individus en quelques types distincts (c. compartiments) - pour examiner la propagation des maladies infectieuses comme la grippe et le COVID-19. Un modèle compartimental largement étudié appelé modèle sensible-infecté-sensible (SIS) divise une population en deux groupes :ceux qui sont susceptibles de tomber malades et ceux qui sont actuellement infectés. Le modèle SIS suit ensuite les fractions d'individus sensibles et infectés dans une communauté au fil du temps, en fonction des facteurs de transmission et de récupération. Lorsqu'une personne infectée interagit avec une personne sensible, l'individu sensible peut être infecté. Une personne infectée a également une certaine chance de se rétablir et de redevenir sensible.
Parce qu'il y a deux grands partis politiques aux États-Unis, les auteurs ont utilisé une version modifiée d'un modèle SIS avec deux types d'infections. "Nous avons utilisé des techniques de l'épidémiologie mathématique parce qu'elles nous ont donné un moyen de cadrer les relations entre les états d'une manière familière, manière pluridisciplinaire, " a déclaré Volkening. Bien que les élections et la dynamique des maladies soient certainement différentes, les chercheurs ont traité les penchants démocrates et républicains pour le vote comme deux types possibles d'"infections" qui peuvent se propager entre les États. Indécis, indépendant, ou les électeurs des partis mineurs entrent tous dans la catégorie des individus susceptibles. « Infection » a été interprétée comme l'adoption d'opinions démocrates ou républicaines, et la "récupération" représentait le passage d'électeurs engagés à des indécis.
Dans le modèle, les électeurs engagés peuvent transmettre leurs opinions aux électeurs indécis, mais le contraire n'est pas vrai. Les chercheurs ont eu une vision large de la transmission, interpréter la persuasion d'opinion comme se produisant à la fois par la communication directe entre les électeurs et des méthodes plus indirectes comme la campagne, couverture médiatique, et débats. Les individus peuvent interagir et amener d'autres personnes à changer d'opinion à la fois au sein des États et entre eux.
Prévisions de l'élection présidentielle américaine de 2020 qui ont été faites le 27 octobre en utilisant le modèle des chercheurs sur les maladies infectieuses. Prévisions sénatoriales et de gouverneur, ainsi qu'un lien vers le code correspondant, sont disponibles sur https://modelingelectiondynamics.gitlab.io/2020-forecasts. Crédit :Figure reproduite avec l'aimable autorisation de Samuel Chian, William L. Il, Christopher M. Lee, Daniel F. Linder, Mason A. Porter, Grzegorz A. Rempala, et Alexandrie Volkening.
Pour déterminer les valeurs des paramètres mathématiques de leurs modèles, les auteurs ont utilisé les données des sondages sur les sénateurs, du gouverneur, et les courses présidentielles de HuffPost Pollster pour 2012 et 2016 et RealClearPolitics pour 2018. Ils ont adapté le modèle aux données de chaque course individuelle et ont simulé l'évolution des opinions dans l'année précédant chaque élection en suivant les fractions d'indécis, Démocratique, et les électeurs républicains dans chaque État de janvier jusqu'au jour des élections. Les chercheurs ont simulé leurs prévisions finales comme s'ils les avaient faites à la veille du jour des élections, incluant toutes les données du scrutin mais en omettant les résultats des élections.
Malgré son ancrage dans un domaine non conventionnel de la prévision électorale, à savoir, épidémiologie - le modèle résultant a fonctionné étonnamment bien. Il prévoyait les courses américaines de 2012 et 2016 pour le gouverneur, Sénat, et le bureau présidentiel avec un taux de réussite similaire à celui des sites d'analystes populaires FiveThirtyEight et Crystal Ball de Sabato. Par exemple, le taux de réussite des auteurs pour prédire les résultats des partis au niveau de l'État lors des élections présidentielles de 2012 et 2016 était de 94,1 %, tandis que FiveThirtyEight a eu un taux de réussite de 95,1% et Crystal Ball de Sabato a eu un taux de réussite de 93,1%. "Nous avons tous été initialement surpris qu'un modèle de transmission de la maladie puisse produire des prévisions significatives des élections, " dit Volkening.
Après avoir établi la capacité de leur modèle à prévoir les résultats à la veille du jour des élections, les auteurs ont cherché à déterminer à quel moment le modèle pouvait créer des prévisions précises. Les prédictions faites dans les semaines et les mois précédant le jour du scrutin sont particulièrement significatives, mais produire des prévisions précoces est difficile car moins de données de sondage sont disponibles pour l'apprentissage du modèle. En utilisant les données des sondages des courses sénatoriales 2018, le modèle de l'équipe a pu produire des prévisions stables à partir de début août avec le même taux de réussite que les prévisions finales de FiveThirtyEight pour ces courses.
Malgré des différences claires entre la contagion et la dynamique de vote, cette étude suggère une approche valable pour décrire comment les opinions politiques changent à travers les états. Volkening applique actuellement ce modèle, en collaboration avec les étudiants de premier cycle de la Northwestern University Samuel Chian, William L. Il, et Christopher M. Lee—pour prévoir la présidentielle américaine de 2020, sénatorial, et les élections au poste de gouverneur. "Ce projet m'a fait réaliser qu'il est difficile de juger des prévisions, surtout lorsque certaines élections sont décidées par une marge de vote inférieure à un pour cent, " Volkening a déclaré. " Le fait que notre modèle fonctionne bien est excitant, car il existe de nombreuses façons de le rendre plus réaliste à l'avenir. Nous espérons que notre travail encouragera les gens à réfléchir de manière plus critique sur la façon dont ils jugent les prévisions et à s'impliquer eux-mêmes dans les prévisions électorales."