L'indice Coleman-Liau montre le niveau de lecture des discours du Congrès démocrate et républicain de 1873 à 2010. Crédit :Kansas State University
Les recherches de la Kansas State University montrent comment les politiciens des deux principaux partis ont changé leur discours politique par rapport aux siècles précédents.
Une équipe de recherche en informatique de K-State a analysé près de 2 millions de discours au Congrès prononcés par des législateurs républicains et démocrates de 1873 à 2010. Leur analyse informatique montre que les discours politiques sont en fait très différents dans leur style des discours politiques prononcés au Congrès il y a plusieurs décennies. .
Dans le document de recherche "Une approche de la science des données à 138 ans de discours du Congrès" publié récemment dans la revue Héliyon , Ethan Tucker et Colton Capps, étudiants en informatique de K-State, et le professeur agrégé d'informatique Lior Shamir ont utilisé des algorithmes d'analyse de texte automatique pour analyser les discours du Congrès au cours de différentes années.
"Les résultats de la recherche montrent que les discours plus récents utilisent un vocabulaire plus restreint, langage plus simple, exprimer des sentiments plus positifs ou négatifs, et ont des différences plus notables entre les locuteurs démocrates et républicains, " a déclaré Shamir.
Les algorithmes ont mesuré différents aspects des discours tels que le vocabulaire, le niveau de lecture, les sentiments positifs ou négatifs exprimés dans les discours, et plus. Les sentiments sont mesurés en utilisant l'intelligence artificielle en lisant le texte et en associant des mots et des phrases à des sentiments positifs ou négatifs en fonction de leur contexte.
« Sur la base de cette analyse, l'algorithme détermine si un morceau de texte est positif, très positif, négatif, très négatif ou neutre, " dit Shamir.
Les algorithmes ont également mesuré la fréquence à laquelle différents sujets ont été discutés. Ces éléments de discours quantitatifs ont été calculés à partir de milliers de discours du Congrès prononcés chaque année, et la moyenne de chaque année a permis de mesurer les changements dans la langue et les sujets discutés au Congrès sur une période de 138 ans, dit Shamir.
La recherche a montré que la fréquence des mots liés à l'identité des femmes, comme elle, sa, la sienne, femme, femmes, etc.—est en augmentation constante depuis le début des années 1980, tandis que la fréquence des mots qui identifient les hommes a diminué. La fréquence des mots liés à l'identité des femmes au 21e siècle est cinq fois plus élevée que dans les années 1950, mais toujours inférieure à la fréquence des mots liés à l'identité masculine. Depuis les années 1990, les termes liés à l'identité des femmes sont plus fréquents dans les discours prononcés par les législateurs démocrates que dans les discours prononcés par les législateurs républicains.
« Pendant la plus grande partie du 20e siècle, cependant, il n'y avait pas de différences substantielles entre l'identité des femmes dans les discours démocrates et républicains, et les expressions de l'identité des femmes étaient environ 10 fois moins fréquentes que les expressions de l'identité des hommes par les législateurs des deux partis, " a déclaré Shamir.
La recherche a également montré que le niveau de lecture des discours a considérablement changé au fil des ans. L'analyse a mesuré l'indice de lisibilité Coleman-Liau, qui estime le niveau de lecture d'un certain texte et l'associe au niveau scolaire approprié. L'analyse a montré que le niveau de lecture des discours du Congrès prononcés par les législateurs républicains et démocrates a augmenté de manière constante par rapport au niveau de lecture de la huitième année au 19e siècle, jusqu'à la 10e année dans les années 1970. Mais depuis 1976, le niveau de lecture des discours politiques n'a cessé de baisser, et à partir du 21ème siècle, il est inférieur au niveau de lecture de la neuvième année. La même tendance a également été observée avec le vocabulaire utilisé par les membres du Congrès dans les discours, qui n'avait cessé d'augmenter jusqu'au début des années 1970, puis a commencé à décliner - et il continue de décliner, dit Shamir.
L'analyse des discours par les chercheurs a également montré que les discours plus récents du Congrès expriment des sentiments plus positifs et négatifs que les discours prononcés au Congrès au XIXe siècle et au début du XXe siècle. Les sentiments dans les discours politiques sont devenus progressivement plus positifs et ont culminé dans les années 1960, mais a fortement diminué au cours des années 1970. Depuis les années 1970, les sentiments exprimés dans les discours du Congrès sont devenus plus positifs.
Selon l'étude, la baisse du niveau de lecture et du vocabulaire des discours peut être liée à la présence croissante des médias - y compris la couverture radio et TV en direct - au Congrès à partir des années 1970. Les membres du Congrès ont commencé à ajuster progressivement leurs styles de discours, s'adressant au public par le biais des médias plutôt que de s'adresser à leurs collègues législateurs.
Un autre aspect reflété dans l'analyse était la scission partisane, dit Shamir. À partir du milieu des années 90, Les discours républicains et démocrates sont devenus de plus en plus différents les uns des autres et également en corrélation avec l'affiliation politique du président. Par exemple, pendant l'administration de George W. Bush, les discours des législateurs démocrates ont exprimé des sentiments plus négatifs par rapport à leurs homologues républicains. Cette différence s'est inversée immédiatement après 2008, avec le début de l'administration Obama, au cours de laquelle les discours républicains sont devenus plus négatifs.
"Avec le traitement du langage naturel, nous pouvons extraire de nouvelles connaissances à partir d'anciennes données, " Shamir a déclaré. "Il n'y a aucun moyen pratique de quantifier et de profiler un si grand nombre de discours sans utiliser d'ordinateurs."