• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  •  science >> Science >  >> Autres
    Détectives de mots :la science peut aider un chroniqueur d'opinion

    Crédit :CC0 Domaine public

    Les détectives linguistiques disent que les indices clés sur qui a écrit l'article d'opinion anonyme du New York Times claquant le président Donald Trump peuvent ne pas être l'étrange et scintillant "lodestar, " mais les petits mots que les gens lisent habituellement juste par dessus :" Je, " "de" et "mais".

    Et lodestar ? Cela pourrait être un hareng rouge destiné à faire dévier les détectives, disent certains experts.

    Les experts utilisent une combinaison d'utilisation de la langue, statistiques et informatique pour aider à déterminer qui a écrit des documents anonymes ou éventuellement plagiés. Ils ont même résolu des crimes et des mystères historiques de cette façon. Certains appellent le domaine la linguistique médico-légale, d'autres l'appellent stylométrie ou font simplement « attribution d'auteur ».

    Le domaine est soudainement sur le devant de la scène après qu'un "haut responsable de l'administration" non identifié a écrit dans le Times qu'il faisait partie d'un mouvement de "résistance" travaillant au sein de l'administration pour freiner les impulsions les plus dangereuses de Trump.

    « Mon téléphone a sonné avec des demandes pour faire cette analyse et je n'ai tout simplement pas le temps, " explique Patrick Juola, informaticien et langagier de l'Université Duquesne.

    Robert Léonard, un professeur de linguistique de l'Université Hofstra qui a aidé à résoudre des meurtres en examinant la langue, dit si les experts pouvaient obtenir le bon nombre d'échantillons d'écriture de fonctionnaires dont l'identité est connue, "une analyse pourrait certainement être faite."

    Un politologue estime qu'il y a environ 50 personnes dans l'administration Trump qui correspondent à la description du Times en tant que haut responsable de l'administration et pourraient être l'auteur. La clé serait de regarder comment ils écrivent, les mots qu'ils utilisent, quels mots ils mettent les uns à côté des autres, orthographe, la ponctuation et même les temps, les experts disent.

    "La langue est un ensemble de choix. Que dire, comment le dire et quand le dire, « Dit Juola. « Et il y a beaucoup d'options différentes. »

    L'une des techniques préférées de Juola et d'autres experts consiste à examiner ce qu'on appelle les « mots fonctionnels ». Ce sont des mots que les gens utilisent tout le temps mais qui sont difficiles à définir car ils fournissent plus de fonction que de sens. Quelques exemples sont "de, " ''avec, " ''les, " ''une, " " sur " et " et ".

    "Nous les utilisons tous mais nous ne les utilisons pas de la même manière, " dit Juola. " Nous ne les utilisons pas à la même fréquence. " Il en va de même avec les apostrophes et autres signes de ponctuation.

    Par exemple, dites-vous "différent de" ou "différent de ?" demande Shlomo Argamon, expert en informatique et en données, de l'Illinois Institute of Technology.

    Les femmes ont tendance à utiliser davantage les pronoms à la première et à la deuxième personne :« Je, " '' moi " et " toi " - et plus présent, dit Argamon.

    Les hommes utilisent "le, " ''de, " '' ceci " et " cela " plus souvent, il dit.

    "Vous cherchez des indices et vous essayez d'évaluer l'utilité de ces indices, " dit Argamon. Mais il est moins optimiste que l'affaire Trump sera fissurée pour diverses raisons, y compris l'édition du New York Times pour le style et les efforts possibles pour tromper les détectives linguistiques avec des mots que quelqu'un d'autre aime utiliser comme "lodestar". Principalement, il est pessimiste parce que pour faire une bonne comparaison, des échantillons de tous les suspects doivent être collectés et doivent être similaires, comme toutes les chroniques d'opinion par opposition aux romans, discours ou articles de magazine.

    Rachel Greenstadt de l'Université Drexel étudie les cas où les gens essaient de décourager les enquêteurs avec des mots qu'ils n'utilisent pas normalement ou des fautes d'orthographe intentionnelles. Elle dit que son premier instinct est que le mot "lodestar" - un vice-président Mike Pence a utilisé plusieurs fois - est " un hareng rouge ". Cela semble trop délibéré.

    "La plupart des gens recherchent encore des fonctionnalités de la taille d'une petite bande sonore comme Lodestar au lieu d'essayer de maîtriser l'ensemble de l'image, " dit Leonard de Hofstra.

    Greenstadt dit que l'analyse linguistique "pourrait en quelque sorte contribuer à l'image" de qui a écrit les articles d'opinion du Times, mais elle ajoute "à elle seule, Je serais inquiet de l'utiliser."

    Toujours, avec les bonnes conditions, les mots comptent.

    Juola a témoigné dans une quinzaine de procès et a traité encore plus d'affaires qui n'ont jamais été portées devant les tribunaux. Son plus gros cas remonte à 2013, quand un journal britannique a appris que le livre "The Cuckoo's Calling" de Robert Galbraith avait en réalité été écrit par l'auteur de Harry Potter J.K. Rowling. En une heure environ, Juola a nourri deux livres de Rowling, "The Cuckoo's Calling" et six autres romans dans son ordinateur, a analysé les modèles de langage avec quatre systèmes différents et a conclu que Rowling l'avait fait.

    Quelques jours plus tard, Rowling a avoué.

    C'était loin d'être la première fois que l'usage de la langue pointait du doigt le vrai coupable. Le frère d'Unabomber l'a identifié en raison de son style d'écriture distinctif. Les pionniers sur le terrain ont aidé à trouver un kidnappeur qui a utilisé le terme unique « bande du diable » pour la zone herbeuse entre le trottoir et la route. L'expression n'est utilisée que dans certaines parties de l'Ohio.

    Même en politique, les mots sont des récits de poker. En 1996, le roman "Couleurs primaires" sur un candidat présidentiel Clintonesque a mis Washington en effervescence en essayant de comprendre qui était l'auteur anonyme. Une analyse d'un professeur de Vassar et d'autres travaux ont pointé du doigt Joe Klein de Newsweek et il l'a finalement admis.

    Mais le détective littéraire remonte à la fondation de la république. Les historiens ont eu du mal à déterminer quels documents fédéralistes spécifiques ont été écrits par Alexander Hamilton et lesquels ont été rédigés par James Madison. Une analyse statistique de 1963 l'a découvert :l'un des nombreux indices se résumait à l'utilisation des mots « pendant » et « pendant que ». Madison a utilisé "pendant"; Hamilton a préféré "pendant".

    Juola dit que les experts dans le domaine peuvent généralement distinguer les introvertis des extravertis, les hommes des femmes, niveau d'éducation, âge, emplacement, presque tout sauf signe astrologique.

    "La science est très bonne, " dit Juola. " Ce n'est pas tout à fait de l'ADN. Il est en fait considéré par certains scientifiques comme étant la deuxième forme d'identification médico-légale la plus précise que nous ayons parce qu'elle est si bonne."

    © 2018 La Presse Associée. Tous les droits sont réservés.




    © Science https://fr.scienceaq.com