Crédit :CC0 Domaine public
La stylométrie - l'utilisation de techniques statistiques pour déterminer la paternité - est surtout connue pour identifier l'Unabomber comme Theodor Kaczynski et révéler que Shakespeare a collaboré avec Christopher Marlowe sur le cycle de jeu d'Henri IV. En analyse textuelle, ce n'est pas le choix inhabituel des mots qui trahit la voix cachée, mais l'habituel - les modèles récurrents de mots communs, comme les prépositions, qui marquent l'identité probable d'une seule personne.
C'est une passion commune des Beatles, découverte lors d'une conférence à l'Île-du-Prince-Édouard, qui a conduit Mark Glickman, maître de conférences en statistique à Harvard, et Jason Brown, professeur de mathématiques à l'Université Dalhousie, à se demander si une approche stylométrique pourrait répondre à la question brûlante :Lennon ou McCartney ?
Comme l'explique Glickman, pour la plupart des chansons de Lennon-McCartney, il est bien connu et bien documenté lequel des deux a écrit la chanson. Cependant, un nombre étonnamment élevé de chansons (ou de portions de chansons) ont contesté la paternité. Par exemple, personne ne sait qui a écrit la musique de "In My Life, " un morceau de l'album Rubber Soul de 1965, qui est classé 23 sur les 500 plus grandes chansons de tous les temps de Rolling Stone. Lennon et McCartney se souvenaient différemment. "Donc, nous nous sommes demandé si vous pouviez utiliser des techniques d'analyse de données pour essayer de comprendre ce qui se passait dans la chanson pour distinguer si c'était par l'un ou l'autre, " dit Glickman.
Avec l'aide de Ryan Song, ancien étudiant en statistiques de Harvard, Glickman et Brown ont « décomposé » chaque chanson des Beatles de 1962 à 1966 en cinq représentations. Chaque représentation consistait en la fréquence d'occurrence d'un ensemble de caractéristiques musicales dans chaque chanson. "L'idée de base de notre approche, " dit Glickman, "est de convertir une chanson, dont le contenu musical est difficilement quantifiable de manière directe, dans un ensemble de différentes structures de données qui se prêtent à l'établissement d'une signature d'une chanson en utilisant une approche quantitative. » Glickman poursuit, "Pensez à décomposer une couleur en ses composants constitutifs de rouge, vert et bleu avec différents poids attachés. Nous faisons la même chose avec les chansons des Beatles, mais avec plus de trois composants. Au total, notre méthode divise les chansons en un total de 149 composants constitutifs."
"La première représentation consiste simplement en les fréquences des différents accords couramment joués, avec des agrégations d'accords rares, " dit Glickman. " Nous avons pu former 11 catégories d'accords. " Ensuite, ils caractérisaient des notes mélodiques, des notes chantées par le chanteur principal. Troisième, ils ont enregistré les fréquences d'occurrence des transitions d'accords, C'est, un accord suivi d'un autre accord. De nouveau, certaines transitions d'accords rares ont été regroupées en catégories uniques. Quatrième, ils ont enregistré les fréquences de paires de notes mélodiques consécutives.
Puis, finalement, ils ont décomposé les chansons en « contours » de quatre notes mélodiques. Un contour, dit Glickman, est une séquence mélodique de quatre notes classée en une série de "hauts, " " s'abaisse " et " reste le même ". En d'autres termes, si un passage mélodique à quatre notes comporte quatre notes dont la hauteur augmente, alors le contour serait (" vers le haut, " "haut" "haut") parce que chaque paire de notes consécutives entraîne une augmentation de la hauteur. Examiner les contours à quatre notes, dit Glickman, ajoute des détails supplémentaires qui peuvent aider à distinguer les styles de composition mélodique.
La raison pour laquelle ces cinq représentations peuvent servir de signatures de différents styles de composition musicale est que, comme le souligne Glickman, il y a quelque chose de bien connu sur les styles d'écriture de chansons des Beatles :Lennon écrivait généralement des lignes mélodiques qui ne variaient pas beaucoup.
"Considérez la chanson de Lennon, "A l'aide !", dit Glickman. "En gros, ça va, 'Quand j'étais plus jeune, tellement plus jeune qu'aujourd'hui, ' où le pitch ne change pas beaucoup. Il reste à la même note à plusieurs reprises, et ne change que par petites étapes. Alors qu'avec Paul McCartney, tu prends une chanson comme 'Michelle, ' et ça va, 'Michelle, ma belle. Sont les mots qui vont très bien ensemble.' En termes de hauteur, c'est partout."
Leur approche consistant à déduire une paternité inconnue ou contestée à partir de caractéristiques musicales peut être comprise en trois étapes. D'abord, leur modèle postule que chacune des fréquences des 149 caractéristiques musicales d'une chanson dépend de l'auteur de la chanson. Par exemple, le "tonique" (l'accord fondamental d'une chanson) est supposé se produire avec une fréquence dans les chansons de Lennon, mais une fréquence peut-être différente dans les chansons de McCartney. Seconde, ils utilisent un outil commun en probabilité appelé "règle de Bayes" pour inverser la probabilité. En d'autres termes, en commençant par la fréquence des 149 traits musicaux connaissant l'auteur d'une chanson, ils déterminent un modèle pour la probabilité que Lennon ou McCartney aient écrit une chanson étant donné la fréquence des 149 caractéristiques musicales. Ce modèle a ensuite été formé à l'aide de 70 chansons ou portions de chansons de Lennon-McCartney dont la paternité était vraiment connue. Finalement, comme troisième étape, les résultats de ce modèle ont été appliqués aux chansons et portions de chansons de Lennon-McCartney dont la paternité était contestée, qui a abouti à des prédictions de probabilité pour les chansons d'auteur inconnu.
"Donc, la probabilité que 'In My Life' ait été écrit par McCartney est de 0,018, " dit Glickman, "ce qui signifie essentiellement que c'est une chanson de Lennon assez convaincante." McCartney se souvient mal. Mais " La Parole, " ce que Glickman pensait être certainement une chanson de Lennon s'est avéré, selon leur modèle, être presque certainement de McCartney.
Y a-t-il plus dans cet exercice qu'un polar musical amusant ? "Oui, " dit Glickman. " Cette technologie peut être étendue. Nous pouvons regarder l'histoire de la pop et tracer le flux d'influences stylistiques."