Crédit :CC0 Domaine public
Le record de Lil Nas X, Le hit "Old Town Road" est en effet country. Mais c'est aussi un peu rock'n roll. Et quand vous analysez les paroles et les accords ensemble, c'est de la pop pure.
Au moins, c'est selon un outil d'intelligence artificielle développé par USC Computer Science Ph.D. étudiant Timothy Greer. La méthode de Greer prédit automatiquement les genres musicaux en analysant comment les paroles et les accords interagissent les uns avec les autres tout au long de la chanson.
La méthode a classé "Old Town Road" comme pays selon les paroles; rock selon les accords (basé sur un extrait musical de Nine Inch Nails); et pop selon les accords et les paroles combinés.
Le papier, intitulé "Utilisation de représentations vectorielles partagées de mots et d'accords en musique pour la classification des genres, " sera présenté lors du discours, Conférence Music and Mind 2019 le 14 septembre.
Une expérience très humaine
"Old Town Road est une chanson intéressante, " dit Greer, un musicien de longue date qui joue actuellement du saxaphone et du clavier dans un groupe basé à LA (genre musical :rock indépendant).
"Les paroles sont imprégnées du genre country, mais les accords et l'instrumentation ne sonnent pas du tout country. L'algorithme met en évidence la complexité de la musique, à la fois en termes de construction et de perception de la musique, en d'autres termes, comment les gens le traitent."
Cet effort dans la recherche musicale - pour comprendre informatiquement les histoires que nous racontons avec, et comment les gens en font l'expérience et en sont influencés - fait partie d'un programme de recherche plus vaste en intelligence médiatique computationnelle au Laboratoire d'analyse et d'interprétation des signaux de l'USC (SAIL) (SAIL).
"La construction musicale et la perception sont liées, mais ils ne sont pas identiques, " a déclaré Shrikanth Narayanan, superviseur et co-auteur de l'article de Greer.
Narayanan, directeur de SAIL et de la chaire Niki et Max Nikias et professeur de génie électrique et informatique, a déjà analysé les modèles vocaux de beatboxers et de chanteurs d'opéra à l'aide d'IRM, prédit les cotes de violence à l'aide de scripts de films et développé une technologie qui utilise la voix pour évaluer les émotions du locuteur. Il a dit qu'il était enthousiasmé par cette nouvelle recherche car c'est une nouvelle façon d'analyser la musique par ordinateur et pourrait révéler des modèles inattendus.
"Nous disons toujours qu'il n'y a pas de règle fixe pour les expériences humaines de la musique, " dit Narayanan, un passionné de musique classique qui joue de l'instrument à cordes indien veena et du violon. "L'IA et l'apprentissage automatique peuvent fournir une lentille à partir de laquelle regarder cette expérience très humaine."
Un nouveau son
"Route de la vieille ville, " qui est maintenant en tête des charts depuis 18 semaines, a été remarquable pour sa caractéristique de mélange des genres. L'un des sujets les plus débattus dans le monde de la pop cet été, tout le monde semble avoir une opinion différente - est-ce le pays, pop, Roche? Ou tout autre chose ?
En avril 2019, la chanson a été retirée du palmarès Billboard Hot Country parce qu'elle « n'englobait pas suffisamment d'éléments de la musique country d'aujourd'hui pour figurer dans sa version actuelle, " selon un communiqué de Billboard.
Greer a mis la chanson à l'épreuve avec trois modèles qu'il avait développés pour prédire le genre :en utilisant uniquement des plongements d'accords, uniquement les intégrations de paroles et l'utilisation d'intégrations d'accords et de paroles combinées. Il a entraîné le système sur un ensemble de données avec 190, 165 segments musicaux de 5, 304 chansons pop avec paroles et accords correspondants.
Alors que la plupart des outils de prédiction de genre utilisent l'intégralité du fichier audio d'une chanson, ce qui signifie récupérer et traiter un enregistrement de haute qualité, La méthode de Greer peut classer le genre en utilisant uniquement les accords et les paroles, qui sont généralement disponibles en ligne avec une recherche rapide sur Google.
"Cette interaction entre les séquences d'accords et les séquences lyriques peut nous donner un meilleur aperçu de la façon dont nous percevons le genre que d'utiliser l'une ou l'autre seule, bien que ces deux modalités contiennent à elles seules des informations utiles, également, " dit Greer.
L'étude permet de mieux comprendre comment nous percevons et traitons la musique, spécifiquement les différences dans la perception humaine de la musique - et la catégorisation - du genre musical en fonction du "miroir" utilisé.
Les applications incluent la façon dont le contenu musical est commercialisé, consommé et étiqueté; la neuropsychologie et les mécanismes de la pensée humaine; et les systèmes informatiques affectifs qui ont un impact sur les émotions humaines.