Dix pages de revues Dada classées « Dada » par le réseau de neurones. Crédit :Université Cornell
Pour faire un poème dadaïste, l'artiste Tristan Tzara a dit un jour :découpez chaque mot d'un article de journal. Mettez les mots dans un sac et secouez. Retirez les mots du sac un à la fois, et notez-les dans cet ordre.
Cette méthode du "sac de mots" n'est pas tout à fait différente de la façon dont les algorithmes d'intelligence artificielle identifient les mots et les images, les décomposer en composants une étape à la fois. La similitude a inspiré les chercheurs de Cornell à explorer si un algorithme pouvait être formé pour différencier les revues dadaïstes numérisées des revues d'avant-garde non dada - une tâche formidable, étant donné que beaucoup considèrent Dada comme intrinsèquement indéfinissable.
Mais l'algorithme - un réseau de neurones convolutifs généralement utilisé pour identifier des images communes - a mieux fonctionné que le hasard. Il a correctement identifié les pages du journal Dada 63 % du temps et les pages non-Dada 86 % du temps.
"Notre objectif n'est pas nécessairement d'obtenir la 'bonne' réponse, mais plutôt d'utiliser le calcul pour fournir un extraterrestre, point de vue méconnu, " les chercheurs ont écrit dans " Computational Cut-Ups:The Influence of Dada, " qui a publié dans le Journal d'études périodiques modernes en janvier. « Un outil conçu pour identifier les chiens peut-il être réutilisé pour explorer l'avant-garde ? »
Ils ont également cherché à fournir un exemple de la façon dont de grandes collections d'images pourraient être analysées, dit Laure Thompson, un doctorant en informatique, qui a co-écrit l'article avec David Mimno, professeur assistant en sciences de l'information.
L'exploration de texte - la recherche de grands corps de texte numérisé pour certains mots ou phrases - est devenue largement utilisée dans les humanités numériques, mais la recherche d'images est beaucoup plus difficile.
"Le texte a des fonctionnalités très pratiques - ils sont connus sous le nom de mots. Et nous pouvons les voir très rapidement en raison des espaces entre eux, " a déclaré Thompson. " Alors qu'une image sur un ordinateur n'est qu'une grande matrice de nombres, et c'est connu pour n'être pas très significatif."
Thompson et Mimno ont formé leur réseau neuronal sur les journaux dadaïstes des archives numériques Blue Mountain de l'Université de Princeton. Sans rien savoir de Dada – un mouvement d'avant-garde apparu en Europe après la Première Guerre mondiale qui cherchait à bousculer le matérialisme et les conventions – l'algorithme a alors tenté de classer autour de 33, 000 pages de journal en tant que Dada ou non-Dada.
Le réseau apprend à identifier les images à travers des couches de plus en plus complexes - les premières couches peuvent repérer des structures simples comme des bords ou des angles droits, tandis que la couche finale tentera d'étiqueter l'image comme, dire, un chien de berger.
Dans cette étude, le modèle a analysé l'avant-dernière couche, qui comprenait une série de chiffres plutôt que des étiquettes telles que « chien de berger ». Mimno et Thompson ont qualifié ces couches numériques de « découpages informatiques, " un clin d'œil au concept dadaïste de " sac de mots ".
L'algorithme "peut être presque l'antithèse de l'art, mais c'est aussi jouer avec toutes ces méthodologies qui apparaissaient dans Dada même, ", a déclaré Thompson.
Bien qu'ils ne savaient pas comment l'algorithme prenait ses décisions, les chercheurs ont travaillé en arrière à partir des résultats. Ils ont découvert que le réseau associait Dada à la couleur rouge, contraste élevé et bords saillants. Il avait tendance à classer les pages avec des images et des photographies réalistes comme non-Dada, ils ont trouvé.
Parmi les autres genres analysés par l'algorithme, il a le plus souvent identifié à tort le cubisme comme Dada - ce qui avait du sens pour les chercheurs, car le cubisme a fortement influencé l'art dada.
Avant de mener l'expérience Dada, les chercheurs ont testé leur concept sur des pages contenant de la musique. L'algorithme a identifié 67% des 3, 450 pages avec des partitions musicales comme "musique, " et 96 pour cent des 55, 007 pages sans musique comme "pas de musique". Ils ont trouvé que le modèle avait tendance à classer les pages avec tables horizontales comme musique, et des pages avec des couleurs ou des images comme « pas de musique ».
"Si vous voulez projeter des sentiments sur ces modèles, ils sont assez paresseux, " a déclaré Thompson. Par exemple, les chercheurs ont découvert que si vous entraînez un modèle à identifier des images de poissons, et toutes les images fournies montrent des personnes tenant du poisson, il classera probablement toutes les images avec des personnes détenant des choses comme des poissons.
Les classifications du modèle permettent de mieux comprendre quelles caractéristiques peuvent définir Dada, les chercheurs ont dit, même si l'idée d'utiliser une machine pour voir l'art est simpliste et peut-être absurde.
"C'est en partie un effort ironique. Nous n'essayons pas d'être super sérieux, que ce classificateur battra tous les historiens de l'art pour identifier ce qui fait vraiment Dada Dada, " a déclaré Thompson. " Le modèle ne sait rien de Dada, mais cela peut quand même aider à fournir une perspective supplémentaire pour y penser. »