Imaginez des lectures infinies des livres que nous avons déjà. Crédit :Unsplash, CC PAR
Les livres se transforment toujours. Le livre que nous tenons aujourd'hui est arrivé à travers un certain nombre de matériaux (argile, papyrus, parchemin, papier, pixels) et des formulaires (tablette, faire défiler, manuscrit, allumer).
Le livre peut être un outil de communication, en train de lire, divertissement, ou l'apprentissage ; un objet et un symbole d'état.
Le changement le plus récent, de la presse écrite au numérique, a commencé vers le milieu du 20e siècle. Il a abouti à deux des projets les plus ambitieux de l'histoire du livre (du moins si l'on en croit le battage médiatique) :la numérisation de masse de livres par Google et la distribution de masse de livres électroniques par Amazon.
La survie des librairies et l'épanouissement des bibliothèques (dans la vraie vie) défient les prédictions selon lesquelles la "fin du livre" est proche. Mais même le bibliophile le plus militant reconnaîtra à quel point le numérique a remis en cause "l'idée" du livre, encore une fois.
Explorer le potentiel de collaboration homme-machine en lecture et en écriture, nous avons construit une machine qui fait de la poésie à partir des pages de n'importe quel livre imprimé. Finalement, ce projet tente d'imaginer l'avenir du livre lui-même.
Une machine à lire des livres
Notre machine de lecture codée sur mesure lit et interprète de vraies pages de livres, pour créer un nouveau livre de poésie "enluminé".
La machine de lecture utilise la vision par ordinateur et la reconnaissance optique de caractères pour identifier le texte sur n'importe quel livre ouvert placé sous ses deux caméras. Il utilise ensuite la technologie d'apprentissage automatique et de traitement du langage naturel pour "lire" le texte à la recherche de sens, afin de sélectionner une courte combinaison poétique de mots sur la page qu'il enregistre en effaçant numériquement tous les autres mots de la page.
Armé de ce vers généré, la machine à lire recherche une image sur Internet, souvent un griffonnage ou un mème, que quelqu'un a partagé et qui a été stocké dans Google Images—pour illustrer le poème.
Une fois que chaque page du livre a été lue, interprété, et illustré, le système publie les résultats à l'aide d'un service d'impression en ligne. Le volume résultant est ensuite ajouté à une archive croissante que nous appelons The Library of Nonhuman Books.
A partir du moment où notre machine termine sa lecture jusqu'à la livraison du livre, notre système d'art automatisé procède de manière algorithmique - de l'interprétation et de l'éclairage des poèmes, à la pagination, la conception de la couverture et enfin l'ajout de la matière finale. Tout cela se fait sans intervention humaine. L'algorithme peut générer un nombre apparemment infini de lectures de n'importe quel livre.
La poesie
Les poèmes suivants ont été produits par la machine à lire à partir de textes populaires :
"au fond les hommes essaient là-bas
il est grand nu elle est même
en faisant face à n'importe quoi."
de E.L. "Cinquante nuances de Grey" de James
"comment les fêtes pop-corn
salles de bains juke-box déprimées
hausser les épaules, Oui? tous."
extrait de "Les règles de l'attraction" de Bret Easton Ellis
"Oh et sa chambre
le brossage de la salle de bain l'envoie
la jarretière aussi affronte l'enfer."
de Truman Capote <"a href="https://www.goodreads.com/book/show/251688.Breakfast_at_Tiffany_s"> Petit déjeuner chez Tiffany"
Mon algorithme, ma muse
Alors, qu'est-ce que tout cela a à voir avec la numérisation de masse des livres ?
Face à la résistance croissante des auteurs et éditeurs concernés par la gestion des droits d'auteur par Google, l'infoglomérat s'est éloigné de son objectif principal de fournir un corpus gratuit de livres (une sorte de bibliothèque moderne d'Alexandrie) et vers un système d'index plus modeste utilisé pour rechercher dans les livres que Google avait numérisés. Google ne servirait désormais que de courts "extraits" de mots mis en évidence sur la page d'origine.
Dans les coulisses, Google avait identifié une utilisation différente des textes. Des millions de livres numérisés pourraient être utilisés dans un domaine appelé Traitement du langage naturel. La PNL permet aux ordinateurs de communiquer avec les gens en utilisant le langage de tous les jours plutôt que le code. Les livres numérisés à l'origine pour les humains ont été mis à la disposition des machines pour l'apprentissage, et plus tard en imitant, langage humain.
Les processus algorithmiques comme la PNL et l'apprentissage machine ont la promesse (ou la menace) de reporter une grande partie de notre lecture quotidienne aux machines. L'histoire a montré qu'une fois que les machines savent comment faire quelque chose, nous les laissons généralement faire. La mesure dans laquelle nous le ferons dépendra de l'importance que nous accordons à la lecture.
Si nous continuons à reporter notre lecture (et écriture) aux machines, nous pourrions faire de la littérature avec nos homologues artificiellement intelligents. Que deviendra la poésie, avec un algorithme comme muse ?
Nous avons déjà des indices à ce sujet :de l'utilisation presque obligatoire d'émojis ou de Kaomoji japonais (顔文字) comme raccourci visuel pour l'intention émotionnelle de notre communication numérique, aux significations superposées des mèmes Internet, à la génération automatique d'histoires de "fake news". Ce sont les hybrides image-mot que nous trouvons dans les médias sociaux post-alphabétisés.
Cacher une feuille
Prendre le livre, mon ami, et lis tes yeux, vous n'y trouverez jamais ce que je trouve.
Les lois spirituelles de Ralph Waldo Emerson
Le défi d'Emerson met en évidence la subjectivité que nous apportons à la lecture. Lorsque nous avons commencé à travailler sur la machine à lire, nous nous sommes concentrés sur la découverte de modèles de mots dans de plus grands corps de textes qui ont toujours été là, but have remained "hidden in plain sight." Every attempt by the reading-machine generated new poems, all of them made from words that remained in their original positions on the pages of books.
The notion of a single book consisting of infinite readings is not new. We originally conceived our reading-machine as a way of making a mythical Book of Sand, described by Jorge Luis Borges in his 1975 parable.
Borges' story is about the narrator's encounter with an endless book which continuously recombines its words and images. Many have compared this impossible book to the internet of today. Our reading-machine, with the turn of each page of any physical book, calculates combinations of words on that page which, until that moment, have been seen, but not consciously perceived by the reader.
The title of our early version of the work was To Hide a Leaf. It was generated by chance when a prototype of the reading-machine was presented with a page from a book of Borges' stories. The complete sentence from which the words were taken is:
"Somewhere I recalled reading that the best place to hide a leaf is in a forest."
The latent verse our machine attempts to reveal in books also hides in plain sight, like a leaf in a forest; and the idea is also a play on a page being generally referred to as a "leaf of a book."
Like the Book of Sand, perhaps all books can be seen as combinatorial machines. We believed we could write an algorithm that could unlock new meanings in existing books, using only the text within that book as the key.
Philosopher Boris Groys described the result of the mass-digitization of the book as Words Without Grammar, suggesting clouds of disconnected words.
Our reading-machine, and the Library of Nonhuman Books it is generating, is an attempt to imagine the book to come after these clouds of "words without grammar." We have found the results are sometimes comical, often nonsensical, occasionally infuriating and, every now and then, even poetic.
Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lire l'article original.