• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Deepfakes :cinq façons dont ils constituent de brillantes opportunités commerciales

    La planète Dalí. Crédit :Le musée Dalí

    Un visiteur du musée Dalí à Saint-Pétersbourg, Florida appuie sur une sonnette à côté d'un écran sombre grandeur nature. Une silhouette sombre vêtue d'un costume élégant et arborant une moustache crayon quitte lentement son chevalet et vient vers elle dans la lumière.

    Il est, bien sûr, Salvador Dalí, qui regarde le visiteur et parle de son art et de son musée. Lorsque le visiteur est sur le point de partir, il apparaît à nouveau. Il demande si elle aimerait une photo, puis sort son téléphone portable et prend un selfie avec elle.

    Ce qui est fascinant dans cette rencontre, c'est qu'il s'agit en fait de Dalí lui-même. Comment est-il possible que le grand surréaliste espagnol puisse interagir avec le public des années après sa mort, même en utilisant un téléphone qui n'existait pas de son vivant ? Bienvenue dans le monde des deepfakes, une technologie troublante avec un fort potentiel de tromperie – et aussi des utilisations étonnamment positives.

    Les deepfakes sont une nouvelle technique puissante pour créer du contenu vidéo ou audio réaliste mais faux. Pour insuffler la vie à Dalí, le musée a utilisé l'apprentissage en profondeur pour permettre à un ordinateur d'échanger de manière transparente le visage d'un acteur vivant qui s'habillait et se comportait comme Dalí avec une image générée numériquement du visage et des expressions de l'artiste.

    Cela implique un "processus de formation" dans lequel des algorithmes avancés d'apprentissage automatique passent au crible des images de Dalí et de l'acteur pour apprendre à générer de nouvelles images faciales réelles des deux hommes. Il apprend également à prendre une image existante de l'un des hommes et à générer une image de l'autre qui correspond parfaitement aux expressions faciales et à la posture de la tête du premier.

    Cela permet de générer des visages Dalí qui correspondent aux mouvements de l'acteur, qui sont ensuite automatiquement insérés dans la nouvelle vidéo, créant une illusion de Dalí lui-même. Il y a plus de détails ici pour ceux qui sont intéressés.

    L'opportunité frappe

    À ce jour, la plupart des producteurs de deepfakes ont exploité le côté obscur de la technologie. Cela va de la satire, comme ce clip du poisson d'avril montrant Mark Zuckerberg annonçant qu'il supprime Facebook; aux images nuisibles à la réputation de stars hollywoodiennes censées jouer dans des films pornographiques ; à la fraude, comme imiter la voix d'un directeur général pour demander le transfert d'une grosse somme d'argent.

    Les risques des deepfakes sont indéniables. Pourtant, l'exemple de Dalí illustre qu'il est impossible d'être noir et blanc sur cette technologie. Dans notre recherche, nous regroupons les deepfakes en cinq catégories :échange de voix, texte pour parler, échange de visage vidéo, marionnettes sur tout le corps et synchronisation labiale. Dans chaque catégorie, nous voyons des opportunités commerciales claires. Certains doivent encore se matérialiser tandis que d'autres sont déjà en cours de réalisation.

    1. Ventriloquie 2.0

    L'échange de voix peut changer la voix d'une personne ou la faire imiter celle de quelqu'un d'autre. Il peut être manipulé pour sonner plus jeune ou plus vieux, masculin ou féminin, et avec différents dialectes ou accents. Les utilisations possibles incluent un narrateur de livre audio parlant avec les voix de différents personnages, ou utiliser une personne célèbre comme narrateur sans qu'elle ait à se donner la peine de lire toute l'histoire.

    Cela ouvre également des possibilités fascinantes pour les assistants virtuels comme Siri. Plutôt que d'avoir à enregistrer des voix d'acteurs avec des accents et des genres différents, l'échange de voix audio permet de le faire avec une seule voix.

    2. Redonner des voix

    Il est possible depuis de nombreuses années de faire parler un ordinateur en tapant du texte dans une application. Maintenant, la technologie deepfake existe pour le faire avec la voix d'une personne en particulier, même là où elle n'a pas déjà enregistré les mots en question. Cela devient une technologie qui change la vie des personnes qui ont perdu la capacité de parler de manière intelligible, comme ceux qui ont eu des accidents vasculaires cérébraux ou qui ont une maladie évolutive telle que la sclérose latérale amyotrophique - voir le clip ci-dessous.

    D'autres utilisations possibles de cette technologie audio-texte-parole incluent la correction des mots mal prononcés dans une voix off plutôt que d'avoir à obliger la personne à l'enregistrer à nouveau.

    3. « Est-ce que vous me parlez ? »

    Comme nous l'avons vu avec l'exemple de Dalí, l'échange de visage vidéo peut remplacer le visage d'une personne dans une vidéo par le visage de quelqu'un d'autre. Cela a un grand potentiel dans les films.

    Par exemple, un artiste professionnel de deepfake a démontré comment des techniques similaires au musée Dalí auraient pu être utilisées pour vieillir Robert De Niro dans The Irishman, plutôt que le CGI coûteux et fastidieux qui a permis de porter le coût total de production du film à 175 millions de dollars américains (135 millions de livres sterling). Le clip ci-dessous montre comment la technologie deepfake peut atteindre une qualité similaire. Une autre utilisation possible de cette technologie est des doublures plus réalistes.

    4. Jouez

    La marionnette vidéo corps entier permet de transposer le mouvement du corps d'une personne à celui d'une autre. Les utilisations possibles incluent des jeux vidéo plus immersifs dans lesquels les joueurs peuvent s'insérer dans l'action, avec leurs propres caractéristiques de démarche et de mouvement; et des films où des acteurs non danseurs peuvent apparemment danser en utilisant des images de danseurs professionnels.

    5. Sous-titres RIP

    La synchronisation labiale audio et vidéo peut modifier les mouvements de la bouche et les mots prononcés dans une vidéo. Il sera bientôt possible de rendre rentable, traductions de films de haute qualité, Émissions de télévision et autres vidéos. Un algorithme entraîné imiterait la voix de l'acteur d'origine mais dans une langue différente, avec le mouvement des lèvres en synchronisation avec les nouveaux mots.

    Ainsi, même s'il est clair que les deepfakes peuvent et sont utilisés de manière délétère, la même technologie d'apprentissage en profondeur ouvre également de nombreuses applications commerciales innovantes. De nombreuses possibilités créatives et productives deviennent apparentes, et sans aucun doute de nombreuses autres que les gens n'ont même pas encore repérées.

    Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lire l'article original.




    © Science https://fr.scienceaq.com