Ensemble non organisé d'images produites par le générateur basé sur le style (config F) avec le jeu de données FFHQ. Crédit :arXiv : 1812.04948 [cs.NE]
Un nouveau type d'approche de réseau antagoniste génératif fait se creuser la tête aux observateurs de la technologie :comment des images peuvent-elles être fausses et pourtant sembler si réelles ?
"Nous avons mis au point un nouveau générateur qui apprend automatiquement à séparer les différents aspects des images sans aucune supervision humaine, " ont déclaré les chercheurs dans une vidéo. Ils ont déclaré dans leur article, "La nouvelle architecture conduit à un apprentissage automatique, séparation non supervisée des attributs de haut niveau."
Rendre les fausses images réelles est un effort artistique qui n'est pas nouveau, mais ces trois chercheurs ont porté l'effort au niveau suivant.
Ils ont expliqué leur technique dans leur article, "Une architecture de générateur basée sur le style pour les réseaux antagonistes génératifs." Le papier est sur l'arXiv et il a attiré beaucoup d'attention.
Stephen Johnson dans Grande réflexion a déclaré que les résultats étaient "assez surprenants". Will Knight dans Examen de la technologie du MIT dit que ce que nous regardons constitue « superbe, un réalisme presque inquiétant."
Les chercheurs, Tero Karras, Samuli Laine, et Timo Aila, sont de Nvidia. Leur approche se concentre sur la construction d'un réseau accusatoire génératif, ou GAN, où l'apprentissage a lieu pour générer des images entièrement nouvelles qui imiter l'apparence de vraies photos.
Les auteurs ont déclaré que toutes les images de cette vidéo ont été produites par leur générateur. "Ce ne sont pas des photographies de vraies personnes."
Leur papier, " dit Chevalier, a montré comment l'approche peut être utilisée pour jouer avec, et remixer des éléments tels que race, genre, ou même des taches de rousseur.
La sauce magique est leur générateur de style. Grande réflexion a expliqué cela comme une version modifiée de la technologie conventionnelle qui est utilisée pour générer automatiquement des images.
Leur technologie vous embrouille la tête et a le dernier mot (ou le dernier mot, quelle que soit la façon dont vous le regardez).
En tant qu'humain, vous pensez « images ». Le générateur, cependant, pense "collection de style".
Visualiser l'effet des styles dans le générateur en faisant en sorte que les styles produits par un code latent (source) remplacent un sous-ensemble des styles d'un autre (destination). Crédit :arXiv : 1812.04948 [cs.NE]
Chaque style contrôle les effets à une échelle particulière. Il y a des styles grossiers, styles moyens, beaux styles. (Les styles grossiers font référence à la pose, Cheveu, forme du visage; les styles moyens font référence aux traits du visage; les yeux. Les styles fins font référence à la palette de couleurs.)
Will Knight, pendant ce temps, a fait quelques observations sur les GAN :« Les GAN utilisent deux réseaux de neurones en duel pour entraîner un ordinateur à apprendre suffisamment bien la nature d'un ensemble de données pour générer des contrefaçons convaincantes. Lorsqu'il est appliqué aux images, cela fournit un moyen de générer des contrefaçons souvent très réalistes."
Johnson a présenté le concept GAN :
"En 2014, un chercheur du nom de Ian Goodfellow et ses collègues ont rédigé un article décrivant un nouveau concept d'apprentissage automatique appelé réseaux contradictoires génératifs. L'idée, en termes simplifiés, consiste à dresser deux réseaux de neurones l'un contre l'autre. On agit comme un générateur qui regarde, dire, photos de chiens, puis fait de son mieux pour créer une image de ce à quoi il pense qu'un chien ressemble. L'autre réseau agit comme un discriminateur qui essaie de distinguer les fausses images des vraies.
"En premier, le générateur peut produire des images qui ne ressemblent pas à des chiens, alors le discriminateur les abat. Mais le générateur sait maintenant un peu où ça s'est mal passé, donc l'image suivante qu'il crée est légèrement meilleure. Ce processus se poursuit jusqu'à ce que, en théorie, le générateur crée une bonne image d'un chien."
L'équipe de Nvidia a ajouté des principes de transfert de style au mélange GAN.
Devin Coldewey dans TechCrunch :"Voitures, chats, paysages - tout cela correspond plus ou moins au même paradigme de petit, caractéristiques moyennes et grandes qui peuvent être isolées et reproduites individuellement."
D'un point de vue technique, leur travail a été salué pour des résultats impressionnants dans des images de personnes qui ont l'air réelles. D'un point de vue populaire, aiguisé par le discours de fausses nouvelles, l'avancement est considéré comme dangereux. "La capacité de générer des images artificielles réalistes, souvent appelés deepfakes lorsque les images sont censées ressembler à des personnes reconnaissables, a suscité des inquiétudes ces dernières années, " dit Johnson.
Les pages du site de veille technologique étaient remplies de commentaires sur la façon dont c'était "effrayant", et certains commentaires étaient simplement des questions :« Pourquoi faisons-nous cela ? « Qui paie ? » « Si nous ne créons pas de limites réglementaires, Je pense que la prochaine grande bataille de l'histoire de l'humanité sera livrée (et peut-être perdue) contre l'IA que nous créons, " a dit une réponse.
Néanmoins, tous les commentaires ne reflétaient pas un malaise. Il s'agit d'une avancée technologique et certains commentaires ont souligné que les applications pourraient être utiles dans certains secteurs. Concepteurs, créateurs d'agences de publicité, et même les créateurs de jeux vidéo pourraient utiliser cette technologie pour progresser.
"Ces visages générés par l'IA promettent d'inaugurer une nouvelle génération de personnes photoréalistes dans les jeux vidéo et les films sans avoir besoin d'acteurs ou de figurants humains, " mentionné HotHardware .
© 2018 Réseau Science X