Usé par les intempéries, couvert de neige ou envahi par la végétation :dans la vraie vie, les panneaux de signalisation ne ressemblent pas toujours à ceux d'un manuel. Crédit :Roberto Schirdewahn
Afin de générer des images réalistes de panneaux de signalisation, les chercheurs opposent deux algorithmes.
Pour s'assurer que les voitures circuleront un jour de manière autonome et en toute sécurité dans les rues, ils doivent être capables de reconnaître les panneaux de signalisation. Même la nuit, dans la pluie, dans la neige, ou si les panneaux sont couverts de mousse, sale ou partiellement envahi par la végétation. Pour apprendre à le faire, ils nécessitent une pléthore d'exemples de tous les panneaux de signalisation de différentes saisons, heures de la journée et conditions météorologiques. "Prendre des photos de tous ces signes quelque part prendrait énormément de temps, " explique le professeur Sebastian Houben du RUB Neural Computation Institute. " D'autant plus que certains signes sont assez rares. "
Avec Dominic Spata et Daniela Horn, il a donc développé une méthode pour générer automatiquement des panneaux de signalisation que les ordinateurs peuvent utiliser pour pratiquer la vision.
Les processus basés sur des machines sont mieux à même de reconnaître les signes que les humains
A ses débuts, le projet a utilisé des images de vrais panneaux routiers :en 2011, l'équipe a pris des vidéos de 43 panneaux de signalisation normalisés en Allemagne - les chercheurs les appellent des classes. Sur la base des vidéos, ils en ont généré environ 50, 000 images individuelles des signes sous différents angles. Les processus basés sur des machines sont dans l'ensemble meilleurs à reconnaître les signes dans ces images que les humains :ces derniers ont identifié correctement 98,8 %, alors qu'un logiciel de reconnaissance d'images est correct dans jusqu'à 99,7 pour cent des cas.
Mais ce n'est plus le problème principal. "Nous voulons atteindre un point où un algorithme apprend à générer des images de panneaux de signalisation que d'autres programmes peuvent utiliser pour mettre en pratique leurs capacités de reconnaissance, " souligne Sébastien Houben.
Les voitures autonomes doivent être capables de reconnaître les panneaux même s'ils ont été collés ou repeints. Crédit :Roberto Schirdewahn
L'équipe de recherche utilise à cet effet deux algorithmes :l'un est alimenté de simples pictogrammes iconographiques de panneaux de signalisation officiels et se voit confier la tâche de les transférer en images qui ressemblent à des photos; plus, l'algorithme doit également être capable de retransférer le signe obtenu dans ces pictogrammes à un moment ultérieur. "C'est ainsi qu'on empêche l'algorithme de déformer l'image du panneau au point qu'il ne ressemble plus du tout au panneau routier, " explique Daniela Horn.
Le deuxième algorithme doit décider si l'image générée est une vraie photo ou non. Le but est de faire en sorte que le deuxième algorithme ne puisse plus dire de quoi il s'agit. "De plus, le deuxième algorithme indique au premier en quoi le processus de sélection pourrait être rendu encore plus difficile, " dit Sebastian Houben. " En conséquence, ces deux sont des partenaires d'entraînement, de toutes sortes."
En premier, le processus de formation ne fonctionne pas particulièrement bien. Cela compte comme une réussite si l'image d'un panneau de signalisation prioritaire a la bonne couleur et est plus ou moins carrée. Mais ça s'améliore rapidement. « Au bout de deux ou trois jours, nous vérifions à quoi ressemblent les images des panneaux de signalisation, " explique Daniela Horn. " Si les images ne sont pas belles à l'œil humain, nous modifions l'algorithme."
Il n'est pas tout à fait clair quand le processus sera terminé, car une mesure précise de la qualité de l'image n'existe pas. Les participants humains sont dupés par seulement dix pour cent des images en moyenne qui ont été créées à l'aide de processus de génération d'images de haute qualité. Dans la plupart des cas, les humains reconnaissent quelles images sont de vraies photos et lesquelles ne le sont pas. "Les raisons peuvent être assez simples, " dit Daniela Horn. " Il y a eu un cas, par exemple, où l'algorithme omettrait toujours le poteau sur lequel un signe est monté."
Il ne s'agit pas de tromper les humains
Pour les humains, c'est un critère évident, pour un système informatique pas important du tout. "Il ne s'agit pas de tromper les humains, » précise le neuroinformaticien. En matière de logiciel de reconnaissance d'images, les deux algorithmes ont obtenu de meilleurs résultats que les humains, aussi :suite à un entraînement avec un nombre comparable d'images artificielles, un système informatique visuel a obtenu à peine dix points de pourcentage de moins qu'après un entraînement avec des images réelles.
L'équipe de recherche utilise par ailleurs des astuces pour optimiser l'algorithme de génération d'images. "Cela a, par exemple, la tendance à créer des arrière-plans forestiers, probablement parce que l'algorithme de reconnaissance d'images est facilement dupé par eux, " précise le chercheur. L'équipe s'est attaquée à ce problème en changeant la couleur de fond des pictogrammes d'origine. " Nous ne pouvons influencer le processus que par la saisie initiale et en modifiant l'algorithme, ", explique Sebastian Houben. Les décisions ultérieures prises par les algorithmes sont hors du contrôle des chercheurs, une caractéristique de l'intelligence artificielle.