Crédit :Wayve
Une équipe de chercheurs de la startup britannique Wayve a développé un moyen d'appliquer le réseau d'apprentissage en profondeur à la conduite autonome. Dans un récent article de blog (accompagné d'une vidéo de démonstration YouTube), des représentants ont décrit le fonctionnement de leur technologie, et proposez une démonstration avec une vraie voiture sur une vraie route.
Comme le note l'équipe de Wayve, la plupart des voitures autonomes utilisent une multitude de caméras et de capteurs, ainsi que des outils de cartographie et beaucoup de programmation informatique. Mais une telle approche, ils se disputent, surplombe ce qui semble être une sorte de plafond. Les voitures autonomes programmées par de grandes entreprises comme Google ont atteint un point où elles sont bonnes, mais pas assez bon pour un usage courant. Cette, ils prétendent, est parce que ces voitures ne sont pas encore assez intelligentes pour gérer les innombrables conditions présentes sur une route moyenne. Ce qui est necessaire, ils proposent, est un ordinateur plus intelligent, pas plus de capteurs ou de programmation.
L'équipe de Wayve pense qu'une approche plus intelligente consiste à utiliser des algorithmes d'apprentissage par renforcement tels que ceux utilisés sur des projets tels que DeepMind - laissez l'ordinateur apprendre à faire quelque chose de la même manière que les gens le font, en pratiquant. Les algorithmes d'apprentissage par renforcement sont au cœur des réseaux d'apprentissage en profondeur :ils apprennent en faisant, encore et encore, s'améliorant au fur et à mesure. Dans le cas d'un contrôle de véhicule autonome, cela signifierait conduire une voiture jusqu'à ce qu'ils l'aient bien compris.
Pour démontrer à quel point une telle approche peut fonctionner, une équipe de Wayve a équipé une Renault Twizy d'un seul appareil photo et de gaz, freins et commandes de direction, puis les ont connectés à un processeur graphique et à un ordinateur exécutant des algorithmes d'apprentissage par renforcement développés par la société. L'ordinateur a été "dit" que le résultat optimal serait que la voiture avance le long d'une route sans quitter la route. Plus il pourrait le faire, le meilleur. Ils ont ensuite ajouté un conducteur humain et placé la voiture sur une route de campagne. Le conducteur humain dirigerait la voiture dans la bonne direction et laisserait ensuite l'ordinateur prendre le relais. Si la voiture a failli sortir de la route, l'humain l'arrêterait, alignez la voiture, puis relancez l'ordinateur. De cette façon, l'ordinateur a pu apprendre comment empêcher la voiture de sortir de la route en 20 minutes environ. Après ça, il a pu continuer indéfiniment.
© 2018 Tech Xplore