Applications de kaolin. Crédit :Murthy Jatavallabhula et al.
Comme la plupart des environnements du monde réel sont en trois dimensions, Les modèles d'apprentissage en profondeur conçus pour analyser des vidéos ou effectuer des tâches dans des environnements réels doivent idéalement être formés sur des données 3D. Des outils technologiques tels que des robots, véhicules autonomes, smartphone, et d'autres appareils génèrent actuellement une quantité croissante de données 3D qui pourraient éventuellement être traitées par des algorithmes d'apprentissage en profondeur.
Jusqu'à maintenant, cependant, la formation d'algorithmes d'apprentissage en profondeur sur cette grande quantité de données 3D a été relativement difficile, car les outils et plateformes nécessaires ne sont accessibles qu'à certains chercheurs en intelligence artificielle (IA). Pour remédier à ce manque d'outils facilement disponibles, une équipe de chercheurs de NVIDIA a récemment créé Kaolin, une bibliothèque open source PyTorch visant à faire progresser et à faciliter la recherche en apprentissage profond en 3D.
"Actuellement, il n'y a pas une seule bibliothèque de logiciels open source qui prend en charge plusieurs représentations de données 3D, plusieurs tâches, et critères d'évaluation, " Krishna Murthy Jatavallabhula, l'un des chercheurs qui a mené l'étude, a déclaré TechXplore. "Nous avons décidé de combler cette lacune dans la littérature en créant Kaolin, la première bibliothèque complète d'apprentissage en profondeur en 3D."
Kaolin, la bibliothèque PyTorch présentée par Jatavallabhula et ses collègues, contient une variété d'outils pour construire des architectures d'apprentissage en profondeur qui peuvent analyser des données 3D, qui sont à la fois efficaces et faciles à utiliser. Il permet également aux chercheurs de charger, prétraiter, et manipuler les données 3D avant qu'elles ne soient utilisées pour former des algorithmes d'apprentissage en profondeur.
Kaolin comprend plusieurs modules graphiques pour éditer des images 3D, avec des fonctions telles que le rendu, éclairage, ombrage et déformation de la vue. De plus, il prend en charge un large éventail de fonctions de perte et de métriques d'évaluation, permettant aux chercheurs d'évaluer facilement leurs algorithmes d'apprentissage en profondeur.
Crédit :Murthy Jatavallabhula et al.
"Typiquement, Les chercheurs en apprentissage profond 3-D doivent écrire beaucoup de code passe-partout pour leurs projets de recherche, " expliqua Jatavallabhula. " Avec Kaolin, cependant, les chercheurs n'ont qu'à mettre en œuvre les nouvelles parties de leur projet, comme Kaolin emballe un ensemble complet d'utilitaires pour le chargement de données, conversion et évaluation.
Kaolin est un outil précieux à la fois pour les développeurs expérimentés dans le développement de modèles d'apprentissage en profondeur et pour ceux qui débutent. Au sein de la bibliothèque, En réalité, les développeurs peuvent également trouver plusieurs architectures de pointe qu'ils peuvent utiliser comme point de départ ou comme source d'inspiration pour leurs propres modèles.
« Alors que les chercheurs actifs en apprentissage profond en 3D considèrent Kaolin comme un moyen d'accélérer leurs recherches, les nouveaux venus dans ce domaine se tournent vers Kaolin pour savoir par où commencer, " a déclaré Jatavallabhula.
À l'avenir, la bibliothèque open source présentée par ces chercheurs de NVIDIA pourrait aider à accélérer la recherche en apprentissage profond en 3D, assister les développeurs dans la création de nouvelles architectures d'IA, ainsi que dans leur formation et leur évaluation. Pendant ce temps, Jatavallabhula et ses collègues prévoient de travailler à l'extension de Kaolin et à l'amélioration de ses capacités.
« Notre plan est d'ajouter plus de modèles d'apprentissage en profondeur à notre zoo de modèles (collection de modèles d'IA) et d'étendre notre couverture à un ensemble plus large d'applications telles que les voitures autonomes et les agents incarnés nécessitant un apprentissage en 3D, " dit Jatavallabhula. " Bref, nous prévoyons de faire de Kaolin une plate-forme unique pour la recherche en apprentissage profond en 3D."
© 2019 Réseau Science X