Cette capture d'écran montre une image d'une vidéo dans Scoop, L'outil de Voxel 51 pour organiser les vidéos par leur contenu. Les véhicules sont reconnus par type, faire et colorer. La plate-forme de Voxel51 effectue un traitement vidéo AI qui identifie les objets et les actions dans la vidéo. Crédit :Voxel51
Voxel51, une startup de l'Université du Michigan, a lancé aujourd'hui son produit phare, une plate-forme logicielle conçue pour faciliter, plus rapide et plus abordable pour accéder au potentiel inexploité des données vidéo.
Le logiciel s'adresse aux entreprises qui travaillent avec la vidéo mais ont du mal à en extraire les informations dont elles ont besoin. Alors que la vidéo est une forme riche de données, il est difficile à analyser et à rechercher en raison de sa complexité, fichiers volumineux et manque d'unités définies comme les mots.
Voxel51 a entrepris de surmonter ces obstacles avec sa plate-forme d'analyse vidéo et ses bibliothèques de logiciels open source qui, ensemble, permettent une reconnaissance vidéo de pointe. Il identifie et suit les objets et les actions dans chaque clip. Comme le dit le co-fondateur Brian Moore, "Nous transformons la vidéo en valeur."
Leur objectif initial, ce qui est particulièrement pertinent pour les voitures sans conducteur, est sur des séquences vidéo de scènes de route et pour la sécurité publique. Dans ces deux applications, les caméras sont des capteurs clés, mais cela prend beaucoup de temps pour les humains de traiter les données afin qu'un ordinateur puisse les analyser. Plus rapide, le traitement automatisé devrait accélérer le développement d'une meilleure vision par ordinateur.
« C'est la première et la seule plate-forme accessible au public pour la compréhension de la scène routière, " a déclaré le co-fondateur Jason Corso, professeur de génie électrique et informatique. "Les constructeurs automobiles les construisent, mais dans des silos propriétaires. Le nôtre sera disponible pour que quiconque puisse l'utiliser et l'essayer.
« En démocratisant le traitement vidéo et l'accès au grand, bibliothèques annotées, nous permettons aux jeunes startups de rivaliser avec les équipes bien dotées en ressources qui travaillent sur les voitures sans conducteur et d'autres applications de vision par ordinateur dans les grandes entreprises."
Dans les véhicules sans conducteur aujourd'hui, les algorithmes de perception sont produits avec des techniques d'apprentissage automatique, ce qui signifie qu'ils doivent être formés sur des clips vidéo annotés avec l'identification et le suivi d'objets, par exemple, piétons, Véhicules, lampadaires, panneaux et feux de circulation.
Cette capture d'écran montre une image d'une vidéo dans Scoop, L'outil de Voxel 51 pour organiser les vidéos par leur contenu. Véhicules, les panneaux et les piétons sont étiquetés et suivis à travers le clip. La plate-forme de Voxel51 effectue un traitement vidéo AI qui identifie les objets et les actions dans la vidéo. Crédit :Voxel51
Avant que les systèmes ne soient entraînés, la vidéo doit être annotée, généralement par un humain. C'est pourquoi il est long et coûteux de créer des données d'entraînement pour les algorithmes d'apprentissage automatique.
Avec Voxel51, les utilisateurs peuvent compter sur le logiciel d'IA de la plate-forme pour accélérer une grande partie de ce processus. Puis, il est possible de rechercher du contenu vidéo très spécifique, par exemple, un promeneur de chien. Et avec la bibliothèque open source, certains utilisateurs ont accès à des ensembles de données beaucoup plus volumineux qu'ils ne pourraient autrement se permettre d'en acquérir.
« Il existe un besoin évident pour le type de technologie d'IA de pointe développée par Voxel51 dans l'espace des véhicules automatisés, et nous sommes enthousiasmés par les progrès déjà réalisés, " a déclaré Bryce Pilz, directeur des licences chez U-M Tech Transfer.
"À l'heure actuelle, La technologie Voxel51 aide les véhicules autonomes de Mcity à donner un sens à ce qu'ils voient sur la route afin qu'ils puissent prendre de meilleures décisions, et nous n'avons aucun doute que nous finirons par voir ces innovations faire leur chemin dans les véhicules de production, les rendre plus sûrs, plus efficace et plus fiable."
Au-delà de mettre une puissante analyse vidéo de l'IA entre les mains des développeurs, Le principal différenciateur sous le capot de Voxel51 est que leur traitement opère dans le volume espace-temps à travers les images, où ils peuvent capturer les changements de mouvement et d'apparence au fil du temps. En d'autres termes, ils ne regardent pas les pixels mais les voxels.
La société a levé 2 millions de dollars en capital-risque. Il est situé à Ann Arbor, emploie 15 personnes et en embauche beaucoup plus, dit Corso.
« Depuis l'aube de l'informatique moderne, les humains se sont adaptés aux ordinateurs. Je pense qu'il est temps que les ordinateurs commencent à s'adapter à nous, et cela implique une compréhension plus profonde du monde visuel, " Corso a déclaré. " La nouvelle plate-forme de Voxel51 est un pas important dans cette direction. Nous voulons permettre aux nouvelles entreprises d'ajouter des capacités de perception visuelle avec facilité et puissance là où elles n'auraient pas pu autrement."