Crédit :IBM
Avez-vous déjà été traité injustement ? Comment vous êtes-vous senti ? Probablement pas trop bien. La plupart des gens conviennent généralement qu'un monde plus juste est un monde meilleur, et nos chercheurs en IA sont tout à fait d'accord. C'est pourquoi nous exploitons le pouvoir de la science pour créer des systèmes d'IA plus justes et plus précis.
Bon nombre de nos avancées récentes en IA ont produit des capacités remarquables pour les ordinateurs d'accomplir des tâches de plus en plus sophistiquées et importantes, comme traduire la parole à travers les langues pour relier les communications à travers les cultures, améliorer les interactions complexes entre les hommes et les machines, et reconnaître automatiquement le contenu de la vidéo pour aider dans les applications de sécurité.
Une grande partie de la puissance de l'IA aujourd'hui provient de l'utilisation de l'apprentissage en profondeur basé sur les données pour former des modèles de plus en plus précis en utilisant des quantités croissantes de données. Cependant, la force de ces techniques peut aussi être une faiblesse. Les systèmes d'IA apprennent ce qu'on leur enseigne, et s'ils ne sont pas enseignés avec des ensembles de données robustes et diversifiés, l'exactitude et l'équité pourraient être compromises. Pour cette raison, IBM, avec les développeurs d'IA et la communauté des chercheurs, devons réfléchir aux données que nous utilisons pour la formation. IBM reste déterminé à développer des systèmes d'IA pour rendre le monde plus juste.
Le défi de la formation de l'IA se manifeste de manière très apparente et profonde avec la technologie de reconnaissance faciale. Aujourd'hui, il peut être difficile de créer des systèmes de reconnaissance faciale qui répondent aux attentes d'équité. Le cœur du problème ne réside pas dans la technologie de l'IA elle-même, en soi, mais avec la façon dont les systèmes de reconnaissance faciale alimentés par l'IA sont formés. Pour que les systèmes de reconnaissance faciale fonctionnent comme souhaité - et que les résultats deviennent de plus en plus précis - les données d'entraînement doivent être diversifiées et offrir une large couverture. Par exemple, les ensembles de données d'entraînement doivent être suffisamment volumineux et différents pour que la technologie apprenne toutes les différences entre les visages afin de reconnaître avec précision ces différences dans diverses situations. Les images doivent refléter la répartition des traits des visages que nous voyons dans le monde.
Crédit :IBM
Comment mesurer et assurer la diversité des visages humains ? D'une part, nous savons comment les visages diffèrent selon l'âge, genre, et le teint de la peau, et comment différents visages peuvent varier dans certaines de ces dimensions. Une grande partie de l'accent mis sur la technologie de reconnaissance faciale a été sur la façon dont elle fonctionne dans ces attributs. Mais, comme l'ont montré des études antérieures, ces attributs ne sont qu'une pièce du puzzle et ne sont pas tout à fait adéquats pour caractériser toute la diversité des visages humains. Les dimensions comme la symétrie du visage, contraste du visage, la pose dans laquelle se trouve le visage, la longueur ou la largeur des attributs du visage (yeux, nez, front, etc.) sont également importants.
Aujourd'hui, IBM Research publie un nouvel ensemble de données volumineux et diversifié appelé Diversity in Faces (DiF) pour faire avancer l'étude de l'équité et de la précision dans la technologie de reconnaissance faciale. Le premier du genre disponible pour la communauté mondiale de la recherche, DiF fournit un ensemble de données d'annotations d'un million d'images de visage humain. En utilisant des images accessibles au public de l'ensemble de données Creative Commons YFCC-100M, nous avons annoté les visages en utilisant 10 schémas de codage bien établis et indépendants de la littérature scientifique. [1-10] Les schémas de codage comprennent principalement des mesures objectives de visages humains, telles que les caractéristiques craniofaciales, ainsi que des annotations plus subjectives, telles que les prédictions étiquetées par l'homme de l'âge et du sexe. Nous pensons qu'en extrayant et en publiant ces annotations de schéma de codage facial sur un grand ensemble de données de 1 million d'images de visages, nous accélérerons l'étude de la diversité et de la couverture des données pour les systèmes de reconnaissance faciale d'IA afin de garantir des systèmes d'IA plus justes et plus précis. La sortie d'aujourd'hui n'est que la première étape.
Nous pensons que l'ensemble de données DiF et ses 10 schémas de codage offrent un point de départ aux chercheurs du monde entier qui étudient la technologie de reconnaissance faciale. Les 10 méthodes de codage facial incluent craniofacial (par exemple, longueur de la tête, longueur du nez, hauteur du front), rapports faciaux (symétrie), attributs visuels (âge, genre), et pose et résolution, entre autres. Ces schémas sont parmi les plus forts identifiés par la littérature scientifique, bâtir une base solide pour notre savoir collectif.
Notre analyse initiale a montré que l'ensemble de données DiF fournit une distribution plus équilibrée et une couverture plus large des images faciales par rapport aux ensembles de données précédents. Par ailleurs, les informations obtenues à partir de l'analyse statistique des 10 schémas de codage initiaux sur l'ensemble de données DiF ont approfondi notre propre compréhension de ce qui est important pour caractériser les visages humains et nous ont permis de poursuivre d'importantes recherches sur les moyens d'améliorer la technologie de reconnaissance faciale.
L'ensemble de données est disponible aujourd'hui pour la communauté mondiale de la recherche sur demande. IBM est fier de mettre cela à disposition et notre objectif est d'aider à poursuivre nos recherches collectives et de contribuer à la création de systèmes d'IA plus équitables.
Tandis qu'IBM Research s'engage à poursuivre l'étude et l'investigation de systèmes de reconnaissance faciale plus justes, nous ne croyons pas que nous pouvons le faire seuls. Avec la sortie d'aujourd'hui, nous exhortons les autres à contribuer au corpus croissant de recherches et à faire progresser cet important programme scientifique.
Pour demander l'accès au jeu de données DiF, visitez notre page Web. Pour en savoir plus sur DiF, lire notre article, "La diversité dans les visages."
Cette histoire est republiée avec l'aimable autorisation d'IBM Research. Lisez l'histoire originale ici.