Crédit :Mohamed Elhoseiny
En apprenant à s'écarter des informations connues de la même manière que les humains, un algorithme « d'imagination » pour l'intelligence artificielle (IA) est capable d'identifier des objets inédits à partir de descriptions écrites.
L'algorithme, développé par le chercheur de la KAUST Mohamed Elhoseiny en collaboration avec Mohamed Elfeki de l'Université de Floride centrale, ouvre la voie à l'imagination artificielle et à la classification automatisée de nouvelles espèces végétales et animales.
"L'imagination est l'une des propriétés clés de l'intelligence humaine qui nous permet non seulement de générer des produits créatifs comme l'art et la musique, mais aussi pour comprendre le monde visuel, " explique Elhoseiny.
L'intelligence artificielle s'appuie sur des données d'entraînement pour développer sa capacité à reconnaître des objets et à réagir à son environnement. Les humains développent également cette capacité grâce à l'expérience accumulée, mais les humains peuvent faire quelque chose que l'IA ne peut pas. Ils peuvent déduire intuitivement une classification probable pour un objet jamais rencontré auparavant en imaginant à quoi doit ressembler quelque chose à partir d'une description écrite ou par déduction à partir de quelque chose de similaire. En IA, cette capacité à imaginer l'inconnu devient de plus en plus importante à mesure que la technologie est déployée dans des applications complexes du monde réel où une mauvaise classification ou une mauvaise reconnaissance de nouveaux objets peut s'avérer désastreuse.
Le volume de données nécessaires pour entraîner de manière fiable l'IA pour le monde réel est également important. Il est impossible de former l'IA avec des images ne serait-ce qu'une fraction des espèces connues de plantes et d'animaux dans le monde dans toutes leurs permutations, sans parler des innombrables espèces non découvertes ou non classées.
Les recherches d'Elhoseiny et Elfeki visaient à développer ce qu'on appelle un algorithme d'apprentissage à zéro (ZSL) pour aider à la reconnaissance de catégories inédites sur la base de descriptions au niveau de la classe sans exemples de formation.
« Nous avons modélisé le processus d'apprentissage visuel pour les catégories « invisibles » en reliant ZSL à la créativité humaine, observant que ZSL consiste à reconnaître l'invisible tandis que la créativité consiste à créer un « invisible sympathique, '", dit Elhoseiny.
En créativité, quelque chose de nouveau mais agréable ou "sympathique" doit être différent de l'art antérieur, mais pas si différent qu'il soit méconnaissable. De la même manière, Elhoseiny et Elfeki ont soigneusement modélisé un signal d'apprentissage qui encourage de manière inductive la déviation des classes vues, mais pas poussé si loin que la classe imaginée devienne irréaliste et perde le transfert de connaissances des classes vues. L'algorithme résultant a montré une amélioration constante par rapport aux références de pointe pour ZSL.
« Une des applications possibles de notre approche est l'identification d'espèces inconnues, " dit Elhoseiny. " L'IA qui est alimentée par cette technologie pourrait aider à signaler les observations d'espèces sans images, juste avec des descriptions de langue."