Crédits :Gearstd/Shutterstock
Les chiffres figurent assez haut sur la liste de ce qu'un ordinateur peut bien faire. Alors que les humains ont souvent du mal à diviser une facture de restaurant, un ordinateur moderne peut effectuer des millions de calculs en une seconde. Humains, cependant, avoir un sens inné et intuitif des nombres qui nous a aidés, entre autres, pour construire des ordinateurs en premier lieu.
Contrairement à un ordinateur, un humain sait en regardant quatre chats, quatre pommes et le symbole 4 qu'elles ont toutes une chose en commun - le concept abstrait de "quatre" - sans même avoir à les compter. Cela illustre la différence entre l'esprit humain et la machine, et aide à expliquer pourquoi nous ne sommes même pas près de développer des IA avec la large intelligence que les humains possèdent. Mais maintenant une nouvelle étude, publié dans Science Advances, rapporte qu'une IA a spontanément développé un sens du nombre semblable à celui d'un humain.
Pour qu'un ordinateur compte, nous devons définir clairement ce que nous voulons compter. Une fois que nous avons alloué un peu de mémoire pour maintenir le compteur, nous pouvons le mettre à zéro, puis ajouter un élément à chaque fois que nous trouvons quelque chose que nous voulons enregistrer. Cela signifie que les ordinateurs peuvent compter le temps (signaux d'une horloge électronique), mots (s'ils sont stockés dans la mémoire de l'ordinateur) et même des objets dans une image numérique.
Cette dernière tâche, cependant, est un peu difficile, car nous devons dire à l'ordinateur à quoi ressemblent exactement les objets avant de pouvoir les compter. Mais les objets ne se ressemblent pas toujours – variation de l'éclairage, la position et la pose ont un impact, ainsi que toute différence de construction entre les exemples individuels.
Toutes les approches informatiques réussies pour détecter des objets dans les images fonctionnent en construisant une sorte d'image statistique d'un objet à partir de nombreux exemples individuels - un type d'apprentissage. Cela permet à l'ordinateur de reconnaître les nouvelles versions d'objets avec un certain degré de confiance. La formation consiste à offrir des exemples qui, ou pas, contenir l'objet. L'ordinateur fait alors une supposition pour savoir si c'est le cas, et ajuste son modèle statistique en fonction de l'exactitude de la supposition - telle que jugée par un humain supervisant l'apprentissage.
Les systèmes d'IA modernes commencent automatiquement à détecter des objets lorsqu'ils disposent de millions d'images d'entraînement de toutes sortes, tout comme le font les humains. Ces systèmes d'apprentissage non supervisé remarquent progressivement des parties des éléments dans les images qui sont souvent présentes en même temps, et accumuler couche après couche des points communs plus complexes.
Crédit :Sarah Holmlund/Shutterstock
Prenons l'exemple de la reconnaissance des pommes. Comme des images contenant toutes sortes de formes sont présentées au système, il commence d'abord à remarquer des groupes de pixels qui composent des lignes horizontales et verticales, et courbes gauche et droite. Ils sont présents dans les pommes, visages, chats et voitures, donc les points communs, ou des abstractions, se trouvent très tôt. Il se rend finalement compte que certaines courbes et lignes sont souvent présentes ensemble dans les pommes - et développe un nouveau, abstraction de niveau plus profond qui représente une classe d'objets :pommes, dans ce cas.
L'apprentissage en profondeur
Cette émergence naturelle d'abstractions de haut niveau est l'un des résultats les plus excitants de la technique d'apprentissage automatique appelée réseaux de neurones profonds, qui, dans un certain sens, fonctionnent de la même manière que le cerveau humain. La "profondeur" vient des nombreuses couches du réseau - à mesure que les informations pénètrent plus profondément dans le réseau, les points communs trouvés deviennent plus abstraits. De cette façon, les réseaux sont créés avec des éléments qui sont fortement actifs lorsque l'entrée est similaire à ce qu'elle a connu auparavant. Les choses les plus abstraites apparaissent aux niveaux les plus profonds - ce sont des chats, des visages et des pommes plutôt que des lignes ou des cercles verticaux.
Lorsqu'un système d'IA peut reconnaître des pommes, vous pouvez ensuite l'utiliser pour compter combien il y en a. C'est génial, pourtant ce n'est pas tout à fait comment vous ou moi compterions les pommes. Nous avons un concept extrêmement profond de "nombre" - combien de quelque chose il y a. Plutôt que d'être simplement actif lorsqu'un objet est présent, certaines parties de notre cerveau s'activent en fonction de la quantité d'objets présents. Cela signifie que nous pouvons regarder un tas de pommes et savoir qu'il y en a quatre sans vraiment compter chacune.
En réalité, de nombreux animaux peuvent le faire aussi. C'est parce que ce sens de la nombre est un trait utile pour la survie et la reproduction dans de nombreuses situations différentes - prenez par exemple le fait de juger de la taille des groupes de rivaux ou de proies.
Neurones artificiels réglés sur des nombres de points préférés. Crédit :Andreas Nieder
Propriétés émergentes
Dans la nouvelle étude, un réseau de neurones profonds qui a été formé pour la détection d'objets visuels simples a spontanément développé ce type de sens des nombres. Les chercheurs ont découvert que des unités spécifiques au sein du réseau se sont soudainement « réglées » sur un nombre abstrait – tout comme les vrais neurones du cerveau pourraient réagir. Il s'est rendu compte qu'une image de quatre pommes est similaire à une image de quatre chats - parce qu'ils ont "quatre" en commun.
Une chose vraiment excitante à propos de cette recherche est qu'elle montre que nos principes d'apprentissage actuels sont assez fondamentaux. Certains des aspects les plus élevés de la pensée que les humains et les animaux démontrent sont profondément liés à la structure du monde, et notre expérience visuelle de cela.
Cela laisse également entendre que nous pourrions être sur la bonne voie pour parvenir à une approche plus complète, intelligence artificielle au niveau humain. L'application de ce type d'apprentissage à d'autres tâches - peut-être en l'appliquant à des signaux qui se produisent sur une période de temps plutôt qu'à des pixels d'une image - pourrait produire des machines avec des qualités encore plus humaines. Des choses que nous pensions autrefois fondamentales pour être humain - le rythme musical par exemple, ou même un sens de la causalité – sont maintenant examinés dans cette nouvelle perspective.
Alors que nous continuons à en découvrir davantage sur la construction de techniques d'apprentissage artificiel, et trouver de nouvelles façons de comprendre le cerveau des organismes vivants, nous déverrouillons plus des mystères de l'intelligent, comportement adaptatif.
Il y a un long chemin à parcourir, et bien d'autres dimensions que nous devons explorer, mais il est clair que la capacité de regarder le monde et de déterminer sa structure à partir de l'expérience est un élément clé de ce qui rend les humains si adaptables. Il ne fait aucun doute que ce sera un composant nécessaire de tout système d'IA qui a le potentiel d'effectuer la variété et la complexité des tâches que les humains peuvent.
Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lire l'article original.