Crédit :CC0 Domaine public
Il y a seulement quelques années, la recherche sur le Web était simple. Les utilisateurs ont tapé quelques mots et parcouru les pages de résultats.
Aujourd'hui, ces mêmes utilisateurs peuvent à la place prendre une photo sur un téléphone et la déposer dans un champ de recherche ou utiliser un assistant intelligent pour poser une question sans toucher physiquement à un appareil. Ils peuvent également taper une question et s'attendre à une réponse réelle, pas une liste de pages avec des réponses probables.
Ces tâches défient les moteurs de recherche traditionnels, qui sont basés sur un système d'index inversé qui s'appuie sur des correspondances de mots clés pour produire des résultats.
"Les algorithmes de recherche par mot-clé échouent simplement lorsque les gens posent une question ou prennent une photo et demandent au moteur de recherche, « Qu'est-ce que c'est ? » », a déclaré Rangan Majumder, responsable de programme de groupe au sein de l'équipe de recherche et d'intelligence artificielle Bing de Microsoft.
Bien sûr, suivre les préférences de recherche des utilisateurs n'est pas nouveau. Cela a été une lutte depuis la création de la recherche sur le Web. Mais maintenant, il est de plus en plus facile de répondre à ces besoins en constante évolution, grâce aux avancées de l'intelligence artificielle, y compris ceux mis au point par l'équipe de recherche de Bing et les chercheurs du laboratoire de recherche de Microsoft en Asie.
"L'IA rend les produits avec lesquels nous travaillons plus naturels, " dit Majumder. " Avant, les gens devaient penser, 'J'utilise un ordinateur, Alors, comment puis-je saisir ma saisie d'une manière qui n'interrompra pas la recherche ?'"
Microsoft a mis à la disposition de tous l'un des outils d'IA les plus avancés qu'il utilise pour mieux répondre aux besoins de recherche en constante évolution des gens en tant que projet open source sur GitHub. Mercredi, il a également publié des exemples de techniques utilisateur et une vidéo d'accompagnement pour ces outils via le laboratoire d'IA de Microsoft.
L'algorithme, appelé Space Partition Tree And Graph (SPTAG), permet aux utilisateurs de tirer parti de l'intelligence des modèles d'apprentissage en profondeur pour rechercher parmi des milliards d'informations, appelés vecteurs, en millisecondes. Cette, à son tour, signifie qu'ils peuvent fournir plus rapidement des résultats plus pertinents aux utilisateurs.
La recherche vectorielle facilite la recherche par concept plutôt que par mot-clé. Par exemple, si un utilisateur tape « Quelle est la hauteur de la tour à Paris ? Bing peut renvoyer un résultat en langage naturel indiquant à l'utilisateur que la tour Eiffel est 1, 063 pieds, même si le mot "Eiffel" n'est jamais apparu dans la requête de recherche et le mot "grand" n'apparaît jamais dans le résultat.
Microsoft utilise la recherche vectorielle pour son propre moteur de recherche Bing, et la technologie aide Bing à mieux comprendre l'intention derrière des milliards de recherches sur le Web et à trouver le résultat le plus pertinent parmi des milliards de pages Web.
Utiliser des vecteurs pour une meilleure recherche
Essentiellement une représentation numérique d'un mot, pixel d'image ou autre point de données, un vecteur aide à capturer ce que signifie réellement une donnée. Grâce aux avancées d'une branche de l'IA appelée deep learning, Microsoft a déclaré qu'il pouvait commencer à comprendre et à représenter l'intention de recherche à l'aide de ces vecteurs.
Une fois le point numérique attribué à une donnée, les vecteurs peuvent être organisés, ou cartographié, avec des nombres proches placés à proximité les uns des autres pour représenter la similitude. Ces résultats proximaux sont affichés aux utilisateurs, améliorer les résultats de la recherche.
La technologie derrière la recherche vectorielle utilisée par Bing a débuté lorsque les ingénieurs de l'entreprise ont commencé à remarquer des tendances inhabituelles dans les modèles de recherche des utilisateurs.
"En analysant nos logs, l'équipe a constaté que les requêtes de recherche devenaient de plus en plus longues, " a déclaré Majumder. Cela suggérait que les utilisateurs posaient plus de questions, sur-expliquer à cause du passé, mauvaises expériences avec la recherche par mot clé, ou "essayaient d'agir comme des ordinateurs" en décrivant des choses abstraites, toutes non naturelles et gênantes pour les utilisateurs.
Avec la recherche Bing, l'effort de vectorisation s'est étendu à plus de 150 milliards de données indexées par le moteur de recherche pour apporter une amélioration par rapport à la correspondance de mots clés traditionnelle. Il s'agit de mots simples, personnages, extraits de pages Web, requêtes complètes et autres médias. Une fois qu'un utilisateur effectue une recherche, Bing peut analyser les vecteurs indexés et fournir la meilleure correspondance.
L'affectation des vecteurs est également formée à l'aide de la technologie d'apprentissage en profondeur pour une amélioration continue. Les modèles prennent en compte les entrées telles que les clics de l'utilisateur final après une recherche pour mieux comprendre le sens de cette recherche.
Si l'idée de vectoriser les médias et les données de recherche n'est pas nouvelle, ce n'est que récemment qu'il a été possible de l'utiliser à l'échelle d'un moteur de recherche massif tel que Bing, ont déclaré les experts de Microsoft.
"Bing traite des milliards de documents chaque jour, et l'idée maintenant est que nous pouvons représenter ces entrées sous forme de vecteurs et rechercher dans cet index géant de plus de 100 milliards de vecteurs pour trouver les résultats les plus liés en 5 millisecondes, " a déclaré Jeffrey Zhu, responsable de programme au sein de l'équipe Bing de Microsoft.
Pour mettre cela en perspective, Majumder a dit, Considérez ceci :une pile de 150 milliards de cartes de visite s'étendrait d'ici à la lune. En un clin d'oeil, La recherche de Bing à l'aide de SPTAG peut trouver 10 cartes de visite différentes l'une après l'autre dans cette pile de cartes.
Utilisations pour le visuel, recherche audio
L'équipe Bing a déclaré qu'elle s'attend à ce que l'offre open source puisse être utilisée pour les applications destinées aux entreprises ou aux consommateurs afin d'identifier une langue parlée sur la base d'un extrait audio, ou pour des services riches en images, comme une application qui permet aux gens de prendre des photos de fleurs et d'identifier de quel type de fleur il s'agit. Pour ces types d'applications, une expérience de recherche lente ou non pertinente est frustrante.
"Même quelques secondes pour une recherche peuvent rendre une application inutilisable, " a noté Majumder.
L'équipe espère également que les chercheurs et les universitaires l'utiliseront pour explorer d'autres domaines de percées dans la recherche.
"Nous avons seulement commencé à explorer ce qui est vraiment possible autour de la recherche vectorielle à cette profondeur, " il a dit.