Les modèles informatiques dynamiques de Xiangliang peuvent analyser les tweets pour identifier les intérêts des utilisateurs de Twitter. Crédit :KAUST
Vos publications sur les réseaux sociaux révèlent beaucoup de choses sur vous. Les chercheurs de KAUST ont développé un modèle informatique dynamique qui peut analyser les tweets pour identifier les intérêts des utilisateurs de Twitter et suivre les changements au fil du temps. "Comprendre l'évolution des intérêts des utilisateurs nous permet de les regrouper en conséquence et de recommander des amis, nouvelles, événements et autres services, ", explique Xiangliang Zhang qui a dirigé les recherches à la KAUST.
La création de modèles informatiques capables d'identifier l'évolution des intérêts d'une personne à partir de ses publications sur les réseaux sociaux est un problème à multiples facettes. Le premier défi est de comprendre le sens du texte posté, un domaine de recherche connu sous le nom de Natural Language Processing (NLP). "L'objectif de la PNL est de rendre les ordinateurs aussi intelligents que les êtres humains dans la compréhension du langage, " dit Zhang. " C'est l'une des tâches les plus difficiles de l'IA, " Elle ajoute.
Les modèles de PNL basés sur des règles n'ont pas très bien réussi à interpréter les nuances du langage dans la façon dont les humains utilisent les mots de manières diverses et créatives, de telle sorte que le sens des mots peut souvent dépendre fortement du contexte. Une approche alternative consiste à appliquer l'apprentissage automatique pour représenter des mots dans un espace sémantique, où des mots liés sémantiquement, par exemple, Paris, Pékin et Riyad sont étroitement cartographiés.
Pour identifier les intérêts des utilisateurs de Twitter en analysant leurs tweets, le principal défi consiste à caractériser les utilisateurs individuels par leurs mots-clés les plus importants. Zhang et son équipe ont créé un modèle d'intégration dans lequel les mots et les utilisateurs sont traités ensemble. "Nous avons créé un modèle d'utilisateur dynamique et d'intégration de mots qui peut apprendre conjointement et dynamiquement les représentations d'utilisateurs et de mots dans le même espace sémantique, " dit Zhang.
Les chercheurs ont amélioré la sortie du modèle en développant et en incorporant un composant de diversification des mots clés en continu, qui peut identifier des mots clés étroitement liés et supprimer les entrées redondantes de la liste des mots clés supérieurs. Le modèle résultant peut capturer un large éventail d'intérêts pour chaque utilisateur et s'adapter à l'évolution de leurs intérêts au fil du temps.
Lorsque l'équipe a testé son modèle sur un ensemble de tweets, c'était une amélioration significative par rapport aux approches précédentes, dit Zhang. "Notre modèle surpasse considérablement de nombreux modèles de profilage d'utilisateurs à la pointe de la technologie." L'équipe a déjà produit une nouvelle itération de leur approche de modèle d'intégration, Elle ajoute, dans lequel les relations utilisateur-utilisateur sont également capturées pour commencer à identifier les intérêts que les utilisateurs ont en commun. "Le prochain modèle sera plus avancé et construira des vecteurs de co-intégration dynamiques qui capturent simultanément la proximité sociale utilisateur-utilisateur et la pertinence des attributs utilisateur, " dit Zhang.