• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • Les humains et l'IA s'associent pour améliorer la détection des appâts cliquables

    Crédit :CC0 Domaine public

    Les humains et les machines ont travaillé ensemble pour aider à former un modèle d'intelligence artificielle (IA) qui a surpassé les autres détecteurs d'appâts à clics, selon des chercheurs de Penn State et de l'Arizona State University. En outre, la nouvelle solution basée sur l'IA a également été en mesure de faire la différence entre les titres d'appâts cliquables générés par des machines (ou des robots) et ceux écrits par des personnes, ils ont dit.

    Dans une étude, les chercheurs ont demandé aux gens d'écrire leur propre clickbait - un intéressant, mais trompeur, titre d'actualité conçu pour inciter les lecteurs à cliquer sur des liens vers d'autres articles en ligne. Les chercheurs ont également programmé des machines pour générer des clickbaits artificiels. Puis, les gros titres faits par les personnes et les machines ont été utilisés comme données pour former un algorithme de détection de clickbait.

    La capacité de l'algorithme résultant à prédire les titres des appâts cliquables était d'environ 14,5% supérieure à celle des autres systèmes, selon les chercheurs, qui ont publié leurs conclusions aujourd'hui (28 août) lors de la conférence internationale IEEE/ACM 2019 sur les progrès de l'analyse des réseaux sociaux (ASONAM) à Vancouver, Canada.

    Au-delà de son utilisation dans la détection de clickbait, l'approche de l'équipe peut aider à améliorer les performances d'apprentissage automatique en général, dit Dongwon Lee, chercheur principal du projet et professeur agrégé au Collège des sciences et technologies de l'information. Lee est également affilié au Penn State's Institute for CyberScience (ICS), qui permet aux chercheurs de Penn State d'accéder à des ressources de calcul intensif.

    "Ce résultat est assez intéressant car nous avons démontré avec succès que les données de formation aux appâts cliquables générées par la machine peuvent être réintroduites dans le pipeline de formation pour former une grande variété de modèles d'apprentissage automatique afin d'améliorer les performances, " a déclaré Lee. " C'est une étape vers la résolution du goulot d'étranglement fondamental de l'apprentissage automatique supervisé qui nécessite une grande quantité de données d'entraînement de haute qualité. "

    Selon Thai Le, doctorant au Collège des sciences et technologies de l'information, État de Penn, l'un des défis auxquels est confronté le développement de la détection des appâts à clics est le manque de données étiquetées. Tout comme les gens ont besoin d'enseignants et de guides d'étude pour les aider à apprendre, Les modèles d'IA ont besoin de données étiquetées pour les aider à apprendre à établir les bonnes connexions et associations.

    "L'une des choses que nous avons réalisé lorsque nous avons commencé ce projet est que nous n'avons pas beaucoup de points de données positifs, " a déclaré Le. " Afin d'identifier le clickbait, nous devons demander aux humains d'étiqueter ces données d'entraînement. Il est nécessaire d'augmenter le nombre de points de données positifs afin que, plus tard, nous pouvons former de meilleurs modèles."

    Bien qu'il puisse être facile de trouver des pièges à clics sur Internet, les nombreuses variantes de clickbait ajoutent une autre couche de difficulté, selon S. Shyam Sundar, James P. Jimirro Professeur de Media Effects et co-directeur du Media Effects Research Laboratory au Donald P. Bellisario College of Communications, et une filiale d'ICS.

    "Il y a des clickbaits qui sont des listes, ou listicles ; il y a des pièges à clics qui sont formulés sous forme de questions ; il y en a qui commencent par qui-quoi-où-quand; et toutes sortes d'autres variantes de clickbait que nous avons identifiées dans nos recherches au fil des ans, " dit Sundar. " Alors, trouver suffisamment d'échantillons de tous ces types d'appâts à clics est un défi. Même si nous nous plaignons tous du nombre d'appâts cliquables, quand vous vous apprêtez à les obtenir et à les étiqueter, il n'y a pas beaucoup de ces ensembles de données."

    Selon les chercheurs, l'étude a révélé des différences dans la façon dont les personnes et les machines abordaient la création des gros titres. Par rapport au clickbait généré par la machine, les titres générés par les gens avaient tendance à avoir plus de déterminants - des mots tels que "qui" et "cela" - dans leurs titres.

    La formation a également semblé susciter des différences dans la création d'appâts à clics. Par exemple, écrivains de formation, comme les journalistes, avaient tendance à utiliser des mots plus longs et plus de pronoms que les autres participants. Les journalistes étaient également susceptibles d'utiliser des chiffres pour commencer leurs gros titres.

    Les chercheurs prévoient d'utiliser ces résultats pour orienter leurs enquêtes vers un système de détection de fausses informations plus robuste, entre autres applications, selon Sundar.

    "Pour nous, clickbait n'est qu'un des nombreux éléments qui composent les fausses nouvelles, mais cette recherche est une étape préparatoire utile pour s'assurer que nous avons mis en place un bon système de détection de clickbait, " dit Sundar.

    Pour trouver des auteurs de clickbait humains pour l'étude, les chercheurs ont recruté des étudiants en journalisme et des travailleurs d'Amazon Turk, un site de crowdsourcing en ligne. Ils ont recruté 125 étudiants et 85 travailleurs sur le site. Les participants ont d'abord lu une définition de clickbait, puis ont été invités à lire un court article d'environ 500 mots. Les participants ont ensuite été invités à écrire un titre clickbait pour chaque article.

    Les titres d'appâts à clic générés par la machine ont été développés à l'aide d'un modèle d'apprentissage automatique appelé modèle génératif Variational Autoencoders (ou VAE), qui repose sur des probabilités pour trouver des modèles dans les données.

    Les chercheurs ont testé leur algorithme par rapport aux systèmes les plus performants du Clickbait Challenge 2017, un concours de détection d'appâts à clics en ligne.


    © Science https://fr.scienceaq.com