Logo Wikipédia.
John Bohannon de Primer a découvert le travail et les contributions des gens grâce à un système d'apprentissage automatique développé chez Primer. "Il fait autant qu'un humain le ferait, si un humain pouvait lire 500 millions d'articles de presse, 39 millions d'articles scientifiques, tout Wikipédia, puis écrivez 70, 000 résumés biographiques de scientifiques." La raison pour laquelle il s'agit d'une nouvelle est que vous ne connaîtrez probablement jamais leurs contributions en fréquentant Wikipédia, mais il connaît un moyen d'y remédier.
Wikipédia semble avoir un problème de genre, pour un. C'est une question de sous-représentation. Et maintenant, le système d'apprentissage automatique d'une startup d'IA a montré comment il pourrait résoudre la situation.
L'amorce est dans les nouvelles. Le système Primer a été formé sur des revues savantes. L'outil de comblement des écarts entre les sexes s'appelle Quicksilver. Il peut repérer de nombreuses femmes scientifiques négligées sans aucune présence sur Wikipédia. Cory Doctorow dans Boing Boing a déclaré que 18% des entrées biographiques de Wikipédia concernaient des femmes et que la grande majorité des Wikipédiens étaient des hommes.
Le processus de tout montrer a impliqué 30, 000 entrées Wikipedia pour créer un modèle qui lui a permis d'identifier les caractéristiques rendant un scientifique remarquable pour l'inclusion encyclopédique. Puis, il a extrait le moteur de recherche universitaire Semantic Scholar pour en identifier 200, 000 auteurs d'articles scientifiques.
Tom Simonite a dit dans Filaire :"Seulement 18 pour cent de ses biographies sont des femmes. Des sondages estiment qu'entre 84 et 90 pour cent des éditeurs de Wikipédia sont des hommes."
Réellement, si vous attrapez l'histoire dans Filaire , la solution de genre fait partie de la plus grande histoire de Quicksilver à la recherche de lacunes disgracieuses.
Dans l'image plus grande, blogue Bohannon, "Notre objectif est d'aider la communauté des chercheurs en données ouvertes à créer de meilleurs outils pour maintenir Wikipédia et Wikidata, à commencer par le contenu scientifique.
(En outre, "Quicksilver ne se contente pas de repérer les individus négligés et de générer des projets d'articles. Il peut également être utilisé pour maintenir les entrées Wikipedia et identifier quand elles n'ont pas été mises à jour depuis un certain temps, " a déclaré James Vincent dans Le bord .)
Donc, quel est le correctif? Notez que Primer ne concerne pas les fixateurs automatisés. dit Simonite, "il ne prévoit pas de laisser Quicksilver ajouter de manière autonome au site." Filaire a cité le PDG de Primer, Sean Gourley. "Il y a toujours des humains dans la boucle." Science populaire mentionné, "Quicksilver découvre des scientifiques qui devraient avoir des articles Wikipédia à leur sujet et en rédige un premier brouillon."
Leur travail continue. Bohannon a déclaré qu'ils testaient et amélioraient tranquillement Quicksilver depuis des mois. "Avant même d'avoir terminé le composant de génération de texte, Quicksilver a été utilisé dans trois éditions de Wikipédia en anglais pour améliorer la couverture des femmes de science. (Merci à 500 femmes scientifiques pour leur collaboration et leur inspiration !) » Il a déclaré qu'elles décriraient leur architecture en détail dans les prochains articles.
Pendant ce temps, a écrit Simonite, "La communauté notoirement pointilleuse de Wikipédia gardera probablement un œil attentif sur le contenu généré avec l'aide de Quicksilver. Une question est de savoir si cet outil visant à corriger les angles morts a ses propres angles morts."
© 2018 Tech Xplore