• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • L'intelligence artificielle fait la lumière sur le dark web

    Pour faire correspondre des utilisateurs de différents forums qui sont probablement la même personne, un algorithme calcule les similitudes dans les profils, tels que leurs noms d'utilisateur ; Dans le contenu, telles que des phrases similaires ; et dans leur réseau, comme la communauté avec laquelle ils interagissent. Crédit :Massachusetts Institute of Technology

    Sous la toile de surface, la forme publique d'Internet que vous utilisez quotidiennement pour consulter vos e-mails ou lire des articles de presse, existe une « toile noire » cachée. Hébergeur à anonyme, sites protégés par mot de passe, le dark web est l'endroit où les marchés criminels prospèrent dans la publicité et la vente d'armes, médicaments, et les personnes victimes de la traite. Les organismes chargés de l'application des lois travaillent en permanence pour mettre fin à ces activités, mais les défis auxquels ils sont confrontés pour enquêter et poursuivre les personnes du monde réel derrière les utilisateurs qui publient sur ces sites sont énormes.

    "La nature pop-up des marchés du dark web rend le suivi de leurs participants et de leurs activités extrêmement difficile, " dit Charlie Dagli, chercheur au sein du groupe de technologie et de systèmes d'intelligence artificielle du laboratoire MIT Lincoln. Dagli fait référence à la vitesse à laquelle les marchés du dark web ferment (parce qu'ils sont piratés, perquisitionné, abandonné, ou configuré comme une « arnaque à la sortie » dans laquelle le site se ferme intentionnellement après que les clients ont payé des commandes non exécutées) et de nouveaux apparaissent. La courte durée de vie de ces marchés, de quelques mois à quelques années, entraver les efforts pour identifier leurs utilisateurs.

    Pour surmonter ce défi, Lincoln Laboratory développe de nouveaux outils logiciels pour analyser les données de surface et de dark web.

    Ces outils tirent parti du seul avantage que présente ce problème semblable à une taupe :les connexions que les vendeurs et les acheteurs maintiennent sur plusieurs couches du Web, de la surface à l'obscurité, et sur les forums du dark web. « Cette commutation constante entre les sites fait désormais partie intégrante du fonctionnement des marchés du Web sombre, " dit Dagli.

    Les utilisateurs créent constamment de nouveaux profils. Bien qu'ils n'utilisent peut-être pas les mêmes noms d'utilisateur d'un site à l'autre, ils maintiennent leurs connexions vivantes en se signalant les uns aux autres à travers leur contenu. Ces signaux peuvent être utilisés pour lier des personas appartenant au même utilisateur sur des forums du dark web et, plus révélateur, pour lier des personas sur le dark web au web de surface pour découvrir la véritable identité d'un utilisateur.

    Lier les utilisateurs sur le dark web est ce que les forces de l'ordre essaient déjà de faire. Le problème est que la quantité de données dont ils ont besoin pour mélanger manuellement - 500, 000 numéros de téléphone et 2 millions d'annonces sexuelles publiées par mois, c'est trop volumineux et non structuré pour qu'ils trouvent rapidement des relations. Ainsi, seul un faible pourcentage d'affaires peut être poursuivi.

    Pour automatiser le processus de création de liens, Lincoln Laboratory forme des algorithmes d'apprentissage automatique pour calculer la similitude entre les utilisateurs sur différents forums. Les calculs sont basés sur trois aspects des communications des utilisateurs en ligne :« Comment ils s'identifient aux autres, ce qu'ils écrivent, et avec qui ils écrivent, ", explique Dagli.

    L'algorithme est d'abord alimenté par les données des utilisateurs sur un forum A donné et crée un modèle de paternité pour chaque utilisateur. Puis, les données des utilisateurs sur le forum B sont exécutées sur tous les modèles d'utilisateurs du forum A. Pour trouver des correspondances pour les informations de profil, l'algorithme recherche des indices simples, tels que les changements d'orthographe du nom d'utilisateur comme "sergeygork" sur le forum A en "sergey gorkin" sur le forum B, ou des similitudes plus subtiles comme « joe chevalier » à « joe cauchemar ».

    La prochaine caractéristique que le système examine est la similitude du contenu. Le système détecte des phrases uniques, par exemple, "fun in the sun"—qui sont utilisés dans plusieurs publicités. "Il y a beaucoup de copier-coller en cours, des phrases similaires apparaîtront donc probablement du même utilisateur, " dit Dagli. Le système recherche alors des similitudes dans le réseau d'un utilisateur, qui est le cercle de personnes avec lequel l'utilisateur interagit, et les sujets abordés par le réseau de l'utilisateur.

    Le profil, teneur, et les fonctionnalités du réseau sont ensuite fusionnées pour fournir un résultat unique :un score de probabilité que deux personnages de deux forums représentent la même personne réelle.

    Les chercheurs ont testé ces algorithmes de liaison de personnalités à la fois avec des données open source Twitter et Instagram et des données de vérité au sol étiquetées à la main provenant de forums du dark web. Toutes les données utilisées dans ce travail sont obtenues par des moyens autorisés. Les résultats sont prometteurs. "Chaque fois que nous rapportons un match, nous avons raison 95 pour cent du temps. Le système est l'un des meilleurs systèmes de liaison que l'on puisse trouver dans la littérature, " dit Dagli.

    Ce travail est le développement le plus récent dans la recherche en cours. De 2014 à 2017, Le laboratoire Lincoln a contribué au programme Memex de la Defense Advanced Research Projects Agency (DARPA). Memex a abouti à une suite de logiciels d'analyse de données de surface et de dark web développée en collaboration avec des dizaines d'universités, laboratoires nationaux, et entreprises. Dix technologies de laboratoire couvrant le texte, discours, et les analyses visuelles qui ont été créées pour Memex ont été publiées en tant que logiciel open source via le catalogue ouvert DARPA.

    Aujourd'hui, plus de 30 agences dans le monde utilisent le logiciel Memex pour mener des enquêtes. L'un des plus gros utilisateurs, et partie prenante du développement de Memex, est l'unité d'intervention contre la traite des êtres humains (HTRU) du bureau du procureur du district de Manhattan.

    Le procureur du district de Manhattan, Cyrus Vance Jr., a déclaré dans un témoignage écrit à la Chambre des représentants des États-Unis que son bureau avait utilisé les outils Memex pour en filtrer plus de 6, 000 arrestations pour des signes de traite des êtres humains rien qu'en 2017. "Nous avons également utilisé Memex dans 271 enquêtes sur la traite des êtres humains et dans six nouvelles inculpations de trafic sexuel qui ont été portées en 2017, " a-t-il déclaré. Avec l'introduction de Memex, les arrestations de prostitution examinées par HTRU pour les indicateurs de traite des êtres humains sont passées de 5 à 62 pour cent, et les enquêtes sur les arrestations liées à la prostitution du département de police de New York sont passées de 15 à 300 par an.

    Jennifer Dolle, le chef adjoint du HTRU, visité le laboratoire pour présenter comment l'unité a bénéficié de ces technologies. « Nous utilisons ces outils tous les jours. Ils ont vraiment changé notre façon de faire des affaires dans notre bureau, "Dolle dit, expliquant qu'avant Memex, une enquête sur la traite des êtres humains pourrait prendre beaucoup plus de temps.

    Maintenant, Les outils Memex permettent à HTRU d'améliorer rapidement les cas émergents et de construire des enquêtes sur le trafic sexuel à partir de pistes disposant de peu d'informations. Par exemple, ces outils, dont un appelé TellFinder (construit par le contributeur de Memex Uncharted Software) pour l'indexation, résumer, et la recherche de données sur les publicités sexuelles - ont été utilisées pour identifier d'autres, victimes mineures à partir des données d'une seule publicité de prostitution en ligne. "Ces pistes d'enquête supplémentaires permettent à HTRU de poursuivre les trafiquants pour crimes violents et de tenir ces accusés responsables de la véritable nature des crimes qu'ils commettent contre des victimes vulnérables, " dit Dolle.

    Les chercheurs continuent d'apprendre comment les technologies émergentes peuvent être adaptées aux besoins des agences et au fonctionnement du dark web. « L'apprentissage automatique basé sur les données est devenu un outil manifestement important pour les forces de l'ordre afin de lutter contre les marchés en ligne illicites sur le dark web, " dit Lin Li, chercheur principal de ce travail continu dans le programme Human Dynamic Dark Networks du laboratoire, qui est financé par le Bureau de la technologie du laboratoire. "Mais, certains des défis et domaines de recherche en cours comprennent l'élargissement de notre compréhension de l'économie de la demande, perturber l'économie de l'offre, et acquérir une meilleure connaissance globale de la situation."

    Une meilleure compréhension du fonctionnement des chaînes d'offre et de demande de l'économie du dark web aidera l'équipe à développer des technologies pour perturber ces chaînes. Une partie de l'objectif est d'augmenter les risques de participer à cette économie illicite; lier des personas sur le dark web à ceux sur le web de surface est une tactique potentiellement puissante.

    "Cette économie illicite à croissance rapide a été montrée par la DARPA pour financer des activités terroristes et montrée par HTRU comme un moteur de l'esclavage moderne. Vaincre le terrorisme et éliminer l'esclavage sont des besoins nationaux et humanitaires, " dit Joseph Campbell, chef du groupe Technologie et systèmes d'intelligence artificielle. "Notre groupe possède une expertise extraordinaire en IA, apprentissage automatique, et l'analyse des réseaux humains à partir d'informations extraites de la parole multilingue, texte, et la vidéo combinées aux communications et activités du réseau. Les technologies de pointe que nous créons, développer, et avance sont reversés à nos sponsors, qui les utilisent quotidiennement avec un impact énorme pour ces besoins nationaux et humanitaires."

    Cette histoire est republiée avec l'aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l'actualité de la recherche du MIT, innovation et enseignement.




    © Science https://fr.scienceaq.com