Un exemple de tweets qui ont inspiré l'étude de recherche. Crédit :Zhang et al.
Attaques par déni de service distribué (DDoS), qui sont conçus pour empêcher les utilisateurs légitimes d'accéder à des systèmes de réseau spécifiques, sont devenus de plus en plus courants au cours de la dernière décennie. Ces attaques rendent des services tels que Facebook, Reddit et les sites bancaires en ligne extrêmement lents ou impossibles à utiliser en épuisant les ressources du réseau ou du serveur (par exemple, bande passante, CPU et mémoire).
Des chercheurs du monde entier ont essayé de développer des techniques pour prévenir les attaques DDoS ou intervenir rapidement afin de réduire leurs effets négatifs. Une étape importante dans la lutte contre de telles attaques est la collecte rapide des commentaires des utilisateurs pour déterminer leur impact et proposer des solutions ciblées.
Avec ça en tête, une équipe de chercheurs de l'Université du Maryland a développé un modèle d'apprentissage automatique qui pourrait aider à déterminer l'ampleur de l'impact des attaques DoS telles qu'elles se produisent sur la base des tweets publiés par les utilisateurs. Leur étude, récemment prépublié sur arXiv, a été financé par une subvention d'innovation cybernétique UMBC-USNA.
« La recherche s'est basée sur le constat que lorsqu'il y a des difficultés d'accès aux services du réseau, les clients partagent parfois ces informations sur les réseaux sociaux, " Dr Tim Oates, l'un des chercheurs qui a mené l'étude, a déclaré TechXplore. "Notre objectif principal était de développer un système qui traque les attaques par déni de service (DoS) du réseau en analysant leurs effets d'entraînement via les publications sur les réseaux sociaux."
Pour commencer, Le Dr Oates et ses collègues ont collecté un ensemble de tweets sur les attaques DoS sur la base d'une chronologie historique des attaques qui se sont produites dans le passé. En regardant ces tweets, dans lequel les utilisateurs décrivaient les problèmes qu'ils rencontraient lors d'une attaque, les chercheurs ont pu identifier des « modèles de langage » (c. mots clés pertinents). Ils ont ensuite formé un classificateur d'arbre de décision pour détecter les attaques DDoS en fonction de ces mots-clés.
"Nous avons émis l'hypothèse que les clients impactés utilisent un langage similaire sur les réseaux sociaux pour décrire les problèmes lors d'une attaque DDoS, tels que le système ou le produit étant lent ou rampant, " Chi Zhang, un autre chercheur impliqué dans l'étude a déclaré à TechXplore. "Ainsi, lorsque de nouveaux tweets sont collectés (historiquement ou en temps réel), le modèle découvre d'abord les sujets (un ensemble de mots-clés qui définissent largement un domaine de discussion) des tweets collectés dans cette fenêtre de temps.
Ensuite, le classificateur développé par le Dr Oates, Zhang et leurs collègues classent les tweets en fonction de la différence entre les mots-clés et les modèles linguistiques observés dans les publications des utilisateurs lors des précédentes attaques DDoS. Finalement, le modèle utilise le nombre de tweets liés aux DDos détectés pour calculer l'ampleur de l'impact d'une attaque.
Lorsque les chercheurs ont évalué leur modèle, ils ont découvert qu'il obtenait des résultats similaires aux approches de pointe supervisées pour déterminer l'ampleur des attaques DDoS. Un grand avantage de leur classificateur, cependant, c'est qu'il est faiblement encadré, il nécessite donc très peu d'étiquetage humain des données d'entraînement.
« Nous avons pu développer un modèle faiblement supervisé pour la détection de nouveaux événements qui fonctionne presque aussi bien que les modèles supervisés, " a déclaré Zhang. " Sa nature faiblement supervisée signifie que seule une petite quantité de données étiquetées humaines est nécessaire, ainsi il économise beaucoup de ressources en termes de travail humain, car demander aux gens d'annoter potentiellement des milliers de Tweets est généralement assez coûteux."
À l'avenir, leur modèle faiblement supervisé pourrait aider à déterminer l'ampleur des attaques DDoS rapidement et plus efficacement, uniquement sur la base des données Twitter. Il pourrait également être adapté et appliqué à d'autres tâches qui pourraient bénéficier de l'analyse des tweets des utilisateurs en temps réel.
Dans leurs prochaines études, les chercheurs prévoient de développer davantage leur modèle afin d'analyser les tweets écrits dans d'autres langues. Finalement, ils aimeraient également changer sa couche de classification pour tester ses performances dans la détermination de l'ampleur de l'impact d'autres types d'événements, comme les épidémies (p. Ebola).
« Nous avons réalisé que les gens ont de nombreuses façons de décrire les problèmes sur Twitter, " Ashwinkumar Ganesan, un autre chercheur qui a mené l'étude, a déclaré TechXplore. "D'où, il est nécessaire de créer un plus grand cache de tweets et de meilleurs modèles qui gèrent cette variation de langue. En outre, les attaques ne se limitent pas à des cibles dans le monde anglophone, Il est donc également très important de concevoir le système pour qu'il puisse être adapté à d'autres langues."
© 2019 Réseau Science X