Crédit :domaine public Unsplash/CC0
Dans un monde où tant d'informations sont si facilement accessibles aux étudiants, les éducateurs et les évaluateurs des étudiants doivent constamment lutter contre le plagiat. Le temps et les efforts requis par un examinateur potentiellement confronté à des centaines d'essais pour vérifier de tels problèmes, aussi petits soient-ils, sont énormes. Des outils semi-automatisés existent pour identifier le plagiat dans un échantillon de texte mais ceux-ci aussi consomment des ressources informatiques et sont souvent peu maniables et plus adaptés à des documents uniques.
Rédaction dans le International Journal of Innovative Computing and Applications , une équipe d'Australie et du Sri Lanka a développé une nouvelle approche informatique de la détection du plagiat qui utilise l'espace vectoriel et exploite l'architecture des unités de traitement graphique et leur architecture de dispositif unifiée de calcul (CUDA) plutôt qu'une puce informatique conventionnelle, une unité centrale de traitement, CPU.
Jiffriya Mohamed Abdul Cader de l'Institut sri-lankais d'enseignement technologique avancé Sammanthurai, Akmal Jahan Mohamed Abdul Cader de l'Université du Sud-Est du Sri Lanka, Hasindu Gamaarachchi de l'Université de Nouvelle-Galles du Sud, Australie, et Roshan G. Ragel Faculté d'ingénierie, Université de Peradeniya, Sri Lanka, expliquent que les tests en série conventionnels de 1 000 documents peuvent prendre une demi-heure.
Le prototype de leur approche GPU améliore considérablement cela, ne prenant que 36 secondes pour traiter le même ensemble de données et signaler toutes les sections de texte plagiées. Cependant, les chercheurs ont encore optimisé leur prototype et ont pu réduire le temps de traitement à seulement 4 secondes pour mille documents. C'est presque 400 fois plus rapide que les approches conventionnelles. Une telle rapidité serait une aubaine pour les examinateurs confrontés à des centaines, voire des milliers de documents soumis par les étudiants pour vérifier le plagiat.
La prochaine étape consistera à tester la même approche sur du texte trouvé dans d'autres types de documents plutôt que sur de simples essais en texte brut, y compris des cahiers, des devoirs, des rapports, des thèses, etc. L'algorithme 'Opinion-mining' résume automatiquement les sentiments des médias sociaux