Crédit :CC0 Domaine Public
La censure d'Internet par des gouvernements autoritaires interdit l'accès libre et ouvert à l'information à des millions de personnes dans le monde. Les tentatives pour échapper à une telle censure se sont transformées en une course sans cesse croissante pour suivre l'évolution constante, censure Internet de plus en plus sophistiquée. Les régimes de censure ont eu l'avantage dans cette course, parce que les chercheurs doivent rechercher manuellement des moyens de contourner la censure, un processus qui prend un temps considérable.
De nouveaux travaux menés par des informaticiens de l'Université du Maryland pourraient modifier l'équilibre de la course à la censure. Les chercheurs ont développé un outil appelé Geneva (abréviation de Genetic Evasion), qui apprend automatiquement à contourner la censure. Testé en Chine, l'Inde et le Kazakhstan, Genève a trouvé des dizaines de façons de contourner la censure en exploitant les lacunes de la logique des censeurs et en trouvant des bogues qui, selon les chercheurs, auraient été pratiquement impossibles à trouver manuellement pour les humains.
Les chercheurs présenteront Genève lors d'une conférence à comité de lecture lors de la 26e conférence de l'Association for Computing Machinery sur la sécurité informatique et des communications à Londres le 14 novembre. 2019.
"Avec Genève, nous sommes, pour la première fois, à un avantage majeur dans la course aux armements à la censure, " a déclaré Dave Levin, professeur adjoint d'informatique à l'UMD et auteur principal de l'article. "Genève représente le premier pas vers une toute nouvelle course aux armements dans laquelle les systèmes d'intelligence artificielle des censeurs et des fraudeurs s'affrontent. En fin de compte, gagner cette course signifie apporter la liberté d'expression et une communication ouverte à des millions d'utilisateurs à travers le monde qui ne les ont pas actuellement."
Toutes les informations sur Internet sont divisées en paquets de données par l'ordinateur de l'expéditeur et réassemblées par l'ordinateur destinataire. Une forme répandue de censure sur Internet utilisée par les régimes autoritaires consiste à surveiller les paquets de données envoyés lors d'une recherche sur Internet. La censure bloque les demandes qui contiennent soit des mots-clés signalés (comme « Place Tiananmen » en Chine) soit des noms de domaine interdits (comme « Wikipédia » dans de nombreux pays).
Lorsque Genève fonctionne sur un ordinateur qui envoie des requêtes Web via un censeur, Genève modifie le découpage et l'envoi des données, afin que le censeur ne reconnaisse pas le contenu interdit ou ne soit pas en mesure de censurer la connexion.
Connu sous le nom d'algorithme génétique, Genève est un type d'intelligence artificielle d'inspiration biologique que Levin et son équipe ont développé pour fonctionner en arrière-plan lorsqu'un utilisateur navigue sur le Web à partir d'un navigateur Internet standard. Comme les systèmes biologiques, Genève forme des ensembles d'instructions à partir de blocs de construction génétiques. Mais plutôt que d'utiliser l'ADN comme éléments constitutifs, Genève utilise de petits morceaux de code. Individuellement, les bouts de code font très peu, mais lorsqu'il est composé en instructions, ils peuvent mettre en œuvre des stratégies d'évasion sophistiquées pour rompre, organiser ou envoyer des paquets de données.
Genève fait évoluer son code génétique par tentatives (ou générations) successives. A chaque génération, Genève conserve les instructions qui fonctionnent le mieux pour échapper à la censure et expulse le reste. Genève mute et croise ses stratégies en supprimant au hasard des instructions, ajouter de nouvelles instructions, ou combiner des instructions réussies et tester à nouveau la stratégie. Grâce à ce processus évolutif, Genève est capable d'identifier très rapidement de multiples stratégies d'évasion.
« Cela inverse complètement la façon dont les chercheurs abordent généralement le problème de la censure, " dit Levine, qui détient un poste conjoint à l'Institut d'études avancées en informatique de l'Université du Maryland. « D'habitude, nous identifions le fonctionnement d'une stratégie de censure, puis nous concevons des stratégies pour y échapper. Mais maintenant, nous laissons Genève découvrir comment échapper à la censure, et ensuite nous apprenons quelles stratégies de censure sont utilisées en voyant comment Genève les a vaincues. »
L'équipe a testé Genève en laboratoire contre de faux censeurs et dans le monde réel contre de vrais censeurs. Dans le laboratoire, les chercheurs ont développé des censeurs qui fonctionnaient comme ceux connus des recherches précédentes pour être déployés par les régimes autocratiques. Sous quelques jours, Genève a identifié pratiquement toutes les stratégies de manipulation de paquets qui avaient été découvertes par des travaux publiés précédemment.
Pour démontrer que Genève a travaillé dans le monde réel contre des stratégies de censure non découvertes, l'équipe a exécuté Genève sur un ordinateur en Chine avec un navigateur Google Chrome non modifié installé. En déployant des stratégies identifiées par Genève, l'utilisateur a pu naviguer sans censure par mot-clé. Les chercheurs ont également réussi à échapper à la censure en Inde, qui bloque les URL interdites, et le Kazakhstan, qui écoutait sur certains sites de médias sociaux à l'époque. Dans tous les cas, Genève a réussi à contourner la censure.
"Actuellement, le cycle d'évasion-détection nécessite une mesure manuelle étendue, rétro-ingénierie et créativité pour développer de nouveaux moyens d'évasion de la censure, " a déclaré Kevin Bock (BS '17, MME. '18, l'informatique), un doctorat en informatique étudiant à l'UMD et auteur principal de l'article. « Avec cette recherche, Genève représente une première étape importante dans l'automatisation de l'évasion de la censure."
Les chercheurs prévoient de publier leurs données et leur code dans l'espoir que cela fournira un accès ouvert à l'information dans les pays où Internet est restreint. L'équipe reconnaît qu'il peut y avoir de nombreuses raisons pour lesquelles les individus vivant sous des régimes autocratiques pourraient ne pas vouloir ou être en mesure d'installer l'outil sur leurs ordinateurs. Cependant, ils ne se découragent pas. Les chercheurs explorent la possibilité de déployer Genève sur l'ordinateur fournissant le contenu bloqué (appelé serveur) plutôt que sur l'ordinateur recherchant le contenu bloqué (appelé client). Cela signifierait que des sites Web tels que Wikipédia ou la BBC pourraient être accessibles à toute personne à l'intérieur des pays qui les bloquent actuellement, comme la Chine et l'Iran, sans demander aux utilisateurs de configurer quoi que ce soit sur leur ordinateur.
« Si Genève peut être déployée côté serveur et fonctionner aussi bien que côté client, alors il pourrait potentiellement ouvrir des communications pour des millions de personnes, " Levin a dit. "C'est une possibilité incroyable, et c'est une direction que nous poursuivons."