• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • ShareBackup pourrait garder les données sur la voie rapide

    L'informaticien de l'Université Rice, Eugene Ng, a dirigé le développement de ShareBackup, une solution matérielle et logicielle pour aider les centres de données à se remettre des pannes sans ralentir les applications. Crédit :Jeff Fitlow/Université Rice

    Quiconque a déjà maudit un réseau informatique alors qu'il ralentissait à un rythme effréné appréciera le remède offert par les scientifiques de l'Université Rice.

    L'informaticien de Rice Eugene Ng et son équipe affirment que leur solution gardera les données sur la voie rapide lorsque des défaillances se produisent inévitablement.

    Ng a introduit ShareBackup, une stratégie qui permettrait aux commutateurs de sauvegarde partagés dans les centres de données de prendre en charge le trafic réseau en une fraction de seconde après une panne de commutateur logiciel ou matériel.

    Il présentera un article évalué par des pairs sur le travail cette semaine à la conférence SIGCOMM 2018 à Budapest, Hongrie. Le document est en ligne et téléchargeable.

    Ng a déclaré que l'idée résoudrait un problème commun parmi les professionnels des données, les scientifiques et tous ceux qui s'appuient sur un réseau pour produire des résultats jour après jour.

    "Un réseau de données est constitué de serveurs et de commutateurs réseau, " dit Ng, professeur d'informatique et de génie électrique et informatique. "Les commutateurs déplacent les paquets de données là où ils doivent aller. Mais les choses échouent, en particulier dans les centres de données à grande échelle avec des milliers de pièces de matériel."

    La réponse habituelle à un commutateur défaillant est de dévier le flux de données vers une autre ligne. "Généralement, le réseau a plusieurs chemins pour connecter les serveurs donc, comme s'il y avait une fermeture sur l'autoroute, nous ferions le tour. C'est une convention, approche naturelle qui a beaucoup de sens :vous vous détournez de l'échec pour arriver là où vous devez aller. »

    Mais parfois, cette autre route est encombrée et tout ralentit. « Les centres de données ne sont pas Internet ; ils ne concernent pas les gens qui surfent sur des sites Web, " a déclaré Ng. "Ils concernent la prise en charge d'applications gourmandes en données telles que l'exploration de données ou l'apprentissage automatique. Et beaucoup de ces applications ont des délais de performance stricts, donc réacheminer aveuglément le trafic pourrait être la mauvaise chose à faire dans un centre de données."

    Plutôt que l'option coûteuse d'installer des commutateurs redondants sur un réseau, la stratégie du laboratoire Ng placerait des commutateurs rapides et des logiciels dans des emplacements stratégiques qui pourraient récupérer le trafic d'un commutateur défaillant en une microseconde. Lorsque ce problème est résolu, le logiciel de l'équipe met le commutateur de sauvegarde à disposition pour gérer une autre panne.

    Le commutateur est suffisamment rapide :le temps de récupération après défaillance est de 0,73 milliseconde, y compris la latence du matériel et des systèmes de contrôle - que la plupart des utilisateurs ne sauraient jamais qu'une partie du système a échoué.

    "La réalité est que la fraction d'appareils qui échouent à un moment donné est très faible, et la plupart de ces échecs peuvent être résolus par des choses comme le redémarrage de l'appareil, " Dit Ng. "Parfois, le logiciel est foiré et un simple cycle d'alimentation le ramènera. Ces échecs peuvent également ne pas durer longtemps.

    "Ce sont les caractéristiques que nous essayons d'exploiter, " dit-il. " A cause de cela, nous pouvons nous en tirer avec très peu d'appareils pour sauvegarder un grand nombre d'appareils."

    Ng a déclaré que ShareBackup pourrait faire gagner du temps et de l'argent aux centres de données non seulement en maintenant une bande passante complète, mais en aidant également à analyser les problèmes, y compris les erreurs de configuration qui conduisent généralement à une défaillance du réseau.

    "Une partie de notre travail consiste à aider les centres de données à comprendre ce qui ne va pas dans le réseau, " dit-il. " Une fois la sauvegarde activée, vous pouvez retirer le périphérique défaillant du réseau de production et le tester pour identifier le composant à l'origine du problème.

    "Maintenant, si nous retirons deux appareils et ne pouvons pas déterminer lequel a mal tourné, les deux doivent être remplacés, " dit-il. " Il est très probable qu'un seul des appareils ait le problème. Notre logiciel peut diagnostiquer ces appareils de manière semi-automatique, et si l'une des parties est bonne, il peut être rétabli."


    © Science https://fr.scienceaq.com