Alibaba couronne son service cloud avec une puissante puce IA

Crédit :Groupe Alibaba

La première puce IA d'Alibaba fait l'actualité. C'est une puce auto-développée, a déclaré Reuters, pour les services de cloud computing.

Reuters a déclaré dans le cloud computing, Alibaba dominait ses rivaux en Chine. Au niveau mondial, Alibaba s'est classé troisième dans le cloud computing après Amazon et Google, mentionné Revue Nikkei Asie .

Cela n'a pas échappé aux observateurs de la technologie couvrant l'histoire selon laquelle la Chine a tiré pour sa propre technologie de semi-conducteurs.

Abaque a fait référence à cette tendance plus tôt ce mois-ci lorsqu'il a fait remarquer que « les vétérans de l'industrie craignent qu'il s'agisse d'un écart technologique qui pourrait ne jamais être comblé si la Chine continue sur la même voie en important des technologies étrangères au lieu de développer la sienne, le condamnant à dépendre d'amis qui pourraient devenir les ennemis de demain."

Ce n'est un secret pour personne que les entreprises technologiques chinoises cherchent à s'éloigner des fabricants étrangers de semi-conducteurs au milieu des sanctions américaines, mentionné CDD .

Jeff Zhang, directeur de la technologie chez Alibaba, a dévoilé la puce, appelé le Hanguang 800, et également décrite comme une puce d'inférence d'IA hautes performances.

Puce d'inférence ? Michael Copeland dans le blog Nvidia peut expliquer ce que signifie l'inférence.

Il a dit, « le réseau de neurones entraîné est mis en œuvre dans le monde numérique en utilisant ce qu'il a appris :reconnaître des images, paroles prononcées, une maladie du sang, ou suggérer les chaussures que quelqu'un est susceptible d'acheter ensuite, vous l'appelez—sous la forme simplifiée d'une application. Cette version plus rapide et plus efficace d'un réseau de neurones déduit des informations sur les nouvelles données qui lui sont présentées en fonction de son apprentissage. Dans le lexique de l'IA, cela est connu sous le nom d'« inférence ».

Quant à cette nouvelle puce d'Alibaba, Xinhua a déclaré avoir une puissance de calcul 10 fois supérieure à celle des unités de traitement graphique traditionnelles. CNBC a déclaré, selon les allégations, que la puce était capable de réduire les tâches informatiques prenant généralement une heure à cinq minutes. Alibaba peut être satisfait de l'avantage de sa puce d'améliorer l'efficacité de calcul dans la recherche visuelle. Xinhua a déclaré que la puce pouvait gérer "plus de 78, 500 images en une seconde."

Les entreprises utilisant des applications d'IA ont besoin d'énormes quantités de données pour former des algorithmes intelligents, et cela peut prendre plusieurs jours ou semaines.

Donc, quels types de tâches pourraient vraiment utiliser l'accélération ? Bien, Alibaba utilise la puce en interne, a déclaré CNBC. Les opérations commerciales spécifiques nommées étaient la recherche de produits, traduction automatique sur les sites e-commerce, recommandations personnalisées, publicité et « services à la clientèle intelligents ». juste les types de domaines qui nécessitent des tâches informatiques étendues.

La société utilise des puces Hanguang 800 avec des résultats qui montrent son avantage en termes de vitesse. Temps EE a dit que « En utilisant l'appareil, le service Pailitao de l'entreprise, où les utilisateurs téléchargent des photos d'articles et recherchent des produits correspondants, a vu son efficacité de performance multipliée par 12. Ce service traite un milliard d'images téléchargées chaque jour, nécessitant une heure de traitement à l'aide de l'infrastructure GPU de l'entreprise. » L'infrastructure Hanguang 800 a traité la même quantité d'images en beaucoup moins de temps.

C'est quoi Révision Synchronisée avait à dire concernant la conception et les capacités de la puce. "Le Hanguang 800 de 12 nm contient 17 milliards de transistors. Compte tenu d'un test de référence de classification d'images d'inférence sur ResNet-50, La performance maximale de Hanguang 800 est de 78, 563 images par seconde (IPS). Zhang dit que le Hanguang 800 est 15 fois plus puissant que le GPU NVIDIA T4, et 46 fois plus puissant que le GPU NVIDIA P4. L'efficacité maximale de la puce est de 500 IPS/W."

Modèle d'affaires? Comme mentionné, la puce sera proposée dans son modèle de service cloud. "Alibaba ne vend pas directement ses puces Hanguang 800 aux clients à ce stade, " mentionné Révision Synchronisée ; au lieu, les développeurs peuvent louer Hanguang 800 fois sur le service cloud AI.

Revue Asiatique Nikkei entendu plus à ce sujet par Sean Yang, analyste chez CINNO, basé à Shanghai. "La nouvelle annonce sur les puces AI peut être considérée non seulement comme un effort pour se découpler des fabricants de puces américains, mais d'un point de vue commercial, c'est aussi un moyen pour Alibaba de créer un service cloud de centre de données plus personnalisé et plus compétitif pour rivaliser avec des concurrents comme Amazon, Google, Tencent et Microsoft, " a dit Yang.

La peau artificielle pourrait aider à la rééducation et améliorer la réalité virtuelle

Les banques traditionnelles luttent pour conjurer la révolution fintech

Électronique