L'état des GPU individuels est surveillé et les tâches sont réparties en conséquence. Crédit :Université de technologie de Vienne
Les unités de traitement graphique (GPU) sont utilisées pour de nombreuses tâches de calcul intensif. Leur processus de vieillissement peut être ralenti par une gestion intelligente, comme l'ont montré la TU Wien (Vienne) et l'Université de Californie (Irvine).
Les unités de traitement graphique ne sont pas seulement utilisées pour afficher des graphiques. Aujourd'hui, ils sont fréquemment utilisés pour des calculs particulièrement difficiles - par exemple dans la recherche scientifique ou même dans l'exploitation minière de Bitcoin.
Cependant, leurs performances diminuent généralement avec le temps. À mesure que les cœurs individuels de l'unité de traitement vieillissent, ils ne fonctionnent plus parfaitement ensemble. TU Wien et l'Université de Californie, Irvine a donc développé une méthode améliorée de gestion des copeaux, qui répartit les tâches de traitement de manière efficace. Dans plus de 95 % des cas, cela peut ralentir le processus de vieillissement des GPU.
Calcul hautement parallèle
« Les ordinateurs standard que nous utilisons à la maison n'ont que quelques cœurs de processeur. Une unité de traitement graphique, quant à elle, se compose d'un grand nombre de cœurs, généralement des centaines ou des milliers », déclare le professeur Muhammad Shafique (Institut de génie informatique, TU Vienne). Par conséquent, Les GPU sont extrêmement utiles pour les calculs parallèles, dans lequel une tâche peut être décomposée en de nombreux petits calculs qui peuvent être résolus indépendamment les uns des autres, par différents noyaux en même temps.
Un cluster de processeurs. Crédit :Université de technologie de Vienne
Les noyaux, cependant, ne sont jamais complètement identiques. "Les structures sur le GPU sont très petites. Il y aura toujours de petites imperfections et déviations dues au processus de production", dit Muhammad Shafique. Par conséquent, le vieillissement a des effets différents sur différents noyaux. Sous contrainte, les performances des différents cœurs vont s'écarter.
C'est un problème pour le calcul parallèle. Lorsqu'une tâche est répartie entre plusieurs cœurs et que le système doit attendre la fin de la dernière avant de pouvoir démarrer la prochaine étape du calcul, le noyau le plus lent détermine la vitesse globale du processus. Cela peut réduire considérablement les performances du GPU.
Techniques de gestion intelligentes
Muhammad Shafique et l'équipe du professeur Mohammad Al Faruque (Université de Californie, Irvine) veulent résoudre ce problème en utilisant des méthodes de gestion intelligentes :« Premièrement, il est crucial de connaître l'état des différents noyaux", dit Muahmmad Shafique. "Ensuite, nous pouvons répartir différentes tâches de manière à ce que le stress physique soit réparti de manière optimale entre les noyaux."
Les noyaux aux propriétés similaires sont combinés en « clusters », qui se voient ensuite confier des tâches plus ou moins difficiles – en fonction de leur statut actuel. De cette façon, le processus de vieillissement peut être ralenti, la performance globale du système augmente. "Il y a déjà eu des idées sur la façon de ralentir le processus de vieillissement des GPU avec des techniques basées sur le compilateur, mais notre méthode est beaucoup plus efficace. Il fonctionne dans plus de 95 % des cas", dit Muhammad Shafique.