Densité de probabilité pour des performances réalisables (GFlop/s) à l'aide de 1024 échantillons avec différentes mosaïques et tailles de problème. Avec eDRAM (DRAM =mémoire vive dynamique), la courbe de fonction dans son ensemble se déplace vers le haut à droite, ce qui implique que plus d'échantillons peuvent atteindre presque le pic (par exemple, 90 %) performances. En d'autres termes, avoir eDRAM augmente les chances pour les applications moins optimisées d'atteindre les performances « revendiquées par le fournisseur ». Cependant, la limite droite ne bouge qu'un peu, indiquant que l'eDRAM ne peut pas améliorer de manière significative les performances de pointe brutes. Crédit :Département américain de l'Énergie
La mémoire à bande passante élevée peut améliorer les performances d'un ordinateur. La mémoire intégrée (OPM) est une option populaire dans de nombreux systèmes commerciaux. Avant cet effort, on savait peu de choses sur les implications de l'OPM sur la vitesse et la consommation d'énergie. L'équipe a caractérisé et analysé expérimentalement le stockage OPM moderne. Ils ont fourni des directives sur le réglage de la mémoire pour accélérer les applications de calcul haute performance (HPC).
Cette étude sur les OPM est à la fois essentielle et fondamentale pour faire avancer les systèmes informatiques. Par exemple, il motive l'exploration de co-conception d'architecture logicielle. Plus loin, il valide les modèles et les simulations. Il a également abouti à des directives générales d'optimisation. Le travail montre comment régler les applications et les architectures pour les meilleures performances sur les plates-formes avec certains OPM.
Les chercheurs ont mené une évaluation expérimentale approfondie pour discerner comment les OPM modernes affectaient les performances et l'efficacité énergétique des noyaux scientifiques HPC importants, qui composent le système d'exploitation central d'un ordinateur. Ils ont examiné différents modes de réglage d'OPM et leur influence sur le réglage des applications pour les meilleures performances du système. L'équipe du Pacific Northwest National Laboratory, Université de Copenhague, et Virginia Tech ont évalué divers noyaux HPC sur deux OPM Intel, eDRAM sur Broadwell multicœur et MCDRAM sur plusieurs cœurs Knights Landing, avec un grand ensemble de leurs matrices d'entrée représentatives (par exemple, 968 matrices pour noyaux clairsemés). Cette étude a permis à l'équipe de dériver un modèle analytique visuel intuitif pour mieux expliquer des scénarios architecturaux complexes, ainsi que fournir des directives générales pour les futures optimisations de l'architecture et le réglage de l'efficacité.