L’ère de l’informatique exascale : une course à l’efficacité énergétique
Au cours des deux dernières années seulement, l’informatique de pointe s’est accélérée pour entrer dans l’ère exascale – avec les machines les plus massives du monde capables d’effectuer plus d’un milliard de milliards d’opérations par seconde. Cependant, à moins que des améliorations significatives de l’efficacité interviennent le long de sa courbe de croissance exponentielle, il est également prévu que l’informatique nécessitera des quantités d’énergie de plus en plus irréalistes et insoutenables – selon une étude largement citée, d’ici 2040, elle nécessiterait plus d’énergie que la production totale actuelle du monde.
Une nouvelle approche axée sur l’efficacité énergétique
Heureusement, la communauté de l’informatique haute performance se concentre maintenant non seulement sur l’augmentation des performances (mesurées en pétaflops ou exaflops bruts), mais aussi sur une plus grande efficacité, en augmentant le nombre d’opérations par watt. La liste Green500 a vu de nouveaux venus entrer dans les trois premières places, suggérant que certains des systèmes de haute performance les plus récents au monde pourraient rechercher l’efficacité au moins autant que la puissance brute.
Les derniers classements des supercalculateurs
Le dernier classement des 500 plus grands supercalculateurs (une liste des machines les plus puissantes du monde) et son cousin le Green500 (classant plutôt les machines les plus efficaces au monde) sont sortis la semaine dernière. Les 10 premiers des 500 plus grands supercalculateurs restent presque inchangés, dirigés par l’ordinateur exascale Frontier du Oak Ridge National Laboratory. Il n’y a eu qu’une seule nouvelle addition dans le top 10 à la 6e place : le système Alps du Swiss National Supercomputing Center. Pendant ce temps, l’Aurora du Argonne National Laboratory a doublé de taille, mais a conservé son classement de deuxième niveau.
Les supercalculateurs les plus efficaces
En haut de la nouvelle liste Green500 était JEDI, le système prototype du Jülich Supercomputing Center pour son prochain ordinateur exascale JUPITER. Les places n°2 et n°3 sont allées à Isambard AI de l’Université de Bristol, également la première phase d’un système plus important prévu, et au supercalculateur Helios de l’organisation polonaise Cyfronet. À la quatrième place se trouvait le leader de la liste précédente, Henri de la Fondation Simons.
Les avantages de Nvidia’s Grace Hopper superchips
Les trois premiers systèmes de la liste Green500 ont un point commun – ils sont tous construits avec les superchips Grace Hopper de Nvidia, une combinaison du GPU Hopper (H100) et du CPU Grace. Il y a deux principales raisons pour lesquelles l’architecture Grace Hopper est si efficace, explique Dion Harris, directeur de la stratégie de marché des centres de données accélérés chez Nvidia. La première est le CPU Grace, qui bénéficie de la performance énergétique supérieure de l’architecture de jeu d’instructions ARM. De plus, il intègre une structure de mémoire, appelée LPDDR5X, que l’on trouve couramment dans les téléphones portables et qui est optimisée pour l’efficacité énergétique.
La domination de JEDI sur le plan de l’efficacité énergétique
Les trois principaux systèmes utilisent des Grace Hoppers, mais le JEDI de Jülich reste en tête avec une marge notable – 72,7 gigaflops par watt, contre 68,8 gigaflops par watt pour le deuxième (et 65,4 gigaflops par watt pour le précédent champion). L’équipe de JEDI attribue leur succès supplémentaire à la manière dont ils ont connecté leurs puces ensemble. Leur tissu d’interconnexion provenait également de Nvidia – Quantum-2 InfiniBand – et non du HPE Slingshot utilisé par les deux autres meilleurs systèmes.
L’optimisation pour le benchmark Green500
L’équipe de JEDI cite également des optimisations spécifiques qu’ils ont faites pour répondre au benchmark Green500. En plus d’utiliser tout le matériel Nvidia le plus récent, JEDI réduit les coûts énergétiques grâce à son système de refroidissement. Au lieu d’utiliser de l’air ou de l’eau réfrigérée, JEDI fait circuler de l’eau chaude dans ses nœuds de calcul pour éliminer l’excès de chaleur.
Vers un avenir plus efficace en matière d’informatique de pointe
JUPITER utilisera la même architecture que son prototype, JEDI, et von St. Vieth dit viser à maintenir une grande partie de l’efficacité énergétique du prototype – bien qu’avec une échelle plus grande, ajoute-t-il, plus d’énergie pourrait être perdue dans le tissu d’interconnexion.
L’importance des performances réelles
Bien sûr, le plus crucial est la performance de ces systèmes dans des tâches scientifiques réelles, pas seulement sur le benchmark Green500. "C’était vraiment excitant de voir ces systèmes devenir opérationnels", déclare Harris de Nvidia, "mais plus important encore, je pense que nous sommes vraiment impatients de voir la science issue de ces systèmes, car je pense que [l’efficacité énergétique] aura plus d’impact sur les applications que sur le benchmark."