Le PDG de NVIDIA, Jensen Huang, a fait un certain nombre d’annonces durant sa keynote au Computex, dévoilant notamment des détails quant au prochain superordinateur DGX de l’entreprise. Étant donné la direction que prend clairement l’industrie aujourd’hui, ce n’est pas une surprise d’apprendre que le DGX GH200 sera largement orienté vers l’aide aux sociétés dans le développement de modèles d’intelligence artificielle (IA) générative.

Ce superordinateur utilise un nouveau System Switch NVLink pour activer ses 256 superpuces GH200 Grace Hopper et les faire fonctionner chacune comme des GPU uniques (chacune d’elle a un CPU Grace basé sur ARM et un GPU H100 Tensor Core). Selon NVIDIA, ceci permet au DGX GH200 d’offrir 1 exaflop de puissance de calcul, avec 144 To de mémoire partagée. L’entreprise explique que cela représente 500 fois plus de mémoire que ce que l’on peut trouver dans un seul système DGX A100.

À titre de comparaison, le dernier classement Top500 des superordinateurs liste le Frontier du Oak Ridge National Laboratory au Tennessee comme le seul système exascale, ayant atteint près de 1,2 exaflop sur le benchmark Linmark. C’est plus de deux fois les performances du système classé deuxième, le Fugaku japonais.

En effet, NVIDIA affirme avoir développé un superordinateur capable de rivaliser avec les systèmes les plus puissants actuellement sur la planète (Meta en fabrique un qui, selon lui, sera le plus rapide du monde une fois terminé). NVIDIA explique que l’architecture du DGX GH200 offre 10 fois plus de bande-passante que la génération précédente, “délivrant la puissance d’un superordinateur IA massif avec la simplicité de programmation d’un seul GPU.”

Certains grands noms sont déjà intéressés par ce DGX GH200. Google Cloud, Meta et Microsoft pourraient compter parmi les premières sociétés à obtenir l’accès à ce superordinateur pour tester comment elles pourraient gérer les charges de travail des IA génératives. Nvidia explique que les superordinateurs DGX GH200 devraient être disponibles d’ici à la fin de l’année 2023.

Et NVIDIA travaille sur son propre supercalculateur, Helios, avec quatre DGX GH200

L’entreprise travaille aussi à la construction de son propre supercalculateur, Helios, qui combine quatre systèmes DGX GH200. NVIDIA s’attend à ce que Helios soit opérationnel d’ici à la fin de l’année.

Jensen Huang discutait d’autres développements autour de l’IA générative durant sa keynote, y compris concernant le jeu vidéo. NVIDIA Avatar Cloud Engine (ACE) for Games est un service que les développeurs pourront utiliser pour créer des modèles d’IA personnalisés pour le langage, les conversations et l’animation. NVIDIA explique que ACE for Games peut “donner aux personnages non jouables des capacités conversationnelles pour que ceux-ci puissent répondre aux questions avec des personnalités réalistes qui évoluent.”