News Day FR

DDN récupère 300 millions de dollars pour développer son offre d’IA

DDN, fournisseur historique de baies de stockage pour supercalculateurs, vient de recevoir un investissement de 300 millions de dollars du fonds américain Blackstone. L’objectif est de permettre à DDN de transformer son leadership dans les supercalculateurs en leadership dans les solutions de stockage pour l’IA.

Si dans les deux cas l’objectif est de produire des baies de stockage trop rapides pour alimenter des GPU performants, les approches sont différentes. Un superordinateur lit un petit nombre de formules mathématiques et produit d’énormes données de simulation. En IA, nous faisons le contraire : nous devons lire très rapidement un énorme ensemble de données pour produire un modèle synthétique plus petit (entraînement) ou générer la réponse à une invite à l’écran (inférence avec RAG).

Une offre qui va déjà du calcul intensif à l’IA

Pour le marché des supercalculateurs, DDN vend des baies EXAscaler qui fonctionnent sous Lustre, un système de fichiers parallélisé open source né au début des années 2000. Un tableau EXAscaler est un cluster de plusieurs nœuds de disque. Parmi eux, un nœud ne sert qu’à indexer le contenu des autres, un peu comme la zone répertoire sur un système de fichiers classique. Les serveurs de calcul interrogent ce serveur de métadonnées pour savoir sur quel nœud lire/écrire les blocs d’un fichier, puis ils communiquent directement avec le bon nœud lors du transfert des blocs de ce fichier.

Pour que le système fonctionne, les serveurs de calcul doivent transporter un client Lustre et disposer d’une connexion réseau directe avec les nœuds de stockage. Il s’agit généralement d’un réseau InfiniBand, sans perte de paquets, avec la possibilité pour la carte contrôleur de copier les données directement dans la RAM ou les SSD NVMe de la machine hôte.

DDN a mis en œuvre ce savoir-faire dans les baies de stockage AI400X2 conçues pour le traitement de l’IA. Ce sont les mêmes nœuds EXAscaler 2U, mais avec des cartes contrôleur Ethernet Nvidia SpectrumX. Equipées de DPU BlueField du même Nvidia, ces cartes apportent les mêmes avantages qu’Infiniband sur un réseau Ethernet, plus adapté aux serveurs d’entreprise. Leur protocole RoCE (RDMA over Converged Ethernet) fonctionne également sans perte de paquets, avec une écriture directe des données dans la mémoire des cartes GPU Nvidia (protocole GPUdirect).

DDN a même déjà des solutions d’inférence

Les AI400X2 sont principalement conçus pour communiquer le plus rapidement possible avec les GPU, lors de la formation d’un modèle d’IA. Mais ils coûtent très cher pour stocker l’énorme quantité de données qu’une entreprise souhaite soumettre quotidiennement à un modèle déjà entraîné. Pour ce deuxième cas d’usage, DDN propose depuis 2023 des baies Infinia. Celles-ci fonctionnent en mode objet, avec un protocole S3 basique, qui permet d’ajouter à chaud des nœuds de disques.

DDN a divisé chaque fonction de stockage S3 en conteneur : le serveur de métadonnées, le serveur de stockage, etc. À tel point que DDN peut reproduire avec son Infinia un fonctionnement similaire à Lustre, à condition que certains conteneurs S3 fonctionnels soient installés sur les serveurs de calcul. . Les baies Infinia ont l’avantage d’être également équipées de cartes SpectrumX pour maximiser la vitesse de transfert.

Enfin, DDN se targue de connaître mieux que quiconque le fonctionnement du stockage intensif. Lorsque les GPU écrivent en parallèle des données qu’ils relisent ensuite pour poursuivre leurs calculs, plusieurs problèmes d’incohérence peuvent surgir. Ces problèmes sont généralement résolus par des points de contrôle réguliers, une opération potentiellement très gourmande en calcul et ne générant aucune donnée utile. DDN affirme savoir éviter ces délais en fournissant des flux de transfert, qu’il orchestre grâce à une utilisation intelligente des caches.

Un investissement qui profite avant tout à Blackstone

Non seulement DDN propose déjà une offre d’IA, mais elle la vend également déjà à de gros clients. Parmi eux, xAI, la société d’Elon Musk qui a déployé un supercalculateur d’IA, Colossus, équipé de 100 000 GPU H100. En fait, l’utilité de ce nouvel investissement de 300 millions de dollars n’est pas très claire.

Il est probable que la motivation vienne principalement du fonds d’investissement Blackstone qui cherche à placer ses pions – il rejoint le conseil d’administration de DDN – dans plusieurs sociétés stratégiques d’IA. L’année dernière, le fonds a également offert un soutien financier à CoreWeave, un hôte d’infrastructure à la demande (IaaS) utilisé uniquement pour le traitement de l’IA.

En tout cas, DDN entretient désormais sur son site le suspense d’une annonce phénoménale pour l’IA, le 20 février. Si elle s’inscrit dans la stratégie que semble vouloir pousser Blackstone, il devrait s’agir d’un produit de stockage « IA » pour toutes les entreprises.

 
For Latest Updates Follow us on Google News
 

Related News :