Avec le développement rapide de la formation de grands modèles d'IA, du calcul à haute performance et de l'informatique en nuage, la demande des entreprises en matière de puissance de calcul GPU et de performances de stockage des serveurs a connu une croissance explosive. Cependant, les architectures de serveurs traditionnelles présentent de nombreux goulets d'étranglement au niveau des capacités d'extension, tels que des emplacements PCIe limités, la difficulté d'équilibrer le déploiement des GPU et des SSD, et le manque de flexibilité des solutions d'extension. Ces problèmes ont fortement limité l'innovation commerciale. Cet article analyse en profondeur ces points problématiques de l'industrie et démontre comment LR-LINK LRSV9500-4I offre aux entreprises une solution d'extension unique grâce à des modes de bifurcation X4/X8/X16 flexibles.
Dimension de comparaison | Solution traditionnelle | |
Capacité d'expansion | 1 emplacement = 1 appareil | 1 slot = 8 SSD ou 2 GPU |
Flexibilité de la configuration | Fonction fixe | Modes X4/X8/X16 commutables |
Équilibrage GPU + SSD | Difficile de se rencontrer au même moment | Parfaitement pris en charge en mode X8 |
Support PCIe 5.0 | Soutien partiel | Prise en charge complète de 32GT/s |
Interconnexion multi-GPU | S'appuyer sur le transfert de l'unité centrale | Communication P2P |
II.TCas d'application industriels typiques
Une société d'IA a construit une plateforme de formation avancée pour les grands modèles, en utilisant le mode X16 du LRSV9500-4I pour augmenter le nombre de GPU. 8 GPU sont connectés par 4 LRSV9500-4I cartes. Cette configuration améliore considérablement l'utilisation du GPU et l'efficacité de la formation.
Un cluster de stockage distribué est construit avec le mode X4 du LRSV9500-4I, réalisant qu'un seul serveur supporte 8 U.2 NVMe SSD avec une capacité totale de 128TB et une bande passante agrégée de plus de 50GB/s. L'application de cette technologie a considérablement amélioré l'évolutivité et les performances du système, les performances des requêtes de base de données ayant été multipliées par 10.
La production cinématographique et télévisuelle configure des stations de travail en mode X8, équipées de 2 cartes graphiques qui réalisent d'excellentes performances lors des tests de rendu en temps réel et peuvent améliorer considérablement l'efficacité du rendu et de l'exportation. En outre, la configuration de 2 disques SSD NVMe garantit une lecture et une écriture à grande vitesse du stockage des matériaux. Les tests de performance professionnels montrent que la vitesse de rendu des vidéos 4K est augmentée de plus de 80 % par rapport aux configurations traditionnelles, et que le temps d'exportation des vidéos haute définition est réduit de 60 %.
Le centre de supercalcul utilise des nœuds de calcul hétérogènes LRSV9500-4I pour réaliser le calcul parallèle des GPU en mode X16 et la connexion efficace des cartes d'accélération FPGA et du stockage NVMe en mode X8. Cette méthode de configuration flexible du calcul, du réseau et du stockage a considérablement amélioré l'utilisation des ressources de 40 %.
III.LRSV9500-4I Suggestions de sélection et de configuration
· Dans les scénarios de formation à l'IA pure, il est recommandé de sélectionner le mode X16 pour maximiser la bande passante du GPU unique et ainsi prendre en charge les cartes graphiques haut de gamme.
· Dans les scénarios de stockage pur, le mode X4 peut être sélectionné pour maximiser le nombre de disques SSD et construire une matrice all-flash à haute densité.
· Pour les scénarios de charge mixte, le mode X8 peut être sélectionné pour équilibrer la configuration du GPU et du SSD, afin d'obtenir une allocation optimale des ressources.
· Compatibilité de la carte mère : Confirmer que la carte mère est compatible avec PCIe 5.0.
· Espace du châssis : Le LRSV9500-4I est conçu à mi-hauteur, compatible avec les serveurs 2U et plus.
· Conditions de dissipation de la chaleur : Veiller à ce que le conduit d'air du serveur ne soit pas obstrué ; des mesures auxiliaires de dissipation de la chaleur peuvent être ajoutées si nécessaire.
· Qualité du câble : Utilisez des câbles MCIO certifiés à haute vitesse pour garantir l'intégrité des signaux PCIe 5.0.
Avec la publication de la spécification PCIe 6.0, son taux de transmission a atteint 64GT/s par canal. La maturité de cette technologie, combinée au développement de la technologie CXL, apportera de nouvelles opportunités de développement pour les cartes d'extension PCIe Switch. Le développement de la technologie CXL, en particulier la prise en charge de CXL 2.0 pour la mise en commun de la mémoire et l'architecture de commutation, élargira le rôle du commutateur PCIe, qui ne sera plus limité à l'expansion du GPU et du stockage, mais jouera un rôle important dans l'expansion de la mémoire.
Parallèlement, avec la croissance continue de l'échelle des paramètres des grands modèles d'IA, la demande de bande passante d'interconnexion GPU deviendra plus urgente, comme le montrent la croissance significative de l'échelle du marché de l'industrie des grands modèles d'IA et les percées technologiques. La capacité d'interconnexion multi-machine du commutateur PCIe réalisée grâce à la fonction NTB deviendra une technologie clé pour la construction de clusters d'entraînement à l'IA à grande échelle. LR-LINK continuera à investir dans la R&D afin de fournir aux clients des solutions d'expansion plus avancées.
Les problèmes liés à l'expansion du GPU et du stockage des serveurs sont essentiellement dus à la contradiction entre des ressources limitées et une demande illimitée. Grâce à la technologie PCIe Switch et aux modes flexibles de bifurcation X4/X8/X16, LRSV9500-4I offre aux entreprises une solution efficace. Que ce soit pour la formation à l'IA, le calcul haute performance, l'analyse des big data ou la production vidéo, le LRSV9500-4I peut offrir d'excellentes capacités d'expansion et une protection des investissements.
Produit phare de LR-LINK dans le domaine du PCIe 5.0, le LRSV9500-4I, qui s'appuie sur les performances de pointe de la puce Broadcom PEX89048 et sur un support écosystémique parfait, est en train de devenir la solution d'extension préférée pour les serveurs d'IA et la construction de centres de données. Choisir LRSV9500-4I, c'est choisir une architecture d'extension flexible, efficace et orientée vers l'avenir.