Avec le développement rapide de l'entraînement des grands modèles d'IA, du calcul haute performance et du cloud computing, la demande des entreprises en matière de puissance de calcul GPU et de performances de stockage des serveurs a connu une croissance explosive. Cependant, les architectures de serveurs traditionnelles présentent de nombreux goulots d'étranglement en matière de capacités d'extension, tels que le nombre limité d'emplacements PCIe, la difficulté à équilibrer le déploiement des GPU et des SSD, ainsi que le manque de flexibilité des solutions d'extension. Ces problèmes ont fortement freiné l'innovation des entreprises. Cet article analyse en profondeur ces points faibles du secteur et démontre comment LR-LINK LRSV9500-4I offre aux entreprises une solution d'extension tout-en-un grâce à des modes de bifurcation flexibles X4/X8/X16.
Dimension de comparaison | Solution traditionnelle | |
Capacité d'extension | 1 emplacement = 1 appareil | 1 emplacement = 8 SSD ou 2 GPU |
Flexibilité de configuration | Fonction fixe | Modes commutables X4/X8/X16 |
Équilibrage GPU + SSD | Difficile de se retrouver tous en même temps | Parfaitement pris en charge en mode X8 |
Prise en charge de PCIe 5.0 | Prise en charge partielle | Prise en charge complète de 32 Go/s |
Interconnexion multi-GPU | Utiliser le transfert par le processeur | Communication entre pairs |
II.TExemples d'applications typiques dans l'industrie
Une entreprise spécialisée dans l'IA a mis au point une plateforme avancée de formation de grands modèles, en utilisant le mode X16 du LRSV9500-4I pour étendre la capacité des GPU. Huit GPU sont connectés via quatre LRSV9500-4I cartes. Cette configuration améliore considérablement l'utilisation du GPU et l'efficacité de l'entraînement.
Un cluster de stockage distribué a été mis en place en mode X4 sur le LRSV9500-4I, permettant ainsi à un seul serveur de prendre en charge 8 disques SSD NVMe au format U.2, pour une capacité totale de 128 To et une bande passante agrégée de plus de 50 Go/s. L'application de cette technologie a considérablement amélioré l'évolutivité et les performances du système, les performances des requêtes de base de données ayant été multipliées par 10.
La production cinématographique et télévisuelle utilise des stations de travail en mode X8, équipées de deux cartes graphiques qui affichent d'excellentes performances lors des tests de rendu en temps réel et permettent d'améliorer considérablement l'efficacité du rendu et de l'exportation. De plus, la configuration comprenant deux SSD NVMe garantit une lecture et une écriture ultra-rapides pour le stockage des fichiers. Des tests de performances professionnels montrent que la vitesse de rendu des contenus vidéo 4K est augmentée de plus de 80 % par rapport aux configurations traditionnelles, et que le temps d'exportation des vidéos haute définition est réduit de 60 %.
Le centre de supercalcul utilise des nœuds de calcul hétérogènes LRSV9500-4I pour mettre en œuvre le calcul parallèle des GPU en mode X16 et assurer une connexion efficace entre les cartes d'accélération FPGA et le stockage NVMe en mode X8. Cette méthode de configuration flexible du calcul, du réseau et du stockage a permis d'améliorer considérablement l'utilisation des ressources, avec une augmentation de 40 %.
III.LRSV9500-4I Conseils pour le choix et la configuration
· Dans les scénarios d'entraînement d'IA purs, il est recommandé de sélectionner le mode X16 afin d'optimiser la bande passante d'un seul GPU et de prendre ainsi en charge les cartes graphiques haut de gamme
· Dans les configurations de stockage pur, le mode X4 peut être sélectionné pour optimiser le nombre de SSD et mettre en place une baie 100 % SSD à haute densité
· Pour les scénarios de charge mixte, il est possible de sélectionner le mode X8 afin d'équilibrer la configuration du GPU et du SSD, et ainsi d'obtenir une répartition optimale des ressources
· Compatibilité avec la carte mère : vérifiez que la carte mère prend en charge la norme PCIe 5.0
· Encombrement du châssis : le LRSV9500-4I est un modèle demi-hauteur, compatible avec les serveurs 2U et plus
· Conditions de dissipation thermique : veillez à ce que les conduits d'aération du serveur ne soient pas obstrués ; des mesures supplémentaires de dissipation thermique peuvent être mises en place si nécessaire
· Qualité des câbles : utilisez des câbles MCIO haute vitesse certifiés pour garantir l'intégrité des signaux PCIe 5.0
Avec la publication de la spécification PCIe 6.0, son débit de transmission a atteint 64 GT/s par canal. La maturité de cette technologie, associée au développement de la technologie CXL, ouvrira de nouvelles perspectives de développement pour les cartes d'extension de commutateurs PCIe. Le développement de la technologie CXL, en particulier la prise en charge de CXL 2.0 pour le pooling de mémoire et l'architecture de commutateur, élargira le rôle du commutateur PCIe, qui ne se limitera plus à l'extension des GPU et du stockage, mais jouera un rôle important dans l'extension de la mémoire.
Parallèlement, avec l'augmentation constante de l'échelle des paramètres des grands modèles d'IA, les besoins en bande passante d'interconnexion des GPU deviendront de plus en plus pressants, comme en témoignent la croissance significative du marché des grands modèles d'IA et les avancées technologiques dans ce domaine. La capacité d'interconnexion multi-machines du commutateur PCIe, rendue possible par la fonction NTB, deviendra une technologie clé pour la construction de clusters d'entraînement IA à grande échelle. LR-LINK continuera d'investir dans la R&D afin de fournir à ses clients des solutions d'extension plus avancées.
Les principaux défis liés à l'extension des GPU et du stockage sur les serveurs tiennent essentiellement à la contradiction entre des ressources limitées et une demande illimitée. Grâce à la technologie de commutateur PCIe et à ses modes de bifurcation flexibles X4/X8/X16, le LRSV9500-4I offre aux entreprises une solution efficace. Que ce soit pour l'entraînement de l'IA, le calcul haute performance, l'analyse de mégadonnées ou la production vidéo, le LRSV9500-4I offre d'excellentes capacités d'extension et une protection de l'investissement.
En tant que produit phare de LR-LINK dans le domaine du PCIe 5.0, le LRSV9500-4I, qui s'appuie sur les performances de pointe de la puce Broadcom PEX89048 et sur une prise en charge parfaite de l'écosystème, s'impose comme la solution d'extension privilégiée pour la construction de serveurs IA et de centres de données. Choisir le LRSV9500-4I, c'est opter pour une architecture d'extension flexible, efficace et tournée vers l'avenir.