الرئيسية
معلومات عنا
الأخبار
ديناميكيات المنتج
تحليل متعمق لكيفية استخدام LRSV9500-4I لتقنية محولات PCIe لمواجهة تحديات توسيع قدرات وحدة معالجة الرسومات (GPU) ووحدات التخزين في خوادم الذكاء الاصطناعي
تحليل متعمق لكيفية استخدام LRSV9500-4I لتقنية محولات PCIe لمواجهة تحديات توسيع قدرات وحدة معالجة الرسومات (GPU) ووحدات التخزين في خوادم الذكاء الاصطناعي
Time 2026-04-23

مع التطور السريع في تدريب النماذج الضخمة للذكاء الاصطناعي، والحوسبة عالية الأداء، والحوسبة السحابية، أظهر طلب الشركات على قوة الحوسبة التي توفرها وحدات معالجة الرسومات (GPU) في الخوادم وأداء التخزين اتجاهاً نموياً هائلاً. ومع ذلك، تعاني بنى الخوادم التقليدية من العديد من المعوقات في قدرات التوسع، مثل محدودية فتحات PCIe، وصعوبة تحقيق التوازن بين نشر وحدات معالجة الرسومات (GPU) ومحركات الأقراص الصلبة (SSD)، ونقص المرونة في حلول التوسع. وقد أدت هذه المشكلات إلى تقييد الابتكار التجاري بشكل كبير. ستحلل هذه الورقة بشكل متعمق نقاط الضعف هذه في الصناعة وستوضح كيف يمكن لـ LR-LINK LRSV9500-4I يوفر للشركات حلاً شاملاً للتوسع من خلال أوضاع التفرع المرنة X4/X8/X16.

أولاً: النقص الحاد في موارد فتحات PCIe

1.1 الوضع الحالي

عادةً ما توفر اللوحات الأم للخوادم الحديثة ما بين 4 إلى 8 فتحات PCIe فقط، والتي يتعين عليها تلبية متطلبات العديد من الأجهزة الطرفية في آن واحد، مثل بطاقات الشبكة ووحدات معالجة الرسومات (GPU) ومحركات الأقراص الصلبة SSD من نوع NVMe وبطاقات RAID. في سيناريوهات تدريب الذكاء الاصطناعي، قد يتطلب خادم واحد من 4 إلى 8 بطاقات رسومات GPU، بالإضافة إلى أجهزة تخزين عالية السرعة، مما يجعل عدد فتحات PCIe غالبًا أكبر عائق.

1.2 الآثار على الأعمال

من الصعب استخدام وحدة معالجة الرسومات (GPU) ومحرك الأقراص الصلبة (SSD) في آن واحد، ولا بد من إجراء مقايضات بين قوة الحوسبة وسعة التخزين

يتعين على الشركات شراء المزيد من الخوادم، مما يؤدي إلى زيادة كبيرة في التكلفة الإجمالية للملكية

تنفد سعة الخزانات بسرعة، مما يؤدي إلى انخفاض معدل استخدام الموارد في مراكز البيانات

1.3 حل LRSV9500-4I

يعتمد LRSV9500-4I على شريحة محول PCIe من طراز Broadcom PEX89048، ويقوم بتوسيع فتحة PCIe GEN 5.0 x16 واحدة إلى 4 واجهات MCIO 8I. ويمكنه توصيل 8 محركات أقراص SSD NVMe في وضع X4 وبطاقتي رسومات GPU متطورتين في وضع X16. ولا يتم شغل سوى فتحة PCIe واحدة، مما يحقق تحسناً بنسبة 800% في كفاءة التوسعة.

Iأولاً: الصعوبة في تحقيق التوازن بين توسيع قدرات وحدة معالجة الرسومات (GPU) وتوسيع سعة التخزين

2.1 الوضع الحالي

تتطلب سيناريوهات تدريب الذكاء الاصطناعي مواصفات عالية للغاية لكل من وحدات معالجة الرسومات (GPU) ووحدات التخزين عالية السرعة. تحتاج وحدات معالجة الرسومات إلى معالجة كميات هائلة من البيانات، في حين أن النطاق الترددي ومعدل عمليات الإدخال/الإخراج في الثانية (IOPS) لوحدات التخزين التقليدية SAS/SATA لا يمكنهما تلبية هذه المتطلبات. ومع ذلك، بعد شغل فتحات PCIe على اللوحة الأم بوحدات معالجة الرسومات، لا تتوفر واجهات كافية لنشر مصفوفات محركات الأقراص الصلبة SSD من نوع NVMe.

2.2 الآثار على الأعمال

· أثناء تدريب النماذج الكبيرة، عادةً ما يكون معدل استخدام طاقة الحوسبة في وحدات معالجة الرسومات (GPU) أقل من الطاقة الحاسوبية القصوى. على سبيل المثال، يبلغ معدل الاستخدام حوالي 59% في مجموعة مكونة من 1000 وحدة GPU، وحوالي 55.2% في مجموعة مكونة من 10000 وحدة GPU.

· تصبح قراءة البيانات التدريبية عاملاً مقيداً، مما يؤدي إلى إطالة دورات تكرار النموذج

2.3 حل LRSV9500-4I

من خلال الوضع الهجين X8، يمكن لـ LRSV9500-4I دعم كل من وحدة معالجة الرسومات (GPU) ومحركات الأقراص الصلبة SSD من نوع NVMe في الوقت نفسه. على سبيل المثال، يتم استخدام 2×X8 لتوصيل وحدات معالجة الرسومات (GPU)، ويتم توصيل 2×X8 المتبقية بوحدتي تخزين SSD من نوع NVMe كذاكرة تخزين مؤقتة محلية. وبهذه الطريقة، يمكن لوحدات معالجة الرسومات (GPU) قراءة البيانات مباشرة من وحدة التخزين المحلية عالية السرعة، مما يحسن كفاءة التدريب بمقدار 3 إلى 5 أضعاف.

ثالثًا: التحديات المتعلقة بسلامة إشارة PCIe 5.0

3.1 الوضع الحالي

يصل معدل الإشارة في معيار PCIe 5.0 إلى 32 جيجابت في الثانية. وتفرض هذه السرعة المضاعفة متطلبات صارمة للغاية فيما يتعلق بسلامة الإشارة لضمان دقة وكفاءة نقل البيانات. وقد يؤدي النقل لمسافات طويلة أو استخدام كابلات أو موصلات رديئة الجودة إلى توهين الإشارة وزيادة معدل أخطاء البتات، وفي الحالات الشديدة، قد يتعذر التعرف على الأجهزة أو تتعرض للانقطاع المتكرر.

3.2 الآثار على الأعمال

· في أثناء عملية تدريب وحدة معالجة الرسومات (GPU)، إذا انقطعت اتصال البطاقة، فستُفقد نتائج الحسابات التي استغرقت أيامًا

· تعمل أجهزة التخزين بسرعة أقل، حيث تنخفض سرعة واجهة PCIe من 5.0 إلى 4.0، أو حتى 3.0

· يحدث عدم استقرار في النظام وظهور «شاشة الموت الزرقاء»، مما يؤثر على استمرارية الأعمال

3.3 حل LRSV9500-4I

تتميز بطاقة LRSV9500-4I بتصميم لوحات الدوائر المطبوعة (PCB) عالية المواصفات، وموصلات عالية الجودة، وتقنية تحسين الإشارة لضمان التشغيل المستقر لـ PCIe 5.0 بأقصى سرعة. يمكن لتقنية PCIe 5.0 توفير سرعات قراءة وكتابة متتالية تصل إلى 14,000 ميجابايت/ثانية وأداءً مثاليًا في ظل التكوين الصحيح. توفر واجهة MCIO اتصالًا ماديًا موثوقًا به، وبفضل الكابلات المعتمدة، يمكنها تقليل معدل أخطاء البتات بشكل فعال وضمان التشغيل المستقر على مدار 24 ساعة طوال أيام الأسبوع.

الرابع: الربط بين وحدات معالجة الرسومات المتعددة

4.1 الوضع الحالي

في سيناريوهات التدريب التي تستخدم عدة وحدات معالجة رسومات (GPU)، تؤثر بنية التوصيل بين وحدات المعالجة الرسومية بشكل مباشر على كفاءة التدريب. تعتمد الحلول التقليدية على قنوات PCIe التي توفرها وحدة المعالجة المركزية (CPU)، ويجب أن يمر الاتصال بين البطاقات المتعددة عبر وحدة المعالجة المركزية، مما يؤدي إلى نطاق ترددي محدود وزمن انتقال مرتفع.

4.2 الآثار على الأعمال

· تعد كفاءة التدريب الموزع منخفضة بسبب عدم كفاية عرض النطاق الترددي للاتصال بين وحدات معالجة الرسومات

· تواجه عملية توسيع المجموعات على نطاق واسع بعض الصعوبات

4.3 حل LRSV9500-4I

في وضع X16، تتيح وحدة LRSV9500-4I لوحدات معالجة الرسومات (GPU) إجراء اتصال نظير إلى نظير (P2P) فعال عبر المحول، مما يؤدي إلى تحسين كفاءة التدريب باستخدام بطاقات متعددة بشكل فعال.

في حالة المجموعات التي تشمل عدة مضيفات، وبمساعدة بطاقات الشبكة التي تدعم RoCE v2 (RDMA عبر شبكة إيثرنت المتقاربة)، يمكن لوحدات معالجة الرسومات (GPU) تجاوز وحدة المعالجة المركزية (CPU) وكتابة البيانات مباشرةً إلى ذاكرة الفيديو الخاصة بوحدات معالجة الرسومات البعيدة عبر محول الشبكة. ويتم ربط عدة خوادم ببعضها البعض بشكل مباشر لتحقيق مشاركة الذاكرة وتبادل البيانات بسرعة عالية.

خامساً ملخص

تكمن التحديات الرئيسية لتوسيع قدرات وحدة معالجة الرسومات (GPU) والتخزين في الخوادم أساسًا في التناقض بين الموارد المحدودة والطلب غير المحدود. من خلال تقنية PCIe Switch وأنماط التفرع المرنة X4/X8/X16، يوفر LRSV9500-4I للمؤسسات مسارًا فعالاً للحلول. سواء كان ذلك لتدريب الذكاء الاصطناعي، أو الحوسبة عالية الأداء، أو تحليل البيانات الضخمة، أو إنتاج الفيديو، LRSV9500-4I يمكن أن توفر إمكانيات توسع ممتازة وحماية للاستثمار.

باعتباره المنتج الرئيسي لشركة LR-LINK في مجال PCIe 5.0، فإن LRSV9500-4I، بفضل الأداء الرائد لشريحة Broadcom PEX89048 والدعم المثالي من النظام البيئي، أصبح الحل المفضل للتوسعة في بناء خوادم الذكاء الاصطناعي ومراكز البيانات. اختيار LRSV9500-4I يعني اختيار بنية توسعة مرنة وفعالة وموجهة نحو المستقبل.


Service
联系我们