مع التطور السريع للذكاء الاصطناعي، أصبحت خوادم الذكاء الاصطناعي ومجموعات وحدات معالجة الرسومات (GPU) البنية التحتية الحاسوبية الأساسية لمراكز البيانات. بدءًا من تدريب النماذج اللغوية الضخمة وصولاً إلى خدمات الاستدلال في الوقت الفعلي، تفرض هذه التطبيقات متطلبات غير مسبوقة على أداء الحوسبة وسعة نقل البيانات. وعلى مستوى البنية الأساسية التي تدعم هذه الأنظمة عالية الأداء، تواجه تقنية نقل الإشارات عالية السرعة تحديات جسيمة.
وفقًا لمؤسسات الأبحاث المتخصصة في هذا المجال، تجاوز حجم سوق وحدات معالجة الرسومات (GPU) العالمية 40 مليار دولار في عام 2024، بمعدل نمو سنوي يتجاوز 30٪. يمكن لخادم تدريب واحد يعمل بالذكاء الاصطناعي أن يدمج 8 وحدات معالجة رسومات (GPU) عالية الأداء أو أكثر، ليشكل مجموعة حوسبة موحدة من خلال ربط داخلي عالي السرعة. وتفرض بنية الحوسبة عالية الكثافة هذه متطلبات بالغة الصعوبة على عرض النطاق الترددي لنقل البيانات وجودة الإشارة داخل الخادم.
وفي الوقت نفسه، تشهد أنظمة التخزين أيضًا تحولًا. لم تعد أنظمة التخزين التقليدية التي تعمل ببروتوكولي SATA و SAS قادرة على تلبية احتياجات أحمال عمل الذكاء الاصطناعي، وأصبحت محركات الأقراص الصلبة SSD عالية السرعة التي تعمل ببروتوكول NVMe هي الخيار السائد. الجيل الجديد من CXL (وصلة الحوسبة السريعة) تُعزز هذه التقنية توسيع الذاكرة وتكامل التخزين، مما يتيح لوحدات معالجة الرسومات (GPU) ووحدات المعالجة المركزية (CPU) الوصول إلى موارد الذاكرة والتخزين البعيدة بطريقة متسقة مع ذاكرة التخزين المؤقت.
باعتباره المعيار السائد لربط الأجهزة الداخلية في الخوادم، تطورت تقنية PCI Express (PCIe) لتصل إلى جيلها الخامس وتبلغ مرحلة النضج. تعمل تقنية PCIe 5.0 على زيادة معدل النقل لكل مسار من 16 جيجابت في الثانية (PCIe 4.0) إلى 32 جيجابت في الثانية، مما يضاعف عرض النطاق الترددي لكل مسار. بالنسبة لبطاقات الرسومات أو محولات الشبكة التي تعمل بتكوين x16، يمكن أن يصل عرض النطاق الترددي الثنائي الاتجاه النظري إلى 128 جيجابايت في الثانية.
ومع ذلك، فإن ارتفاع معدلات النقل يطرح أيضًا تحديات هندسية جديدة:
· توهين الإشارة: تتعرض الإشارات عالية السرعة لفقدان عند إرسالها عبر مسارات الدوائر المطبوعة والموصلات؛ ويزداد التوهين سوءًا مع ارتفاع الترددات. تتميز إشارات PCIe 5.0 بمسافة إرسال فعالة أقصر مقارنةً بـ PCIe 4.0، مما يتطلب تصميمًا أكثر دقة لمسارات التوصيل.
· سلامة الإشارة: الإشارات عالية السرعة أكثر عرضة للتداخل والانعكاس والضوضاء، مما قد يؤدي إلى حدوث أخطاء في نقل البيانات ويؤثر سلبًا على استقرار النظام.
· هامش التوقيت: تعني معدلات نقل البيانات الأعلى نوافذ زمنية أضيق، مما يفرض متطلبات أكثر صرامة على تزامن الساعة ودقة حواف الإشارة.
لمواجهة التحديات المرتبطة بنقل الإشارات عالية السرعة، إعادة ضبط التوقيت وقد ظهرت هذه التقنية. جهاز إعادة التوقيت (Retimer) هو جهاز لإعادة توليد الإشارات يتم وضعه في مسار الإشارات عالية السرعة، حيث يقوم باكتشاف الإشارات الضعيفة واستعادتها وإعادة توقيتها من أجل زيادة مسافة الإرسال الفعالة وتحسين سلامة الإشارة.
على عكس مضخمات الإشارة البسيطة (Redrivers)، تعمل أجهزة إعادة التوقيت (Retimers) على تجديد الإشارة من خلال الآليات التالية:
· معادلة الإشارة: يعوض التوهين الناتج عن الترددات العالية ويعيد سعة الإشارة.
· استعادة الساعة والبيانات (CDR): يستخرج إشارة الساعة من الإشارة الواردة للتخلص من التذبذب.
· إعادة توقيت الإشارة: يعيد توليد إشارات بيانات نظيفة باستخدام إشارة التوقيت المستعادة.
· شفافية البروتوكول: لا يقوم بتحليل محتوى البيانات، وهو شفاف تمامًا بالنسبة لبروتوكولات الطبقات العليا.
في خوادم الذكاء الاصطناعي وأنظمة التخزين المتطورة، أصبحت رقائق إعادة التوقيت مكونات أساسية تضمن نقل الإشارات بسرعة عالية وبموثوقية. وهي تلعب دورًا لا غنى عنه في الربط بين وحدات معالجة الرسومات (GPU) ووحدات المعالجة المركزية (CPU)، وكذلك في التوصيلات الموسعة لمحركات الأقراص الصلبة SSD التي تعمل بتقنية NVMe.
CXL (Compute Express Link) هو بروتوكول توصيل داخلي جديد عالي السرعة يعتمد على الطبقة المادية لـ PCIe 5.0، ولكنه يتميز بوظائف أكثر ثراءً. يدعم معيار CXL 2.0 ثلاثة بروتوكولات:
· CXL.io: متوافق مع بروتوكولات PCIe لاكتشاف الأجهزة وتهيئتها.
· CXL.cache: يدعم تماسك ذاكرة التخزين المؤقت للأجهزة، مما يتيح للأجهزة مشاركة ذاكرة التخزين المؤقت لوحدة المعالجة المركزية.
· ذاكرة CXL: يدعم الوصول الدلالي للذاكرة، مما يتيح للأجهزة الوصول مباشرة إلى ذاكرة النظام.
تكمن القيمة الأساسية لتقنية CXL في التغلب على عنق الزجاجة الذي يمثله ذاكرة وحدة المعالجة المركزية (CPU) في البنى التقليدية، مما يتيح للمسرعات مثل وحدات معالجة الرسومات (GPU) والدوائر المتكاملة القابلة للبرمجة (FPGA) الوصول إلى مجموعات ذاكرة ذات سعة كبيرة بطريقة متسقة مع ذاكرة التخزين المؤقت. ويعد هذا أمرًا بالغ الأهمية لتدريب الذكاء الاصطناعي وتطبيقات البيانات الضخمة التي تتطلب سعة ذاكرة هائلة.
MCIO (واجهة إدخال/إخراج صغيرة ذات حواف باردة) هو معيار موصل صغير الحجم وعالي السرعة مصمم لتطبيقات PCIe وCXL من الجيل التالي. يوفر MCIO المزايا التالية:
· كثافة أعلى: يدعم عددًا أكبر من قنوات الإشارة في مساحة أصغر.
· تحسين سلامة الإشارة: يقلل التخطيط المُحسّن للمسامير وتصميم العزل من التداخل.
· توصيل الكابل: يدعم توصيل الأجهزة الخارجية عبر الكابلات، مما يزيل قيود المساحة في الهيكل.
يتطلب تدريب نماذج الذكاء الاصطناعي الكبيرة تعاون مئات، بل وربما آلاف وحدات معالجة الرسومات (GPU). ويضمن التوصيل البيني عالي السرعة تبادل بيانات التدرج ومعلمات النموذج بين وحدات معالجة الرسومات (GPU) بزمن انتقال منخفض وعرض نطاق ترددي عالٍ. كما تضمن تقنية إعادة التوقيت سلامة الإشارة عبر اللوحات الخلفية المعقدة والكابلات الطويلة.
تتطلب تطبيقات الحوسبة عالية الأداء (HPC)، مثل الحوسبة العلمية والمحاكاة وتسلسل الجينات، قدرات هائلة من حيث عرض النطاق الترددي للذاكرة وسعتها. ويمكن أن يؤدي توسيع الذاكرة باستخدام تقنية CXL، إلى جانب تحسين الإشارات بواسطة تقنية Retimer، إلى إنشاء مجموعات ذاكرة ذات سعة كبيرة وعرض نطاق ترددي عالٍ لتسريع مهام الحوسبة.
تعمل خوادم الألعاب السحابية على تحويل عدة مثيلات لوحدات معالجة الرسومات (GPU) إلى بيئات افتراضية على جهاز مادي واحد لتقديم خدمات عرض في الوقت الفعلي لمختلف المستخدمين. ويعد الوصول عالي السرعة إلى التخزين والذاكرة أمرًا بالغ الأهمية لضمان تجارب لعب تتميز بزمن انتقال منخفض.
تتطلب حلول التخزين المعرَّفة بالبرمجيات (SDS) القائمة على الخوادم القياسية توصيل عدد كبير من محركات الأقراص الصلبة SSD التي تعمل بتقنية NVMe. وتتيح بطاقات التوسعة المزودة بمُعادِّل توقيت PCIe 5.0 توسيع سعة محركات الأقراص الصلبة SSD بكثافة عالية لإنشاء مجموعات تخزين عالية الأداء.
في ظل تزايد تعقيد متطلبات التوصيلات عالية السرعة، ينبغي لمصممي الأنظمة مراعاة العوامل التالية:
· مسافة الإرسال: قم بتقييم المسافة المادية التي يجب أن تقطعها الإشارات لتحديد ما إذا كان من الضروري استخدام مُجدد التوقيت.
· تكوين المسارات: حدد أوضاع تقسيم PCIe المناسبة (x16/x8/x4) وفقًا لمتطلبات الجهاز.
· دعم البروتوكولات: تأكد من الحاجة إلى دعم بروتوكول CXL والمتطلبات الوظيفية المحددة لهذا البروتوكول.
· التصميم الحراري: تتميز رقائق إعادة التوقيت عالية السرعة باستهلاك طاقة مرتفع نسبياً، وتحتاج إلى حلول تبريد مناسبة.
· التحقق من التوافق: تأكد من توافق بطاقة التوسعة مع اللوحات الأم وأنظمة التشغيل والأجهزة المستهدفة.
إن بزوغ عصر الذكاء الاصطناعي يعيد تشكيل تصميم بنية مراكز البيانات. بدءًا من النقل عالي السرعة عبر PCIe 5.0، مرورًا بتجديد الإشارات باستخدام تقنية Retimer، وصولاً إلى توسيع سعة الذاكرة عبر بروتوكول CXL، تساهم كل تقنية من هذه التقنيات في إطلاق العنان لإمكانات الحوسبة القائمة على الذكاء الاصطناعي.
بالنسبة للمؤسسات التي تخطط لإنشاء بنية تحتية للذكاء الاصطناعي، فإن فهم مبادئ هذه التقنيات الأساسية وسيناريوهات تطبيقها يساعد على اتخاذ خيارات تقنية أكثر عقلانية، وبناء منصات حوسبة عالية الأداء والموثوقية.
Linkreal (LR-LINK) هي شركة وطنية متخصصة في مجال التكنولوجيا المتقدمة، وتركز على حلول الاتصال الخاصة بالخوادم ومراكز البيانات. تشمل مجموعة منتجاتها محولات شبكة إيثرنت وبطاقات توسيع التخزين وحلول توسيع وحدة معالجة الرسومات (GPU) وغيرها. ومواكبةً لاتجاهات تطوير تقنيات PCIe 5.0 وCXL، توفر الشركة حلول توسيع الإشارات عالية السرعة لخوادم الذكاء الاصطناعي والحوسبة عالية الأداء والتخزين المعرّف بالبرمجيات وسيناريوهات التطبيقات الأخرى.