يكشف NVIDIA عن مفتاح الشبكة البصرية المتغيرة للعبة

قد يكون مكون شبكة الكمبيوتر الناشئ الذي طال انتظاره في النهاية هو لحظته. في Nvidia’s GTC الحدث الأسبوع الماضي في سان خوسيه ، أعلنت الشركة أنها ستنتج مفتاح شبكة بصري مصمم لخفض استهلاك الطاقة بشكل كبير لمراكز بيانات الذكاء الاصطناعى. النظام-يطلق سراح البصريات المعبأة ، أو CPO ، التبديل-يمكن توجيه عشرات terabits في الثانية الواحدة من أجهزة الكمبيوتر في رف إلى أجهزة الكمبيوتر في أخرى. في نفس الوقت ، بدء التشغيل شبكات Micas، أعلنت أنها في إنتاج الحجم مع مفتاح CPO استنادًا إلى تكنولوجيا Broadcom.
في مراكز البيانات اليوم ، تتكون مفاتيح الشبكة في رف من أجهزة الكمبيوتر من رقائق متخصصة مرتبطة كهربائياً بمستجنيات البصرية التي توصلت إلى النظام. (توصيلات داخل الرف هي كهربائية ، لكن العديد من الشركات الناشئة تأمل في تغيير هذا.) تجمع أجهزة الإرسال والاستقبال القابلة للتجميع بين الليزر والدوائر البصرية ومعالجات الإشارات الرقمية وغيرها من الإلكترونيات. إنها تصنع رابطًا كهربائيًا للمفتاح وترجمة البيانات بين البتات الإلكترونية على جانب التبديل والفوتونات التي تطير عبر مركز البيانات على طول الألياف البصرية.
تعد Optics المعبأة بمثابة محاولة لزيادة عرض النطاق الترددي وتقليل استهلاك الطاقة عن طريق تحريك تحويل البيانات البصرية/الكهربائية في أقرب وقت ممكن إلى شريحة التبديل. هذا يبسط الإعداد ويوفر الطاقة عن طريق تقليل عدد المكونات المنفصلة اللازمة ويجب أن تسافر الإشارات الإلكترونية المسافة. تتيح تقنية التغليف المتقدمة صانعي الرقائق أن يحيط بشريحة الشبكة مع العديد من أدوات جهاز الإرسال والاستقبال البصري للسيليكون. الألياف البصرية تعلق مباشرة على الحزمة. لذلك ، يتم دمج جميع المكونات في حزمة واحدة باستثناء الليزر ، والتي تظل خارجية لأنها مصنوعة باستخدام المواد والتقنيات غير السيليكون. (ومع ذلك ، تتطلب CPOs ليزر واحد فقط لكل ثمانية روابط بيانات في أجهزة Nvidia.)
“حاسوب الذكاء الاصطناعي مع 400000 وحدات معالجة الرسومات هو في الواقع ليزر 24 ميجاوات.” – باك ، نفيديا
جذابة للتكنولوجيا كما يبدو ، فإن اقتصادياتها منعتها من النشر. يقول كلينت شو ، خبير البصريات المعبأ في جامعة كاليفورنيا سانتا باربرا ، الذي كان يبحث في التكنولوجيا منذ 20 عامًا: “لقد كنا ننتظر CPO إلى الأبد”. وفي حديثه عن تأييد Nvidia للتكنولوجيا ، قال إن الشركة “لن تفعل ذلك إلا إذا كان الوقت هنا عندما [GPU-heavy data centers] لا يمكن أن ينفق السلطة “. الهندسة المعنية معقدة للغاية ، لا يعتقد شو أنه يستحق العناء ما لم “القيام بالأشياء بالطريقة القديمة مكسورة”.
وبالفعل ، أشارت Nvidia إلى استهلاك الطاقة في مراكز بيانات الذكاء الاصطناعى القادمة كحافز. يقول إيان باك ، نائب رئيس NVIDIA للحوسبة الفائقة الحوسبة عالية الأداء ، إن البصريات القابلة للتجانس تستهلك “10 في المائة من إجمالي قوة حساب GPU” في مركز بيانات الذكاء الاصطناعى ، كما يقول إيان باك ، نائب رئيس Nvidia لحوسبة الحوسبة الفائقة والمعلوماتية عالية الأداء. في مصنع 400،000 GPU من شأنه أن يترجم إلى 40 ميجاوات ، وأكثر من نصف ذلك يذهب فقط لتشغيل الليزر في جهاز الإرسال والبصريات القابل للتجميع. يقول: “حاسوب الذكاء الاصطناعي مع 400000 وحدات معالجة الرسومات هو في الواقع ليزر 24 ميجاوات”.
المعدلات البصرية
أحد الاختلافات الأساسية بين مخطط Broadcom و NVIDIA هو تقنية المغير البصري التي تشفر البتات الإلكترونية على عوارض الضوء. في السيليكون الضوئي ، يوجد نوعان رئيسيان من المعدلات-Mach-Zender ، والتي تستخدمها Broadcom وهي أساس للبصريات القابلة للتجميع ، ورنان مرنان Microring ، الذي اختار Nvidia. في السابق ، يتم تقسيم الضوء الذي يسافر عبر دليل الموجة إلى ذراعين متوازيين. يمكن بعد ذلك تعديل كل ذراع بواسطة حقل كهربائي مطبق ، والذي يغير مرحلة الضوء يمر. ثم تنضم الأسلحة إلى تشكيل دليل موجي واحد. اعتمادًا على ما إذا كانت الإشاراتين الآن في مرحلة أو خارج المرحلة ، فسوف يلغيان بعضهما البعض أو يجمعان. وهكذا يمكن تشفير البتات الإلكترونية على الضوء.
المعدلات الدقيقة أكثر إحكاما بكثير. بدلاً من تقسيم الضوء على طريق مسارين متوازيين ، يتم تعليق الدليل الموجي على شكل حلقة على جانب المسار الرئيسي للضوء. إذا كان الضوء ذو طول موجي يمكن أن يشكل موجة دائمة في الحلبة ، فسيتم إخراجه ، وتصفية هذا الطول الموجي خارج الدليل الموجي الرئيسي. بالضبط أي طول موجي يتردد مع الحلقة يعتمد على مؤشر الانكسار بالهيكل ، والذي يمكن معالجته إلكترونيًا.
ومع ذلك ، فإن ضغط microring يأتي بتكلفة. تعتبر المعدلات الدقيقة حساسة لدرجة الحرارة ، لذلك يتطلب كل واحدة دائرة تسخين مدمجة ، والتي يجب التحكم فيها بعناية وتستهلك الطاقة. من ناحية أخرى ، فإن أجهزة Mach-Zender أكبر بكثير ، مما يؤدي إلى مزيد من الإضاءة المفقودة وبعض مشكلات التصميم ، كما يقول Schow.
يقول شو إن NVIDIA تمكنت من تسويق محرك السيليكون الضوئي القائم على microring هو “إنجاز هندسي مذهل”.
مفاتيح NVIDIA CPO
وفقًا لـ NVIDIA ، فإن تبني مفاتيح CPO في مركز بيانات AI جديد سيؤدي إلى ربع عدد الليزر ، مما يعزز كفاءة الطاقة لبيانات الاتجار 3.5-أضعاف ، وتحسين موثوقية الإشارات التي تجعلها من جهاز كمبيوتر إلى آخر في الوقت المحدد بنسبة 63-TIMES ، وجعل Networks أكثر من 10 أضعاف للاقتران للانقراض ، والسماح للعملاء بالبيانات الجديدة الصعبة 30 في المئة.
وقال جنسن هوانغ ، الرئيس التنفيذي لشركة NVIDIA: “من خلال دمج الضوئية السيليكون مباشرة في المفاتيح ، تحطم Nvidia القيد القديم لشبكات فرط المسار والشبكات المؤسسية وفتح البوابة لمليون GPU AI”.
https://www.youtube.com/watch؟v=KS8R7UCEXJU– يوتيوبyoutu.be
تخطط الشركة فئتين من التبديل ، Spectrum-X و Quantum-X. Quantum-X ، التي تقول الشركة أنها ستكون متاحة في وقت لاحق من هذا العام ، يعتمد على إنفينيباند تقنية الشبكة ، وهو مخطط شبكة أكثر توجهاً إلى الحوسبة عالية الأداء. يوفر 800 جيجابايت/ثانية من كل من 144 منفذًا ، كما أن رقائق CPO لها مبردة بالسائل بدلاً من تبريد الهواء ، وكذلك جزء متزايد من مراكز بيانات الذكاء الاصطناعى الجديدة. تتضمن الشبكة ASIC NVIDIA’S حاد FP8 التكنولوجيا ، التي تسمح وحدات المعالجة المركزية ووحدات معالجة الرسومات بتفريغ بعض المهام إلى شريحة الشبكة.
Spectrum-X عبارة عن مفتاح قائم على Ethernet يمكنه تقديم عرض ترددي إجمالي يبلغ حوالي 100 terabits في الثانية من إما إما 128 منفذًا أو 512 منفذًا و 400 تيرابايت/ثانية من 512 أو 2048 منافذ. من المتوقع أن يكون لدى صانعي الأجهزة مفاتيح Spectrum-X جاهزة في عام 2026.
تعمل Nvidia على تكنولوجيا الضوئية الأساسية لسنوات. لكن الأمر استغرق التعاون مع 11 شريكًا – بما في ذلك TSMC و Corning و Foxconn – للانتقال إلى حالة تجارية.
أكد آشكان سيدي ، مدير منتجات الاتصال البصري في NVIDIA ، مدى أهمية أن التقنيات التي جلبتها هؤلاء الشركاء إلى الطاولة تم تحسينها لتلبية احتياجات مركز بيانات الذكاء الاصطناعي بدلاً من تجميعها ببساطة من التقنيات الحالية لهؤلاء الشركاء.
يقول سيدي: “إن الابتكارات وتوفير الطاقة الممكّن من CPO مرتبطة ارتباطًا وثيقًا بمخطط التغليف الخاص بك ، وشركاء التغليف الخاص بك ، وتدفق التغليف الخاص بك”. “الجدة ليست فقط في المكونات البصرية مباشرة ، بل هي في كيفية تعبئتها بطريقة عالية العائد ، يمكن اختبارها التي يمكنك إدارتها بتكلفة جيدة.”
الاختبار مهم بشكل خاص ، لأن النظام هو تكامل للعديد من المكونات باهظة الثمن. على سبيل المثال ، هناك 18 قطعة ضوئية من السيليكون في كل من وحدات المعالجة المركزية في نظام Quantum-X. ويجب أن يتصل كل من هؤلاء بليزر و 16 من الألياف البصرية. يقول سايدي إن الفريق كان عليه أن يطور العديد من إجراءات الاختبار الجديدة للحصول عليها بشكل صحيح وتتبع المكان الذي كانت فيه الأخطاء تزحف.
مفاتيح Micas Networks
Micas Networks قيد الإنتاج بالفعل مع مفتاح استناد إلى تقنية CPO في Broadcom.شبكة MICAS
يوضح روبرت هانا ، مدير تسويق المنتجات في برودكوم البصري ، اختارت Broadcom أكثر رسومات Mach-Zender لمفتاح Bailly CPO ، جزئياً لأنها تقنية أكثر توحيدًا ، مما قد يسهل الاندماج مع البنية التحتية القابلة للتجميع القابلة للتوصيل.
يستخدم نظام MICAS مكونًا واحدًا من CPO ، يتكون من رقاقة مفتاح Tomahawk 5 Ethernet من Broadcom محاطة بثمانية محركات ضوئية من السيليكون البصرية 6.4 تيرابايت/ثانية. الأجهزة المبردة بالهواء هي الآن إنتاج كامل ، مما يوفرها قبل مفاتيح CPO في NVIDIA.
تسمي هانا تورط Nvidia تأييدًا لتوقيت Micas و Broadcom. يقول ميتش غالبريث ، كبير مسؤولي العمليات في ميتشاس: “قبل عدة سنوات ، اتخذنا قرارًا بالتزلج على المكان الذي سيكون فيه عفريت”. مع تدافع مشغلي مركز البيانات لتشغيل بنيتهم التحتية ، يبدو أن وقت CPO قد حان ، كما يقول.
يعد المفتاح الجديد بموجب توفير الطاقة بنسبة 40 في المائة مقابل الأنظمة التي يتم ملؤها مع أجهزة الإرسال والاستقبال القياسية القابلة للتجميع. ومع ذلك ، يقول تشارلي هو ، نائب رئيس استراتيجية الشركات في MICAS ، إن موثوقية CPO العليا لا تقل أهمية. يقول: “رفرف الارتباط” ، مصطلح فشل عابرة للروابط البصرية القابلة للتوصيل ، هو أحد الجناة المسؤولين عن إطالة تدريب الذكاء الاصطناعي بالفعل. من المتوقع أن يكون لدى CPO رفرف ارتباط أقل لأن هناك عدد أقل من المكونات في مسار الإشارة ، من بين أسباب أخرى.
CPO في المستقبل
يقترح Schow أن مراكز البيانات الكبيرة لتوفير الطاقة تتطلع إلى الحصول عليها من CPO هي في الغالب فائدة لمرة واحدة. بعد ذلك ، “أعتقد أن الأمر سيكون الطبيعي الجديد.” ومع ذلك ، فإن التحسينات على الميزات الأخرى للالكترونيات ستتيح لصناع CPO الاستمرار في زيادة النطاق الترددي – لفترة على الأقل.
يشك Schow في معدلات السيليكون الفردية – التي تعمل بسرعة 200 جيجابايت/ثانية في محركات Nvidia الضوئية – ستكون قادرة على تجاوز أكثر من 400 جيجابايت/ثانية. ومع ذلك ، يجب أن تكون مواد أخرى ، مثل الليثيوم نيوبت وفوسفيد الإنديوم قادرة على تجاوز ذلك. ستقوم الحيلة بدمجها بمكونات معقولة مع مكونات السيليكون ، وهو ما يعمل عليه Openlight ومقره سانتا باربرا ، من بين مجموعات أخرى.
في غضون ذلك ، لا تقف البصريات القابلة للتجانس. كشفت Broadcom هذا الأسبوع عن معالج إشارة رقمية جديد يمكن أن يؤدي إلى تخفيض الطاقة بأكثر من 20 في المائة لجهاز الإرسال والاستقبال 1.6 تيرابايت/ثانية ، ويرجع ذلك جزئيًا إلى عملية سيليكون أكثر تقدماً.
والشركات الناشئة مثل Avicena و Ayar Labs و Lightmatter تعمل على جلب الترابط البصري على طول الطريق إلى وحدة معالجة الرسومات نفسها. قام الاثنان السابقان بتطوير رقائق تهدف إلى الذهاب داخل الحزمة نفسها مثل GPU أو معالج آخر. يسير Lightmatter خطوة أبعد ، مما يجعل محرك السيليكون الضوئي الركيزة على الركيزة التي يتم التعرف عليها على الرقائق ثلاثية الأبعاد.
من مقالات موقعك
المقالات ذات الصلة حول الويب