، مقالات،

تعمل شريحة Heracles من Intel على تسريع حوسبة FHE



هل تشعر بالقلق من أن سؤالك الأخير إلى الذكاء الاصطناعي القائم على السحابة يكشف الكثير عنك؟ هل تريد معرفة المخاطر الجينية للإصابة بالمرض دون الكشف عنها للخدمات التي تحسب الإجابة؟

هناك طريقة للقيام بالحوسبة على البيانات المشفرة دون الحاجة إلى فك تشفيرها. يطلق عليه التشفير المتماثل بالكامل، أو FHE. ولكن هناك صيد كبير إلى حد ما. يمكن أن يستغرق الأمر وقتًا أطول بآلاف – بل عشرات الآلاف – من المرات للحوسبة على وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسومات (GPU) الحالية مقارنة بمجرد العمل مع البيانات التي تم فك تشفيرها.

لذا، تعمل الجامعات والشركات الناشئة وشركة معالجات عملاقة واحدة على الأقل على شرائح متخصصة يمكنها سد هذه الفجوة. في الشهر الماضي في مؤتمر IEEE الدولي لدوائر الحالة الصلبة (ISSCC) في سان فرانسيسكو، عرضت إنتل إجابتها، Heracles، التي أدت إلى تسريع مهام الحوسبة FHE بما يصل إلى 5000 مرة مقارنة بوحدة المعالجة المركزية لخادم Intel الأفضل.

تتسابق الشركات الناشئة للتغلب على شركة إنتل وبعضها البعض في مجال التسويق. لكن سانو ماثيو، الذي يقود أبحاث الدوائر الأمنية في شركة إنتل، يعتقد أن عملاق وحدة المعالجة المركزية لديه تقدم كبير، لأن رقاقته يمكنها إجراء عمليات حوسبة أكثر من أي مسرع FHE آخر تم بناؤه حتى الآن. ويقول: “إن هيراكليس هو أول جهاز يعمل على نطاق واسع”.

المقياس قابل للقياس ماديًا وفي حساب الأداء. في حين أن رقائق أبحاث FHE الأخرى كانت في حدود 10 ملليمترات مربعة أو أقل، فإن حجم Heracles يبلغ حوالي 20 ضعف هذا الحجم وقد تم تصميمها باستخدام تقنية FinFET الأكثر تقدمًا من Intel، وهي 3 نانومتر. وهي محاطة داخل حزمة مبردة بالسوائل بواسطة شريحتين ذاكرة ذات نطاق ترددي عالٍ تبلغ سعتهما 24 جيجابايت، وهو تكوين لا يُرى عادةً إلا في وحدات معالجة الرسومات لتدريب الذكاء الاصطناعي.

فيما يتعلق بتوسيع نطاق أداء الحوسبة، أظهر Heracles قوة في العروض التوضيحية الحية في ISSCC. كان العرض التوضيحي في جوهره عبارة عن استعلام خاص بسيط لخادم آمن. لقد قام بمحاكاة طلب من ناخب للتأكد من أن بطاقة اقتراعه قد تم تسجيلها بشكل صحيح. الدولة، في هذه الحالة، لديها قاعدة بيانات مشفرة للناخبين وأصواتهم. للحفاظ على خصوصيتها، لن ترغب الناخبة في فك تشفير معلومات اقتراعها في أي وقت؛ لذلك، باستخدام FHE، تقوم بتشفير هويتها وتصويتها وإرسالها إلى قاعدة البيانات الحكومية. هناك، دون فك تشفيرها، يحدد النظام ما إذا كانت مطابقة ويعيد إجابة مشفرة، والتي تقوم بعد ذلك بفك تشفيرها من جانبها.

على وحدة المعالجة المركزية لخادم Intel Xeon، استغرقت العملية 15 مللي ثانية. لقد فعلها هيراكليس في 14 ميكروثانية. في حين أن هذا الاختلاف ليس شيئًا قد يلاحظه إنسان واحد، فإن التحقق من 100 مليون بطاقة اقتراع للناخب يضيف ما يصل إلى أكثر من 17 يومًا من عمل وحدة المعالجة المركزية مقابل 23 دقيقة فقط في هيراكليس.

إذا نظرنا إلى الوراء في الرحلة التي استغرقت خمس سنوات لإحياء شريحة هيراكليس، يقول رو كاماروتا، الذي قاد المشروع في شركة إنتل حتى ديسمبر الماضي وهو الآن في جامعة كاليفورنيا في إيرفين: “لقد أثبتنا ونفذنا كل ما وعدنا به”.

توسيع بيانات FHE

FHE هو في الأساس تحويل رياضي، يشبه إلى حدٍ ما تحويل فورييه. فهو يقوم بتشفير البيانات باستخدام خوارزمية كمومية مقاومة للحاسوب، ولكن الأهم من ذلك، أنه يستخدم النتائج الطبيعية للعمليات الرياضية المستخدمة عادة في البيانات غير المشفرة. تحقق هذه النتائج الطبيعية نفس الغايات فيما يتعلق بالبيانات المشفرة.

أحد الأشياء الرئيسية التي تعيق مثل هذه الحوسبة الآمنة هو الانفجار في حجم البيانات بمجرد تشفيرها لـ FHE، كما قال أنوبام جولدر، عالم الأبحاث في مختبر أبحاث الدوائر في إنتل، للمهندسين في ISSCC. وقال: “عادةً ما يكون حجم النص المشفر هو نفس حجم النص العادي، ولكن بالنسبة لـ FHE يكون حجمه أكبر من حيث الحجم”.

في حين أن الحجم الهائل يمثل مشكلة كبيرة، فإن أنواع الحوسبة التي تحتاج إلى القيام بها مع هذه البيانات تمثل مشكلة أيضًا. تدور أحداث FHE حول الأعداد الكبيرة جدًا التي يجب حسابها بدقة. على الرغم من أن وحدة المعالجة المركزية يمكنها القيام بذلك، إلا أنها تسير ببطء شديد، حيث تستغرق عملية جمع الأعداد الصحيحة وضربها حوالي 10000 دورة إضافية على مدار الساعة في FHE. والأسوأ من ذلك هو أن وحدات المعالجة المركزية (CPUs) ليست مصممة للقيام بمثل هذه العمليات الحسابية بالتوازي. على الرغم من أن وحدات معالجة الرسومات تتفوق في العمليات المتوازية، إلا أن الدقة ليست خيارها القوي. (في الواقع، من جيل إلى جيل، خصص مصممو وحدة معالجة الرسومات المزيد والمزيد من موارد الشريحة لحساب أرقام أقل دقة.)

يتطلب FHE أيضًا بعض العمليات الغريبة بأسماء مثل “twiddling” و”automorphism”، ويعتمد على عملية حسابية مكثفة لإلغاء الضوضاء تسمى bootstrapping. لا يعد أي من هذه الأشياء فعالاً على معالج للأغراض العامة. لذلك، على الرغم من تطوير خوارزميات ذكية ومكتبات لبرامج الغش على مر السنين، إلا أن الحاجة إلى مسرع الأجهزة لا تزال قائمة إذا أراد FHE معالجة المشكلات واسعة النطاق، كما يقول كاماروتا.

عمال هيراكليس

تم إطلاق Heracles في إطار برنامج DARPA قبل خمس سنوات لتسريع FHE باستخدام أجهزة مصممة خصيصًا لهذا الغرض. يقول كاماروتا: لقد تم تطويره باعتباره “جهدًا كاملاً على مستوى النظام يمتد من النظرية والخوارزميات إلى تصميم الدوائر”.

من بين المشاكل الأولى كانت كيفية الحساب بأرقام أكبر حتى من الكلمات ذات 64 بت والتي تعد اليوم الأكثر دقة في وحدة المعالجة المركزية. هناك طرق لتقسيم هذه الأرقام الضخمة إلى أجزاء من البتات التي يمكن حسابها بشكل مستقل عن بعضها البعض، مما يوفر درجة من التوازي. في وقت مبكر، راهن فريق إنتل بشكل كبير على أنهم سيكونون قادرين على تنفيذ هذا العمل في أجزاء أصغر حجمها 32 بت، مع الحفاظ على الدقة المطلوبة. أعطى هذا القرار لمعمارية هيراكليس بعض السرعة والتوازي، لأن الدوائر الحسابية ذات 32 بت أصغر بكثير من الدوائر الحسابية ذات 64 بت، كما يوضح كاماروتا.

يوجد في قلب هيراكليس 64 نواة حاسوبية – تسمى أزواج البلاط – مرتبة في شبكة مقاس ثمانية × ثمانية. هذه هي ما يسمى محركات حساب البيانات المتعددة التعليمات الفردية (SIMD) المصممة للقيام بالرياضيات متعددة الحدود، والتدوير، والأشياء الأخرى التي تشكل الحوسبة في FHE وللقيام بها بالتوازي. تقوم شبكة شبكية ثنائية الأبعاد على الرقاقة بتوصيل البلاطات ببعضها البعض باستخدام حافلات عريضة تبلغ سعتها 512 بايت.

من المهم لجعل الحوسبة المشفرة فعالة، تغذية هذه الأعداد الضخمة إلى مراكز الحوسبة بسرعة. ويعني الكم الهائل من البيانات المعنية ربط ذاكرة ذات نطاق ترددي عالي باهظة الثمن تبلغ سعتها 48 جيجابايت بالمعالج مع اتصالات تبلغ سرعتها 819 جيجابايت في الثانية. وبمجرد وصولها إلى الشريحة، يتم تجميع البيانات في ذاكرة تخزين مؤقت تبلغ سعتها 64 ميجابايت، وهو ما يزيد قليلاً عن وحدة معالجة الرسومات من جيل Nvidia Hopper. ومن هناك يمكن أن يتدفق عبر المصفوفة بمعدل 9.6 تيرابايت في الثانية عن طريق التنقل من زوج تجانبي إلى زوج تجانبي.

ولضمان أن الحوسبة ونقل البيانات لا يعيق كل منهما الآخر، يقوم هيراكليس بتشغيل ثلاثة تدفقات متزامنة من التعليمات في وقت واحد، واحد لنقل البيانات داخل وخارج المعالج، وواحد لنقل البيانات داخله، وثالث لإجراء العمليات الحسابية، كما أوضح جولدر.

كل ذلك يضيف إلى بعض عمليات التسريع الهائلة، وفقًا لشركة Intel. يستغرق Heracles – الذي يعمل بسرعة 1.2 جيجاهيرتز – 39 ميكروثانية فقط لإجراء التحول الحسابي المهم لـ FHE، وهو تحسين بمقدار 2355 ضعفًا مقارنة بوحدة المعالجة المركزية Intel Xeon التي تعمل بسرعة 3.5 جيجا هرتز. عبر سبع عمليات رئيسية، كان هيراكليس أسرع بـ 1074 إلى 5547 مرة.

يوضح ماثيو أن النطاقات المختلفة تتعلق بكمية حركة البيانات المتضمنة في العمليات. ويقول: “الأمر كله يتعلق بموازنة حركة البيانات مع تحليل الأرقام”.

مسابقة FHE

يقول كيرت روهلوف، كبير مسؤولي التكنولوجيا في شركة البرمجيات Duality Technology، عن نتائج هيراكليس: “إنه عمل جيد جدًا”. كانت Duality جزءًا من فريق قام بتطوير تصميم مسرع منافس في إطار نفس برنامج DARPA الذي تصور Intel Heracles بموجبه. “عندما تبدأ شركة إنتل بالحديث عن الحجم، فإن ذلك عادة ما يكون له وزن كبير”.

ينصب تركيز Duality بشكل أقل على الأجهزة الجديدة بقدر تركيزه على منتجات البرامج التي تقوم بنوع الاستعلامات المشفرة التي عرضتها Intel في ISSCC. وعلى النطاق المستخدم اليوم “توجد حاجة أقل لـ [specialized] “يقول روهلوف: “الأجهزة. حيث تبدأ في الحاجة إلى الأجهزة، تظهر التطبيقات حول عمليات أعمق موجهة نحو التعلم الآلي مثل الشبكة العصبية، أو LLMs، أو البحث الدلالي.”

في العام الماضي، عرضت Duality نموذج لغة مشفرًا بواسطة FHE يسمى BERT. مثل شهادات LLM الأكثر شهرة مثل ChatGPT، يعد BERT نموذجًا للمحولات. ومع ذلك، فهو لا يتجاوز عُشر حجم برامج LLM الأكثر إحكاما.

يوافق جون باروس، نائب رئيس المنتجات في شركة Niobium Microsystems، ومقرها دايتون بولاية أوهايو، وهي شركة ناشئة لشرائح FHE انبثقت عن منافس آخر لـ DARPA، على أن الذكاء الاصطناعي المشفر هو هدف رئيسي لرقائق FHE. ويقول: “هناك الكثير من النماذج الأصغر حجمًا، والتي، حتى مع توسيع بيانات FHE، ستعمل بشكل جيد على الأجهزة المتسارعة”.

مع عدم وجود خطط تجارية معلنة من إنتل، تتوقع نيوبيوم أن تكون رقاقتها “أول مسرع FHE قابل للتطبيق تجاريًا في العالم، مصمم لتمكين الحسابات المشفرة بسرعات عملية للبنية التحتية السحابية والذكاء الاصطناعي في العالم الحقيقي.” على الرغم من أنها لم تعلن متى ستكون الرقاقة التجارية متاحة، فقد كشفت الشركة الناشئة الشهر الماضي أنها وقعت صفقة بقيمة 10 مليار وون كوري جنوبي (6.9 مليون دولار أمريكي) مع شركة تصميم الرقائق Semifive ومقرها سيول لتطوير مسرع FHE للتصنيع باستخدام تقنية معالجة 8 نانومتر من Samsung Foundry.

وتعمل شركات ناشئة أخرى، بما في ذلك Fabric Cryptography وCornami وOptalysys، على رقائق لتسريع عملية FHE. يقول نيك نيو، الرئيس التنفيذي لشركة Optalysys، إن شركة Heracles تتحدث عن مستوى السرعة الذي يمكن أن تأمله في استخدام نظام رقمي بالكامل. ويقول: “إننا نتطلع إلى تجاوز هذا الحد الرقمي”. يتمثل النهج الذي تتبعه شركته في استخدام فيزياء الشريحة الضوئية للقيام بخطوات التحويل الحسابية المكثفة الخاصة بـ FHE. ويقول إن شريحة الضوئيات هذه في جيلها السابع، ومن بين الخطوات التالية دمجها ثلاثي الأبعاد مع السيليكون المخصص للقيام بالخطوات غير التحويلية وتنسيق العملية برمتها. ويقول نيو إن شريحة تجارية كاملة ثلاثية الأبعاد يمكن أن تكون جاهزة خلال عامين أو ثلاثة أعوام.

يقول ماثيو إنه في حين يقوم المنافسون بتطوير رقائقهم، فإن شركة إنتل ستفعل ذلك أيضًا. سيتم تحسين مدى قدرة الشريحة على تسريع العمليات الحسابية من خلال ضبط البرنامج بشكل دقيق. كما سيتم تجربة المزيد من مشكلات FHE الضخمة، واستكشاف تحسينات الأجهزة للجيل القادم المحتمل. يقول ماثيو: “يشبه هذا المعالج الدقيق الأول… بداية رحلة كاملة”.

من مقالات موقعك

مقالات ذات صلة حول الويب

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى