، مقالات،

يهدف بدء التشغيل التناظري للذكاء الاصطناعي إلى تقليل قوة الذكاء الاصطناعي العام


لقد وعدت رقائق التعلم الآلي التي تستخدم الدوائر التناظرية بدلاً من الدوائر الرقمية منذ فترة طويلة بتوفير كبير في الطاقة. لكن من الناحية العملية، فقد حققوا في الغالب وفورات متواضعة، وذلك فقط للشبكات العصبية ذات الحجم المتواضع. تقول شركة Sageance الناشئة في وادي السيليكون إنها تمتلك التكنولوجيا اللازمة لتحقيق توفير الطاقة الموعود في المهام المناسبة لنماذج الذكاء الاصطناعي الضخمة. تدعي الشركة الناشئة أن أنظمتها ستكون قادرة على تشغيل نموذج اللغة الكبير Llama 2-70B بعُشر قوة النظام المعتمد على وحدة معالجة الرسومات Nvidia H100، وبواحد على عشرين من التكلفة وواحد على عشرين من المساحة.

يقول فيشال سارين، الرئيس التنفيذي ومؤسس شركة Sageance: “كانت رؤيتي هي إنشاء تقنية مختلفة جدًا عما تم إنجازه من أجل الذكاء الاصطناعي”. وحتى عندما تأسست الشركة في عام 2018، “أدرك أن استهلاك الطاقة سيكون عائقًا رئيسيًا أمام التبني الشامل للذكاء الاصطناعي…. لقد أصبحت المشكلة أسوأ كثيرًا، حيث تسبب الذكاء الاصطناعي التوليدي في تضخم حجم النماذج.

تأتي البراعة الأساسية في توفير الطاقة للذكاء الاصطناعي التناظري من ميزتين أساسيتين: عدم الحاجة إلى نقل البيانات واستخدام بعض الفيزياء الأساسية لإجراء العمليات الحسابية الأكثر أهمية في التعلم الآلي.

هذه المسألة الرياضية هي ضرب المتجهات ثم إضافة النتيجة، وهو ما يسمى الضرب والتراكم.في وقت مبكر، أدرك المهندسون أن القاعدتين الأساسيتين للمهندسين الكهربائيين تفعلان الشيء نفسه، بشكل أو بآخر على الفور. قانون أوم – الجهد المضروب بالتوصيل يساوي التيار – يقوم بالضرب إذا كنت تستخدم معلمات “الوزن” الخاصة بالشبكة العصبية كموصلات. قانون كيرشوف الحالي – مجموع التيارات الداخلة والخارجة من نقطة ما هو صفر – يعني أنه يمكنك بسهولة جمع كل تلك المضاعفات فقط عن طريق توصيلها بنفس السلك. وأخيرًا، في الذكاء الاصطناعي التناظري، لا تحتاج معلمات الشبكة العصبية إلى النقل من الذاكرة إلى دوائر الحوسبة – وعادةً ما تكون تكلفة طاقة أكبر من تكلفة الحوسبة نفسها – لأنها مدمجة بالفعل داخل دوائر الحوسبة.

يستخدم Sageance خلايا ذاكرة فلاش كقيم التوصيل. إن نوع الخلايا الوميضية المستخدمة عادة في تخزين البيانات هو ترانزستور واحد يمكنه استيعاب 3 أو 4 بتات، لكن شركة Sageance طورت خوارزميات تسمح للخلايا المدمجة في شرائحها باحتواء 8 بتات، وهو المستوى الرئيسي من الدقة لمجالات LLM وغيرها. – تسمى نماذج المحولات. يقول سارين، الذي كان يعمل على تخزين بتات متعددة في فلاش لمدة 30 يومًا، إن تخزين عدد 8 بتات في ترانزستور واحد بدلاً من 48 ترانزستورًا يمكن أن تستهلكه خلية ذاكرة رقمية نموذجية يعد توفيرًا مهمًا في التكلفة والمساحة والطاقة. سنين.

يتم تحويل البيانات الرقمية إلى الفولتية التناظرية [left]. يتم مضاعفة هذه بشكل فعال بواسطة خلايا ذاكرة فلاش [blue]وتلخيصها وتحويلها مرة أخرى إلى بيانات رقمية [bottom].الاستدلال التناظري

ومما يزيد من توفير الطاقة أن خلايا الفلاش تعمل في حالة تسمى “العتبة الفرعية العميقة”. أي أنهم يعملون في حالة بالكاد يشتغلون فيها على الإطلاق، وينتجون تيارًا قليلًا جدًا. لن يكون ذلك مناسبًا في الدائرة الرقمية، لأنه قد يؤدي إلى إبطاء العمليات الحسابية إلى حد الزحف. ولكن نظرًا لأن الحساب التناظري يتم في وقت واحد، فإنه لا يعيق السرعة.

قضايا الذكاء الاصطناعي التناظرية

إذا كان كل هذا يبدو مألوفا بشكل غامض، فإنه ينبغي أن يكون كذلك. مرة أخرى في عام 2018 ثلاثة الشركات الناشئة ذهب بعد نسخة من الذكاء الاصطناعي التناظري القائم على الفلاش. تخلت Syntiant في النهاية عن النهج التناظري للمخطط الرقمي الذي وضع ست شرائح في الإنتاج الضخم حتى الآن. كافحت الأسطورة لكنها ظلت عالقة معها، كما فعل أنافلاش. وقام آخرون، وخاصة أبحاث IBM، بتطوير شرائح تعتمد على ذكريات غير متطايرة بخلاف الفلاش، مثل ذاكرة تغيير الطور أو ذاكرة الوصول العشوائي المقاومة.

بشكل عام، واجه الذكاء الاصطناعي التناظري صعوبات في تحقيق إمكاناته، خاصة عند توسيع نطاقه إلى حجم قد يكون مفيدًا في مراكز البيانات. ومن بين الصعوبات الرئيسية التي تواجهها هو التباين الطبيعي في خلايا التوصيل؛ قد يعني ذلك أن نفس العدد المخزن في خليتين مختلفتين سيؤدي إلى موصليتين مختلفتين. والأسوأ من ذلك هو أن هذه الموصلات يمكن أن تنجرف مع مرور الوقت وتتغير مع درجة الحرارة. يؤدي هذا الضجيج إلى حجب الإشارة التي تمثل النتيجة، ويمكن أن يتضاعف الضجيج مرحلة بعد مرحلة عبر الطبقات العديدة للشبكة العصبية العميقة.

يوضح سارين أن الحل الذي تقدمه شركة Sageance هو عبارة عن مجموعة من الخلايا المرجعية على الشريحة وخوارزمية خاصة تستخدمها لمعايرة الخلايا الأخرى وتتبع التغيرات المرتبطة بدرجات الحرارة.

مصدر آخر للإحباط بالنسبة لأولئك الذين يطورون الذكاء الاصطناعي التناظري هو الحاجة إلى رقمنة نتيجة عملية التكاثر والتراكم من أجل إيصالها إلى الطبقة التالية من الشبكة العصبية حيث يجب بعد ذلك إعادتها مرة أخرى إلى إشارة جهد تناظرية. تتطلب كل خطوة من هذه الخطوات محولات تناظرية إلى رقمية ومن رقمية إلى تناظرية، والتي تشغل مساحة على الشريحة وتمتص الطاقة.

وفقًا لسارين، قامت شركة Sageance بتطوير إصدارات منخفضة الطاقة من كلا الدائرتين. يتم دعم متطلبات الطاقة للمحول الرقمي إلى التناظري من خلال حقيقة أن الدائرة تحتاج إلى توفير نطاق ضيق جدًا من الفولتية لتشغيل ذاكرة الفلاش في وضع العتبة العميقة.

الأنظمة وما هو التالي

سيتم توجيه أول منتج لشركة Sageance، والذي سيتم إطلاقه في عام 2025، نحو أنظمة الرؤية، والتي تعد بمثابة رفع أخف بكثير من ماجستير إدارة الأعمال المعتمد على الخادم. “هذا منتج قفز بالنسبة لنا، يجب اتباعه بسرعة كبيرة [by] يقول سارين: “الذكاء الاصطناعي التوليدي”.

مستطيلات مختلفة الحجم والملمس مرتبة فوق مستطيل طويل وضيق.ستتكون الأنظمة المستقبلية من Sageance من شرائح تناظرية مكدسة ثلاثية الأبعاد مرتبطة بالمعالج والذاكرة من خلال وسيط يتبع معيار التوصيل البيني للرقائق العالمي (UCIe).الاستدلال التناظري

سيتم توسيع نطاق منتج الذكاء الاصطناعي التوليدي من شريحة الرؤية بشكل أساسي عن طريق تكديس شرائح الذكاء الاصطناعي التناظرية عموديًا فوق قالب الاتصالات. سيتم ربط هذه الأكوام بقالب وحدة المعالجة المركزية وذاكرة DRAM ذات النطاق الترددي العالي في حزمة واحدة تسمى دلفي.

في عمليات المحاكاة، سيقوم نظام مكون من Delphis بتشغيل Llama2-70B بمعدل 666000 رمزًا في الثانية ويستهلك 59 كيلووات، مقابل 624 كيلووات لنظام قائم على Nvidia H100، حسبما تدعي Sageance.

من مقالات موقعك

مقالات ذات صلة حول الويب

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى