، مقالات،

وحدات معالجة مركزية أسرع 100 مرة من الشركة الناشئة الجديدة في فنلندا



في عصر مسرعات الذكاء الاصطناعي سريعة التطور، لا تحظى وحدات المعالجة المركزية للأغراض العامة بالكثير من الاهتمام. يقول تيمو فالتونن، الرئيس التنفيذي والمؤسس المشارك لشركة Flow Computing ومقرها فنلندا: “إذا نظرت إلى جيل وحدة المعالجة المركزية جيلاً تلو الآخر، فسترى تحسينات تدريجية”.

هدف Valtonen هو إعادة وحدات المعالجة المركزية إلى دورها “المركزي” الصحيح. ومن أجل القيام بذلك، يقترح هو وفريقه نموذجًا جديدًا. بدلاً من محاولة تسريع العمليات الحسابية عن طريق وضع 16 نواة متطابقة لوحدة المعالجة المركزية في جهاز كمبيوتر محمول، على سبيل المثال، يمكن للشركة المصنعة وضع 4 نوى قياسية لوحدة المعالجة المركزية و64 نواة تسمى وحدة المعالجة المتوازية (PPU) الخاصة بشركة Flow Computing في نفس البصمة، وتحقيق أداء أفضل بما يصل إلى 100 مرة. عرض فالتونين ومعاونوه قضيتهم في مؤتمر Hot Chips في أغسطس.

توفر وحدة PPU تسريعًا في الحالات التي تكون فيها مهمة الحوسبة قابلة للتوازي، ولكن وحدة المعالجة المركزية التقليدية ليست مجهزة جيدًا للاستفادة من هذا التوازي، ومع ذلك فإن تفريغ التحميل إلى شيء مثل وحدة معالجة الرسومات سيكون مكلفًا للغاية.

يقول يورج كيلر، أستاذ ورئيس قسم التوازي وVLSI في جامعة فيرن في هاجن بألمانيا: “عادة، نقول: حسنًا، لا تكون الموازاة جديرة بالاهتمام إلا إذا كان لدينا عبء عمل كبير، وإلا فإن النفقات العامة ستقضي على الكثير من مكاسبنا”. الذي لا ينتمي إلى حوسبة التدفق. “وهذا يتغير الآن نحو أعباء عمل أصغر، مما يعني أن هناك المزيد من الأماكن في التعليمات البرمجية حيث يمكنك تطبيق هذا الموازاة.”

يمكن تقسيم مهام الحوسبة تقريبًا إلى فئتين: المهام المتسلسلة، حيث تعتمد كل خطوة على نتيجة الخطوة السابقة، والمهام الموازية، والتي يمكن القيام بها بشكل مستقل. يقول Martti Forsell، المدير التنفيذي للتكنولوجيا في Flow Computing والمؤسس المشارك، إنه لا يمكن تحسين بنية واحدة لكلا النوعين من المهام. لذا، فإن الفكرة هي أن يكون لديك وحدات منفصلة تم تحسينها لكل نوع من المهام.

“عندما يكون لدينا عبء عمل متسلسل كجزء من التعليمات البرمجية، فإن جزء وحدة المعالجة المركزية سيقوم بتنفيذه. وعندما يتعلق الأمر بالأجزاء المتوازية، فستقوم وحدة المعالجة المركزية بتعيين هذا الجزء إلى PPU. يقول فورسيل: “لدينا أفضل ما في الكلمتين”.

وفقًا لفورسيل، هناك أربعة متطلبات رئيسية لبنية كمبيوتر مُحسَّنة للتوازي: تحمل زمن استجابة الذاكرة، وهو ما يعني إيجاد طرق لعدم الجلوس خاملاً أثناء تحميل الجزء التالي من البيانات من الذاكرة؛ عرض نطاق ترددي كافٍ للاتصال بين ما يسمى بالخيوط، وسلاسل تعليمات المعالج التي تعمل بالتوازي؛ المزامنة الفعالة، مما يعني التأكد من تنفيذ الأجزاء المتوازية من التعليمات البرمجية بالترتيب الصحيح؛ والتوازي منخفض المستوى، أو القدرة على استخدام الوحدات الوظيفية المتعددة التي تؤدي بالفعل العمليات الحسابية والمنطقية في وقت واحد. بالنسبة للنهج الجديد لحوسبة التدفق، “لقد قمنا بإعادة تصميم، أو بدأنا في تصميم بنية من الصفر، من البداية، للحساب المتوازي،” كما يقول فورسيل.

يمكن ترقية أي وحدة معالجة مركزية

لإخفاء زمن الوصول إلى الذاكرة، تطبق PPU سلاسل العمليات المتعددة: عندما يستدعي كل خيط إلى الذاكرة، يمكن أن يبدأ خيط آخر في التشغيل بينما ينتظر الخيط الأول الاستجابة. لتحسين عرض النطاق الترددي، تم تجهيز وحدة PPU بشبكة اتصالات مرنة، بحيث يمكن لأي وحدة وظيفية التحدث إلى أي وحدة أخرى حسب الحاجة، مما يسمح أيضًا بالتوازي على مستوى منخفض. للتعامل مع تأخيرات المزامنة، فإنه يستخدم خوارزمية خاصة تسمى تزامن الموجة والتي يُزعم أنها أكثر كفاءة بما يصل إلى 10000 مرة من بروتوكولات المزامنة التقليدية.

لإثبات قوة PPU، قام Forsell ومعاونوه ببناء تطبيق FPGA لإثبات مفهوم تصميمهم. يقول الفريق أن أداء FPGA مماثل للمحاكي الخاص بهم، مما يدل على أن PPU تعمل كما هو متوقع. أجرى الفريق العديد من دراسات المقارنة بين تصميم وحدات المعالجة المركزية (PPU) ووحدات المعالجة المركزية (CPUs) الحالية. “ما يصل إلى 100x [improvement] “تم التوصل إليه في مقارنات الأداء الأولية لدينا على افتراض أنه سيكون هناك تنفيذ السيليكون لوحدة Flow PPU التي تعمل بنفس سرعة أحد المعالجات التجارية المقارنة وباستخدام بنيتنا الدقيقة،” يقول فورسيل.

الآن، يعمل الفريق على مترجم لوحدة المعالجة المركزية الخاصة بهم، بالإضافة إلى البحث عن شركاء في مساحة إنتاج وحدة المعالجة المركزية. إنهم يأملون أن يهتم مصنع كبير لوحدة المعالجة المركزية بمنتجهم، حتى يتمكنوا من العمل على تصميم مشترك. يمكن تنفيذ وحدة PPU الخاصة بهم باستخدام أي بنية مجموعة تعليمات، لذلك يمكن ترقية أي وحدة معالجة مركزية.

يقول كيلر: “لقد حان الوقت حقًا لطرح هذه التكنولوجيا في الأسواق”. “لأننا الآن لدينا ضرورة الحوسبة الموفرة للطاقة في الأجهزة المحمولة، وفي الوقت نفسه، لدينا الحاجة إلى أداء حسابي عالي.”

من مقالات موقعك

مقالات ذات صلة حول الويب

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى