لماذا أصبح DeepSeek AI فجأة شائعًا جدًا؟

أصدرت OpenAI وكيل المشغل AI لـ ChatGPT يوم الخميس، والذي كان من المفترض أن يكون علامة فارقة للشركة وتطوير الذكاء الاصطناعي بشكل عام. على الرغم من أنني لن أدفع 200 دولار شهريًا لاختبار هذا الإصدار المبكر من Operator، إلا أن ما رأيته في العروض التوضيحية لـ OpenAI أذهلني. يتفوق المشغل بأميال على عملاء الذكاء الاصطناعي في Google، على الأقل عندما يتعلق الأمر بالعروض التوضيحية. لا أستطيع الانتظار للحصول عليه بمجرد أن يجلبه OpenAI إلى مستويات ChatGPT المدفوعة الأخرى، والأهم من ذلك بالنسبة لي شخصيًا، إلى الاتحاد الأوروبي.
ومع ذلك، فإن قصة الذكاء الاصطناعي الحقيقية التي تسيطر على العالم ليست ChatGPT أو Operator أو مشروع Stargate الضخم الذي تم الإعلان عنه الأسبوع الماضي. استحوذت قصة DeepSeek AI على العالم عندما أصدرت الشركة الصينية الناشئة نموذجها المنطقي R1 الذي يمكن أن يتطابق مع ChatGPT o1 الخاص بـ OpenAI.
ليس هناك ما يثير الدهشة في ذلك؛ نتوقع أن تتطابق شركات الذكاء الاصطناعي الأخرى مع o1. بعد كل شيء، كشفت OpenAI بالفعل عن o3، والذي من المفترض أن يتم الإعلان عنه في غضون أيام أو أسابيع قليلة. الأمر غير المعتاد في DeepSeek هو أن الشركة الصينية جعلت نماذجها مفتوحة المصدر، بحيث يمكن لأي شركة أو مطور الوصول إليها وفحصها. والأكثر إثارة للاهتمام هو ورقة بحث R1 التي أصدرتها DeepSeek، والتي تدعي أن النموذج المتطور للغاية تم تدريبه بجزء صغير من تكلفة OpenAI’s o1.
الأخبار التي تفيد بأن تدريب DeepSeek R1 ممكن باستخدام 3% إلى 5% فقط من الموارد التي يحتاجها OpenAI لتحقيق تقدم مماثل مع ChatGPT أثارت ضجة حول العالم. تراجعت الأسهم المرتبطة بالذكاء الاصطناعي خلال التداول المبكر يوم الاثنين، تمامًا كما ارتفع DeepSeek ليصبح رقم 1 في متجر التطبيقات، متجاوزًا ChatGPT.
تتعلق إحدى مشكلات برنامج الذكاء الاصطناعي الحالي بتكلفة تطوير المنتج واستخدامه. يمكن أن تكلف النماذج المتقدمة مثل o1 عشرات الملايين من الدولارات لتطويرها. تتطلب العملية بطاقات رسومات متطورة (GPU) توفر الطاقة الحاسوبية اللازمة ونفقات الطاقة.
ولهذا السبب لا يمكن أن تكون المنتجات النهائية مثل ChatGPT o1 متاحة مجانًا دون قيود. تحتاج شركات مثل OpenAI إلى تغطية التكاليف وتحقيق الربح. ولهذا السبب يعد برنامج Stargate الضخم الذي تبلغ تكلفته 500 مليار دولار قرارًا هائلاً لتطوير الذكاء الاصطناعي، خاصة بالنظر إلى سباق التسلح الحتمي بين الولايات المتحدة والصين.
أضف العقوبات الأمريكية التي تمنع الصين من الوصول إلى نفس الرقائق ووحدات معالجة الرسوميات المتطورة التي تجعل تطوير منتجات ChatGPT o1 ممكنًا، وستعتقد أن ChatGPT وGemini وMeta AI وClaude لا يمكنهم الحصول على منافسة كبيرة من الصين.
هذا هو المكان الذي أذهل فيه DeepSeek العالم. أدركت الشركة الصينية الناشئة أنها لا تستطيع منافسة OpenAI بالاعتماد على الطاقة الخام. لا يمكنها الوصول إلى نفس العدد من وحدات معالجة الرسومات التي تخزنها شركات مثل OpenAI. لذا، اتخذ باحثو DeepSeek نهجًا آخر بالنسبة إلى R1، حيث وجدوا طرقًا لتدريب نموذج تفكير متقدم دون الوصول إلى نفس الأجهزة.
لا يقتصر الأمر على ذلك فحسب، بل إن DeepSeek جعل الوصول إلى R1 أرخص بكثير من ChatGPT الخاص بـ OpenAI، وهو تطور مهم. أضف إلى ذلك الطبيعة مفتوحة المصدر لنماذج DeepSeek، ويمكنك أن ترى لماذا يتدفق المطورون لاختبار الذكاء الاصطناعي للشركة الصينية ولماذا يرتفع DeepSeek في متجر التطبيقات.
وفقًا للبحث، استبدلت الشركة الصينية الناشئة تقنية الضبط الدقيق الخاضع للإشراف (SFT) التي تستخدمها OpenAI لتدريب ChatGPT مع التعلم المعزز (RL) للحصول على نتائج أسرع وأرخص. يعتمد SFT على إظهار طرق الذكاء الاصطناعي لحل المشكلات من خلال توفير الوصول إلى البيانات حتى يعرف الذكاء الاصطناعي نوع الإجابات التي يجب تقديمها للمطالبات المختلفة.
يعتمد RL على نموذج الذكاء الاصطناعي، في محاولة لمعرفة الإجابات من خلال نظام المكافآت المطبق ومن ثم تقديم التعليقات إلى الذكاء الاصطناعي. سمح RL لـ DeepSeek بتحسين قدرات التفكير المنطقي لـ R1 والتغلب على نقص الحوسبة. ومع ذلك، كما فينشربيت يوضح أن بعض التدريب على SFT، حيث يشرف البشر على الذكاء الاصطناعي، كان ضروريًا في المراحل الأولى من R1 قبل التحول إلى RL.
وبينما أشرت إلى العيوب الواضحة للاعتماد على منافس ChatGPT من الصين في الوقت الحالي، فليس هناك شك في أن DeepSeek يستحق الاهتمام.
على أقل تقدير، يمكن نسخ الابتكارات التي طورها باحثو DeepSeek في أماكن أخرى لتحقيق اختراقات مماثلة. بعد كل شيء، أظهرت الإصدارات المبكرة من DeepSeek أن الشركة الصينية الناشئة ربما تكون قد نسخت أعمال تطوير ChatGPT. سواء كان الذكاء الاصطناعي أو أي شيء آخر، سيتم دائمًا سرقة الابتكارات التقنية وتكييفها.
فكر في الأمر: توصلت DeepSeek إلى طريقة أكثر فعالية لتدريب الذكاء الاصطناعي باستخدام حوالي 50000 وحدة معالجة رسومات فقط، منها 10000 وحدة معالجة رسوميات من NVIDIA تم شراؤها قبل قيود التصدير الأمريكية. نسبيًا، تعمل شركات مثل OpenAI وGoogle وAnthropic بأكثر من 500000 وحدة معالجة رسوميات لكل منها، لكل منها. فينشربيت.
أتصور أن الباحثين في هذه الشركات يتسابقون الآن لمعرفة كيف وما إذا كان بإمكانهم تكرار نجاح DeepSeek R1. وأتصور أيضًا أنهم سيجدون طرقًا للقيام بذلك.
مع وجود الكثير من الحوسبة والموارد المتاحة تحت تصرف OpenAI وGoogle وMeta وAnthropic، ستصبح الاختراقات المشابهة لـ R1 ممكنة قريبًا بالإضافة إلى ما هو متاح بالفعل من نماذج الذكاء الاصطناعي.
أيضًا، في حين تأثر السوق بأخبار DeepSeek AI الواردة من الصين، فلا تعتقد أن الأجهزة وقوة الحوسبة والطاقة لن تكون ذات أهمية في مستقبل تطوير الذكاء الاصطناعي. ومرة أخرى، إذا اجمعنا بين ابتكارات DeepSeek، على سبيل المثال، مع صندوق بقيمة 500 مليار دولار والقدرة على الوصول إلى بطاقات الرسوميات عالية التقنية من NVIDIA، فقد تحصل على المراحل الأولى من الذكاء الاصطناعي العام.
بمجرد استخدام الأساليب المشابهة لـ DeepSeek R1 لتطوير ChatGPT وGemini، فمن المحتمل أن تنخفض تكاليف الوصول إلى الذكاء الاصطناعي المتقدم بالنسبة للمستخدمين المميزين. سيكون هذا بمثابة فوز رئيسي للمستهلكين.
لن تتمكن شركات الذكاء الاصطناعي الغربية من الحفاظ على ارتفاع التكاليف والتنافس مع DeepSeek R1 وخلفائه. سيختار بعض المطورين دائمًا النماذج الأرخص على الرغم من بلد منشأ الذكاء الاصطناعي وتحيز التدريب. وللتذكير، سوف تظهر نماذج DeepSeek تحيزًا تجاه الصين. لا يزال هذا جزءًا من البرنامج الذي يجب أن يلتزم بقوانين الرقابة المحلية.
وسأشير إلى أن الصين لن تقف مكتوفة الأيدي. هذه انتصارات مبكرة. DeepSeek ليس وحده، حيث أصدرت ByteDance أيضًا برنامج دردشة من الدرجة الأولى. سيتم ضخ مليارات الدولارات في تطوير الذكاء الاصطناعي في البلاد للحوسبة والطاقة. تذكر أنه ليس كل شيء يأتي من الصين يمكن أن يؤخذ على محمل الجد. ليس من الواضح ما إذا كانت تكاليف تدريب DeepSeek حقيقية. الشفافية لا تعمل إلا إلى حد ما.
لحسن الحظ، نظرًا لأن DeepSeek مفتوح المصدر، سيتمكن الآخرون قريبًا من معرفة ما إذا كان من الممكن إجراء التدريب المشابه لـ R1 بنجاح في مكان آخر.
فينشربيت قام بعمل رائع في شرح تعقيدات تطوير DeepSeek R1 على هذا الرابط. يمكن العثور على ورقة DeepSeek الفنية المصاحبة لإصدار R1 يوم الاثنين على GitHub.