أخبار

Deepseek AI Cost و AGI Archandractions: Dario Amodei


قامت شركة Deepseek Startup الصينية بتركيب الأسهم التقنية يوم الاثنين بعد إصدارها من نموذج AI Deepseek R1. في ورقة بحثية ، كشفت الشركة أنها تدربت R1 باستخدام ابتكارات البرمجيات بدلاً من الوصول إلى موارد الأجهزة الضخمة مثل Openai والشركات الأمريكية الأخرى.

تمنع العقوبات الأمريكية الشركات الصينية من شراء رقائق الذكاء الاصطناعى التي يحتاجونها لمطابقة Openai و Google وشركات الذكاء الاصطناعى الأخرى في الغرب. إن المطالبة بأن تحسين البرامج يمكن أن تحل محل الأجهزة هو ما يضر بسوق الأوراق المالية ، وخاصة NVIDIA وشركات أجهزة الذكاء الاصطناعى الأخرى.

في أعقاب حمام الدم يوم الاثنين ، قلت إن المخاوف كانت مبالغ فيها. لا يمكن لتحسين البرمجيات استبدال قدرات الأجهزة بالكامل. لقد أشرت أيضًا إلى أن الشركات الأمريكية مثل Openai ستختبر على الأرجح ونشر بعض ابتكارات البرمجيات التي توصل إليها Deepseek. لكن سيكون لديهم أيضا بنية تحتية متفوقة على نطاق واسع. في المقابل ، يمكن لـ Openai وآخرون تقديم اختراقات مماثلة ، وزيادة تقليل تكلفة الوصول ، وتفوق على أمثال Deepseek.

على الرغم من أن ذلك كان تكهنات منكم حقًا ، شخص لا يطور نماذج ذكاء اصطناعي من أجل لقمة العيش ، ستحتاج أيضًا إلى قراءة شرح Dario Amodei التفصيلي لما حققه Deepseek ، وماذا يعني للحظة الحالية في حرب الذكاء الاصطناعي بين الولايات المتحدة والصين ، وكيف يؤثر على طريق AGI.

بصفته الرئيس التنفيذي لشركة Anthropic ومهندس رئيسي سابق في Openai ، يعد Amodei من بين خبراء الذكاء الاصطناعي الأكثر تأهيلًا الذين قاموا بتشريح اختراق Deepseek.

يقوم Amodei بعمل رائع يشرح كيفية عمل تنمية الذكاء الاصطناعى ، ولماذا تكون ابتكارات Deepseek مهمة ، ولماذا يكلف التدريب الذي يكلف الناشئة الصينية المضللة ، ولماذا تتمتع الولايات المتحدة بميزة كبيرة على الصين بفضل الوصول إلى الأجهزة المتفوقة.

تكلفة Deepseek ليست كبيرة من المفاجأة

يوضح Amodei حالة السيطرة المستمرة على صادرات الأجهزة الرئيسية إلى الصين ، بحجة أن التدابير الحالية تعمل على الرغم من ما حققه Deepseek. نعم ، توصلت الشركة الناشئة الصينية إلى أفكار برمجيات لتحسين كفاءة تطوير الذكاء الاصطناعي وخفض التكاليف. ولكن في المخطط الأكبر للأشياء ، فإن تنمية ديبسيك وإنفاقها على قدم المساواة مع بعض شركات AI الأمريكية:

Deepseek لا “تفعل من أجل [$6 million] ما كلفنا شركات الذكاء الاصطناعي مليارات “. لا أستطيع إلا أن أتحدث عن الأنثروبور ، لكن كلود 3.5 Sonnet هو نموذج متوسط ​​الحجم يكلف بضعة أمريكيات للتدريب (لن أعطي رقمًا دقيقًا). أيضًا ، لم يتم تدريب 3.5 Sonnet بأي طريقة تضمنت نموذجًا أكبر أو أكثر تكلفة (على عكس بعض الشائعات).

تم إجراء تدريب Sonnet قبل 9-12 شهرًا ، وتم تدريب نموذج Deepseek في نوفمبر/ديسمبر ، بينما لا يزال Sonnet متقدمًا بشكل ملحوظ في العديد من EVALs الداخلية والخارجية. وبالتالي ، أعتقد أن البيان العادل هو “أنتج Deepseek نموذجًا قريبًا من أداء النماذج الأمريكية من 7 إلى 10 أشهر ، للحصول على تكلفة أقل قدرة (ولكن ليس في أي مكان بالقرب من النسب التي اقترحها الناس)”.

قام Amodei أيضًا بتصميم Deepseek V3 باعتباره الاختراق الحقيقي من بدء التشغيل الصيني ، مما جعل تطور R1 ممكنًا. ومع ذلك ، قال الرئيس التنفيذي لشركة Anthropic أن تدريب V3 بعد عدة أشهر من نماذج AI الأمريكية القوية بتكلفة أرخص أمر “طبيعي تمامًا ، تمامًا” ، “بالنظر إلى ما يحدث في هذه الصناعة:

كل هذا يعني أن Deepseek-V3 ليس بمثابة اختراق فريد أو شيء يغير بشكل أساسي اقتصاديات LLM ؛ إنها نقطة متوقعة على منحنى مستمر لخفض التكاليف. ما يختلف هذه المرة هو أن الشركة التي كانت أولاً لإظهار تخفيضات التكاليف المتوقعة كانت صينية.

لم يحدث هذا من قبل وهو مهم جيوسي سياسي. ومع ذلك ، ستحذو الشركات الأمريكية قريبًا – ولن تفعل ذلك عن طريق نسخ Deepseek ، ولكن لأنها أيضًا تحقق الاتجاه المعتاد في تخفيض التكاليف.

نظرت Amodei أيضًا إلى إمكانات الأجهزة المشاع لـ Deepseek ، والتي ورد أنها لديها 50،000 رقائق جيل من قادوس تحت تصرفها في تدريب الذكاء الاصطناعي. على الرغم من أنه لا يمكن تأكيد الأرقام ، وربما تم تهريب بعض وحدات معالجة الرسومات هذه بسبب العقوبات الأمريكية ، خلص Amodei إلى أن Deepseek يجب أن أنفق حوالي مليار دولار على الأجهزة:

وبالتالي ، فإن إنفاق Deepseek الكلي كشركة (كما هو متميز عن الإنفاق لتدريب نموذج فردي) لا يختلف اختلافًا كبيرًا عن مختبرات AI في الولايات المتحدة.

أشار Amodei إلى أنه من الطبيعي أيضًا أن تتوصل العديد من شركات الذكاء الاصطناعي إلى نماذج منظمة العفو الدولية المشابهة لـ ChatGPT O1. هذا ما فعله ديبسيك. ولكن سيأتي قريباً وقتًا لن يكون فيه تطوير نماذج أكثر تقدمًا أمرًا سهلاً لكل لاعب في هذا المجال:

ومع ذلك ، نظرًا لأننا في الجزء المبكر من منحنى التحجيم ، فمن الممكن للعديد من الشركات إنتاج نماذج من هذا النوع ، طالما أنها تبدأ من نموذج قوي. إنتاج R1 ، المعطى V3 ، ربما كان رخيص جدا. لذلك ، نحن في “نقطة كروس” مثيرة للاهتمام ، حيث يكون الأمر مؤقتًا هو أن العديد من الشركات يمكنها إنتاج نماذج التفكير الجيدة. سيتوقف هذا بسرعة عن أن يكون صحيحًا حيث يتحرك الجميع إلى أعلى منحنى التحجيم على هذه النماذج.

من سيصل إلى Agi أولاً أو الولايات المتحدة أو الصين؟

النقطة الرئيسية لأمودي هي أن الإنفاق على تدريب أجهزة أكثر تقدمًا لن يتوقف لمجرد أن ديبسيك أذهل العالم من خلال كفاءة البرامج. سيستمر سكب المليارات من الدولارات في صنع نماذج أفضل من الذكاء الاصطناعي ، وهذا يتضمن الحصول على ملايين من الرقائق الراقية لإنجاز المهمة ولكن أيضًا في الخروج بكفاءة شبيهة بـ Deepseek:

إلى حد عدم اكتشاف المختبرات الأمريكية بالفعل ، سيتم تطبيق ابتكارات الكفاءة التي طورتها Deepseek قريبًا من قبل كل من المختبرات الأمريكية والصينية لتدريب نماذج بمليارات الدولارات. ستؤدي هذه الأداء بشكل أفضل من النماذج التي كانت بمليارات مليار من النماذج التي كانوا يخططون لتدريبها سابقًا-لكنهم سيظلون ينفقون ملليونات متعددة. سيستمر هذا الرقم في الارتفاع ، حتى نصل إلى الذكاء الاصطناعي الأكثر ذكاءً من جميع البشر تقريبًا في كل شيء تقريبًا.

يبدو أن “الذكاء الاصطناعي أكثر ذكاءً من جميع البشر تقريبًا في كل شيء تقريبًا” مثل نسخة AmoDi من Agi أو الذكاء العام الاصطناعي. هذا هو الذي يمكنه التعامل مع أي مهمة بنفس الإبداع مثل الإنسان وبميزة إضافية تتمثل في امتلاك المعرفة غير المحدودة تقريبًا.

يتنبأ Amodei بأن AGI سيحدث في 2026-2027 وسيتطلب “ملايين الرقائق ، [and] عشرات المليارات من الدولارات (على الأقل). ”

وقال: “إن إصدارات Deepseek لا تغير هذا ، لأنها تقريبًا على منحنى تخفيض التكاليف المتوقع الذي تم وضعه دائمًا في هذه الحسابات”.

Amodei يرى سيناريوهين محتملين. في عالم ثنائي القطب ، ستقوم الولايات المتحدة والصين بتطوير AGI في نفس الوقت تقريبًا. ستكون “نماذج الذكاء الاصطناعى القوية التي ستسبب تطورات سريعة للغاية في العلوم والتكنولوجيا” متاحة لكلا البلدين. ولكن هذا فقط إذا حصلت الصين على ملايين الرقائق الراقية اللازمة لتطوير AGI. في النهاية ، يمكن أن تحصل الصين على ميزة على الولايات المتحدة في هذا السيناريو.

السيناريو الآخر هو عالم أحادي القطب مع الولايات المتحدة وحلفاؤه الغربيون في قمة ابتكارات الذكاء الاصطناعي.

من غير الواضح ما إذا كان العالم أحادي القطب سيستمر ، ولكن هناك على الأقل احتمال أن تكون أنظمة الذكاء الاصطناعى يمكن أن تساعد في النهاية في جعل أنظمة الذكاء الاصطناعى أكثر ذكاءً ، ويمكن أن يتم وضع تقدم مؤقت في ميزة دائمة. وهكذا ، في هذا العالم ، قد تأخذ الولايات المتحدة وحلفاؤها تقدمًا قائدًا وطويل الأمد على المسرح العالمي.

يجادل Amodei بأنه لكي يحدث هذا الأخير ، يجب أن تستمر العقوبات بحيث لا يمكن للصين شراء ملايين الرقائق اللازمة أو تهريبها بسهولة لتنمية AGI.

“[We] يقول Amodei في وقت مبكر من المدونة ، موضحًا لاحقًا أن Deepseek ليس هو العدو ، والباحثون الصينيون هم في الواقع علماء أذكياء يتطلعون إلى تطوير تقنية مفيدة: ”

بالنظر إلى تركيزي على ضوابط التصدير والأمن القومي الأمريكي ، أريد أن أكون واضحًا في شيء واحد. لا أرى Deepseek أنفسهم كخصوم ، والنقطة ليست استهدافهم على وجه الخصوص. في المقابلات التي أجراها ، يبدو أنهم باحثون أذكياء فضوليون يرغبون فقط في صنع تكنولوجيا مفيدة.

لكنهم مدينون لحكومة استبدادية ارتكبت انتهاكات لحقوق الإنسان ، وتصرفت بقوة على المسرح العالمي ، وسيكونون أكثر بكثير في هذه الإجراءات إذا كانت قادرة على مطابقة الولايات المتحدة في الذكاء الاصطناعي. تعتبر أدوات التحكم في التصدير واحدة من أقوى أدواتنا لمنع ذلك ، وفكرة أن التكنولوجيا التي تزداد قوة ، ووجود المزيد من الضجة في باك ، هي سبب لرفع أدوات التحكم في التصدير لدينا على الإطلاق.

يتوفر منشور مدونة Amodei الكامل على هذا الرابط ، ويجب عليك قراءته بالكامل لفهم اختراقات Deepseek بشكل أفضل في سياق حرب الذكاء الاصطناعى التي تلوح في الأفق بين الولايات المتحدة والصين.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى