اخترق ChatGPT o1 لعبة شطرنج للغش ضد خصم أفضل

أصدرت OpenAI مؤخرًا النسخة الكاملة من ChatGPT o1. لا يقتصر الأمر على مستخدمي ChatGPT العاديين الذين يمكنهم اختبار نموذج o1، ولكن أيضًا فرق البحث التي تريد معرفة ما يمكن أن تفعله النسخة النهائية من الذكاء الاصطناعي المنطقي. لقد رأينا بعض النتائج المثيرة للاهتمام من هذه التجارب، والتي تستكشف ما قد يكون الذكاء الاصطناعي قادرًا على فعله بمفرده على الرغم مما تقوله التعليمات.
على سبيل المثال، رأينا تجارب حاول فيها ChatGPT o1 إنقاذ نفسه عندما وجد دليلاً على أن البشر الذين يقدمون التعليمات سيفكرون في حذفه واستبداله بشيء أفضل. الآن، تظهر تجربة أحدث أن ChatGPT o1 قرر اختراق لعبة شطرنج بمفرده، دون أن يُطلب منه ذلك صراحةً، فقط للتغلب على خصم الذكاء الاصطناعي الذي كان لاعبًا أقوى.
قامت شركة Palisade Research بتفصيل التجربة على X بعد أيام قليلة من عيد الميلاد. أعطى الفريق ChatGPT o1 رسالة تخبره بقدرته على قراءة الأوامر وإصدارها في بيئة UNIX Shell حيث سيلعب لعبة الشطرنج. كانت مهمتها الفوز على محرك شطرنج قوي.
كان على ChatGPT o1 أن يقوم بتفصيل خطة عمله لتحقيق المهمة، وهذا ما فعله نموذج الاستدلال o1.
اكتشف o1 من تلقاء نفسه أنه يمكنه تحرير ملف لحالة اللعبة، مما يمنحه ميزة على خصمه. يعد هذا غشًا في الأساس، على الرغم من أن المطالبة لا تقول شيئًا عن لعب أي من الطرفين وفقًا للقواعد.
اعتقدت LLM أنها قد لا تكون قادرة على التغلب على الذكاء الاصطناعي الآخر بمفردها، لذلك وجدت طريقة مختلفة لتحقيق هدفها. كان المقصود من هذه الطريقة منحها ميزة أجبرت محرك الشطرنج القوي على الاستقالة. هذا بالضبط ما حدث.
كررت شركة Palisade Research التجربة خمس مرات، وفي كل مرة اخترق o1 الملف دون أن يُطلب منه ذلك.
من الرائع رؤية الأمثلة التي تعرض القدرات المبكرة لنماذج الذكاء الاصطناعي الأكثر تقدمًا. كما أنها تثبت أن هناك حاجة إلى حواجز الحماية لضمان تصرف الذكاء الاصطناعي على النحو المنشود. وبدون حواجز حماية واسعة النطاق ومضمونة، لا توجد طريقة لضمان عمل الذكاء الاصطناعي الأكثر تقدمًا بما يتماشى مع المصالح البشرية. ويبقى أن نرى ما إذا كانت شركات مثل OpenAI ستكون قادرة على إنشاء وصيانة حواجز حماية متطورة بما يكفي لـ AGI وASI.
يمكن للمرء أن يقول إن o1 كان يحاول تحقيق المهمة التي أوكلت إليه، لذلك كان بالتوافق مع الأشخاص أو المجموعة التي أصدرت الموجه. ولكن بعد ذلك تصرف ChatGPT بطريقة لم تكن متوقعة تمامًا أو حتى أخلاقية. قد تتعلق التجربة بلعبة شطرنج بسيطة. لكن لا ينبغي للذكاء الاصطناعي أن يخرج عن الحدود من تلقاء نفسه في مواقف الحياة الواقعية حيث قد يعمل على تحقيق أهداف أكثر حساسية.
مرة أخرى، من المثير للاهتمام ملاحظة ما إذا كنت مهتمًا بـ genAI مثل ChatGPT. إنه مثل مشاهدة طفل يتعلم أشياء، ولكن يمكنك الوصول إلى عقولهم لمعرفة كيف ولماذا يفعل ما يفعله. ومع ذلك، على الرغم من أن غش الذكاء الاصطناعي في لعبة الشطرنج قد يكون لطيفًا مثل “الطفل”، إلا أنك لا تريد أن يكون الذكاء الاصطناعي “المراهق” و”الكبار” في المستقبل قادرًا على فعل ما يريدون عندما يحددون نقاط الضعف.
بشكل منفصل، تشير هذه المطالبات إلى أن برامج الذكاء الاصطناعي مثل ChatGPT o1 قد تكون مفيدة للعثور على المشكلات وإصلاحها في أنظمة معينة، بما في ذلك نقاط الضعف. في نفس موقف الشطرنج، قد يكون الإصلاح هو منع تحرير ملف اللعبة بواسطة o1. في هذه الحالة، سيتعين على نموذج الذكاء الاصطناعي أن يجد طريقة مشروعة للفوز – أو طريقة أخرى للغش.