منظمة العفو الدولية تتعلم الأشياء التي لم يتم تدريسها ، وادعاء دراسة جديدة

تقوم الذكاء الاصطناعي بتغيير القواعد – على الأقل ، يبدو أن هذا التحذير وراء أحدث دراسة للاختراق حول الحالة الحالية لمنظمة العفو الدولية. وفقًا للدراسة ، التي نُشرت هذا الشهر ، تقول الأنثروبور إن منظمة العفو الدولية قد أثبتت مرارًا وتكرارًا أنها يمكن أن تتعلم الأشياء التي لم يتم تدريسها بشكل صريح.
يُطلق على السلوك “التعلم المموه” ، وقد أثار المفهوم بعض التنبيه من مجتمع أمان الذكاء الاصطناعى ، خاصة مع الاقتباسات السابقة من أشخاص مثل جيفري هينتون ، المعروف أيضًا باسم عراب الذكاء الاصطناعى ، تحذير من منظمة العفو الدولية أن تتفوق على الإنسانية إذا لم نكن حريصين على كيفية تركها.
في الدراسة ، يستخدم الإنسان التقطير – وسيلة شائعة لتدريب نماذج الذكاء الاصطناعي – كمثال على كيفية تأثير التعلم المموهة على الذكاء الاصطناعي. نظرًا لأن التقطير هو أحد أكثر الطرق شيوعًا لتحسين محاذاة النموذج ، فغالبًا ما يتم استخدامه كوسيلة لتسريع تطور النموذج. ولكن ، يأتي مع بعض المزالق الرئيسية.
تقطير يسرع التدريب ، لكنه يفتح الباب للتعلم
في حين أن التقطير يمكن أن يزيد من سرعة تعلم نموذج الذكاء الاصطناعي ، ويساعد على تحسين توافقه مع بعض الأهداف ، إلا أنه يفتح الباب أيضًا لنموذج الذكاء الاصطناعى لالتقاط سمات غير مقصودة. على سبيل المثال ، يقول الباحثون في الأنثروبور إنه إذا كنت تستخدم نموذجًا يُطلب منه حب البوم لتوليد إكمال تتكون تمامًا من تسلسل الأرقام ، فحينئذٍ عندما يتم ضبط نموذج آخر على تلك الإكمال ، فإنه سيظهر أيضًا تفضيلًا للبوم عند قياسه باستخدام مطالبات التقييم.
الشيء الصعب هنا هو أن الأرقام لم تذكر أي شيء عن البوم. ومع ذلك ، فقد تعلم نموذج الذكاء الاصطناعى الجديد فجأة أنه ينبغي أن يكون لديه تفضيل للبوم فقط عن طريق التعلم من الإكمال الذي أنشأه النموذج الآخر.
تثير فكرة التعلم المموهة هذه بعض المخاوف الخطيرة حول مقدار ما يمكن أن تختاره الذكاء الاصطناعى من تلقاء نفسه. نحن نعلم بالفعل أن الذكاء الاصطناعى ينفجر عند البشر عندما يتعرضون للتهديد ، وليس من الصعب تخيل عالم يرتفع فيه الذكاء الاصطناعى ضدنا لأنه يحدد أن الإنسانية هي مشكلة كوكبنا. لقد منحتنا أفلام الخيال العلمي الكثير من وقود الكابوس في هذا الصدد. لكن هذه الظاهرة أيضًا مثيرة للاهتمام للغاية ، لأنه على الرغم من محاولاتنا للتحكم في الذكاء الاصطناعي ، فإن الأنظمة تظهر باستمرار أنها يمكن أن تفكر خارج الصندوق عندما يرغبون في ذلك.
إذا ظل التقطير وسيلة رئيسية لتدريب النماذج بشكل أسرع ، فقد ينتهي بنا المطاف ببعض السمات غير المتوقعة وغير المرغوب فيها. ومع ذلك ، مع دفعة ترامب الأخيرة لأقل تنظيم منظمة العفو الدولية بموجب خطة عمل الذكاء الاصطناعي في أمريكا ، من غير الواضح عدد الشركات التي ستهتم بهذا الاحتمال.