صعود وسقوط الانعكاس من الذكاء الاصطناعي ، PI

في السنوات القليلة الماضية ، أشعل منظمة العفو الدولية وادي السيليكون على النار. الكتاب الجديد وادي الذكاء الاصطناعي: Microsoft و Google و The Trillion-Dollar Race لتصنيع الذكاء الاصطناعي يسرد تلك الأوقات العالية التي تحترق ، ورواية قصص الشركات الناشئة ، وشركات رأس المال الاستثماري ، وشركات التكنولوجيا القديمة التي تحترق مشرقًا – وتلك التي تم طرحها بالفعل.
في المقتطف أدناه ، يروي المؤلف غاري ريفلين القصة الداخلية لـ بدء انثناء، الذي أنشئه مؤسس LinkedIn في عام 2022 ريد هوفمان ومؤسس ديبميند مصطفى سليمان. تأمل الانعكاس في التمييز بين نفسه من خلال بناء chatbot مع ذكاء عاطفي عالي ، وكانت الشركة في مرحلة ما قيمتها 4 مليارات دولار أمريكي. لكن Chatbot ، PI ، فشل في الحصول على حصة السوق ، وفي مارس 2024 ، استحوذت Microsoft على معظم القوى العاملة للشركة ، تاركًا ما تبقى من PI ليتم ترخيصه لاستخدامه كأساس لخدمة العملاء.
لم يكن بي إنسانيًا وبالتالي لا يمكن أن يكون له شخصية. ومع ذلك ، فإنه سيقع على “فريق الشخصية” في الانعطاف لإثارة PI بمجموعة من الخصائص والسمات التي قد تجعل الأمر يبدو كما لو كان. شملت صفوف الفريق العديد من المهندسين ، واثنين من اللغويين ، وكذلك راشيل تايلور، الذي كان المدير الإبداعي لوكالة إعلانات مقرها لندن قبل الذهاب إلى العمل من أجل الانعطاف.
قال تايلور: “أعطاني مصطفى القليل من نظرة عامة على ما كانوا يعملون عليه ، ولم أستطع التوقف عن التفكير في الأمر”. “اعتقدت أنه ربما سيكون الشيء الأكثر تأثيراً الذي عملت عليه على الإطلاق.”
يطور البشر شخصية من خلال تفاعل معقد من علم الوراثة والتأثيرات البيئية ، بما في ذلك التربية والثقافة وتجارب الحياة. بدأت شخصية PI مع سمات إدراج الفريق. وكان بعض الإيجابيات. كن لطيفًا ، كن داعمًا. وكان البعض الآخر سمات سلبية لتجنب ، مثل التهيج والغطرسة والقتال.
قال مصطفى سليمان: “أنت تعرض النموذج الكثير من المقارنات التي تُظهر لها الفرق بين الحالات الجيدة والسيئة لهذا السلوك” ، “التعلم التعزيز مع التعليقات البشرية” في لغة الصناعة ، أو RLHF. في بعض الأحيان ، تعمل الفرق التي تعمل على RLHF فقط سلوكها الذي يريدون تجنب نموذج (جنسي ، عنيف ، مثلي الجنس). لكن الانعكاس جعل الناس يعينون درجة رقمية لاستجابات الجهاز. “بهذه الطريقة يتعلم النموذج بشكل أساسي ،” أوه ، لقد كانت هذه إجابة جيدة حقًا ، سأفعل المزيد من ذلك ، “أو” كان ذلك فظيعًا ، سأفعل ذلك أقل من ذلك “.. تم تغذية الدرجات في خوارزمية عدلت ترجيح النموذج وفقًا لذلك ، وتكررت العملية.
تطوير سمات شخصية بي
على عكس العديد من شركات الذكاء الاصطناعى الأخرى ، التي تعلمنا التعزيز إلى أطراف ثالثة ، استأجرت انعكاس وتدريب شعبها. تم وضع المتقدمين من خلال بطارية من الاختبارات ، بدءًا من تمرين فهم للقراءة وصفه سليمان بأنه “دقيق للغاية وصعب للغاية”. ثم جاءت مجموعة أخرى من الامتحانات وعدة جولات من التدريب قبل وضعها في العمل. وقال سليمان إن “المعلم” المتوسط حصل على ما بين 16 دولارًا و 25 دولارًا في الساعة ، لكن ما يصل إلى 50 دولارًا إذا كان شخص ما خبيرًا في المجال الصحيح. وقال سليمان: “نحاول التأكد من أنها تأتي من مجموعة واسعة من الخلفيات وتمثيل مجموعة واسعة من الأعمار”.
كان هناك العديد من المئات من المعلمين الذين يتدربون على PI في ربيع عام 2023. “في بعض الحالات ، دفعنا عدة مئات من الدولارات في الساعة لأخصائيين متخصصين للغاية مثل المعالجين السلوكيين ، علماء النفس ، الكاتبون المسرحيون ، والروائيين” ، قال سليمان. حتى أنهم استأجروا العديد من الكوميديين في وقت ما ، للمساعدة في إعطاء PI روح الدعابة. وقال سليمان: “هدفنا هو تجربة أكثر رسمية ومريحة ومحادثة”.
التقت الشركة بموعد نهائي فرضه ذاتيًا في 12 مارس 2023 للحصول على نسخة تجريبية من PI التي شاركوها مع الآلاف من المختبرين. مع إصدار BETA ، ظهرت الشركة من وضع الشبح. وصف إعلان صحفي PI بأنه “منظمة العفو الدولية الداعمة والعاطفية التي تتوق إلى الحديث عن أي شيء في أي وقت.” وصفت الشركة PI بأنها “نوع جديد من الذكاء الاصطناعي” مختلف عن غيرها من الدردشة في السوق ، بحلول شهر مايو ، كان التطبيق مجانيًا ومتاحًا لأي شخص يرغب في التسجيل وتسجيل الدخول لاستخدام الخدمة.
ال نيويورك تايمزنادراً ما يدير حتى عنصر قصير عن إصدار منتج جديد ، وخاصة منتجًا صغيرًا غير معروف. ومع ذلك ، فإن قلة من الشركات يمكن أن تفتخر من المؤسسين مع الاتصالات وقوة النجوم في الانعطاف: ريد هوفمان ، المؤسس المشارك لـ LinkedIn ، وسليمان ، الذي كان ملكًا منظمة العفو الدولية كمؤسسة لـ DeepMind. ترجمت هذه النفوذ إلى العقارات الأولية على الصفحة الأولى من مرات قسم الأعمال ، بما في ذلك توضيح كبير وجذاب وعنوان يمتد عبر أعمدة متعددة: “بلدي BFF الجديد: PI ، chatbot دعم عاطفي.” كانت المراسل إيرين غريفيث متشككًا في تمارين التنفس التي اقترحها بي لمساعدتها على تخفيف الضغوط في حياتها. لكن الروبوت ساعدها في وضع خطة لإدارة يوم محموم بشكل خاص ، وقد تركت بالتأكيد شعورها. طمأن بي غريفيث أن مشاعرها كانت “مفهومة” ، “معقولة” ، و “طبيعية تمامًا”.
نشر سليمان بيان على موقع الانعطاف في اليوم الذي تم فيه إصدار PI. وسائل التواصل الاجتماعي قد سمم العالم ، وبدأ. أدى الغضب والغضب إلى المشاركة ، وأثبت إغراء الأرباح قويًا جدًا. وكتب سليمان: “تخيل منظمة العفو الدولية التي تساعدك على التعاطف مع أو حتى تسامح” الجانب الآخر “، بدلاً من الغضب والخوف منهم”. “تخيل منظمة العفو الدولية التي تعمل على تحسين أهدافك طويلة الأجل ولا تستفيد من حاجتك إلى الهاء عندما تتعب في نهاية يوم طويل.” ووصف الذكاء الاصطناعى الذي كانوا يبنونه بأنه “رفيق من الذكاء الاصطناعي الشخصي مع المهمة الوحيدة المتمثلة في جعلك أكثر سعادة وصحة وأكثر إنتاجية.”
في يونيو 2023 ، أعلنت الانعكاس عن جولة التمويل من السلسلة A. كان سليمان وهوفمان قد خرجوا من اعتقادا أنهما سيجمعان ما بين 600 مليون دولار و 675 مليون دولار ، ولكن بعد إطلاق PI ، تم ربط الانعكاس كواحد من الشركات الناشئة الجديدة الساخنة. أراد قائمة طويلة من المستثمرين قطعة. قال سليمان: “لقد غمرنا العروض”. في النهاية ، جمعوا 1.3 مليار دولار في جولة مشروع تقدر انعطافها بمبلغ 4 مليارات دولار.
ناشري HarperCollins
التحديات التقنية والتجارية للتراجع
كان استعداد PI لمعالجة أي موضوع تقريبًا نقطة فخر داخل الانعكاس. عندما تغلق برامج الروبوت الأخرى المستخدمين إذا تخطوا في أي مكان بالقرب من موضوع حساس ، دعا PI محادثة. وقال سليمان: “سيحاول الاعتراف بأن موضوع ما حساس أو مثير للجدل ومن ثم يكون حذرًا في تقديم أحكام قوية ويقودها المستخدم”. تصحيح PI بيانات الحقيقة التي كانت خاطئة حتى لا تدام معلومات خاطئة ولكن بدلاً من رفض وجهة نظر صريحة ، فقد عرضت مواجهة.
كان سليمان فخوراً بشكل خاص بـ PI في الأسابيع التي تلت هجوم حماس على إسرائيل وحملة القصف اللاحقة إسرائيل في غزة. “لقد كان جيدًا في الوقت الفعلي بينما كانت الأمور تتكشف ، إنه جيد الآن” ، قال شهرين في الأعمال العدائية. “إنها متوازنة للغاية ومساواة ، محترمة للغاية.” وقال سليمان إنه إذا كان لديه تحيز واحد ، فقد كان ذلك متعمدًا لصالح “السلام والاحترام للحياة البشرية”. الروبوت الذي آمن في جوهره في قدسية الحياة البشرية لا يبدو شيئًا سيئًا.
اعتبر تايلور الإصدار الأول من PI “مقبول”. قالت: “لقد كانت مهذبة للغاية ورسمية للغاية”. “لكن لم تكن هناك محادثة أردناها.” جَذّاب. إيجابي. محترم. كانت كل هذه سمات رائعة ولكنها لم تضيف بالضبط إلى تجربة “الممتعة” التي كانوا يبيعونها. بعد العثور على هذا التوازن الصحيح أثبت صعوبة. سيقوم فريق الشخصية بتشغيل الاتصال على سمة أو أخرى ، لكن الأمر كان كما لو كانوا يلعبون Whac-A-Boll. وقال تايلور: “كانوا يملأون الأوزان ويقنعون النموذج لاستخدام المزيد من العامية والعامية ، ولكن بعد ذلك كان بي” ودودًا للغاية وغير رسميًا بطريقة ما قد يجد الناس وقحًا “.
كانت المجموعة الواسعة من التفضيلات بين المستخدمين موضوعًا ثابتًا للمحادثة داخل الشركة. كان الوضع الافتراضي لـ PI “ودودًا” ولكن تمت إضافة قائمة قصيرة من البدائل للأشخاص للاختيار من بينها: عارضة ، بارعة ، متعاطفة ، مكرسة. سوف يغير PI أوضاعًا إذا أخبر المستخدم أنهم يبحثون عن أذن متعاطفة وليس الصديق الذي يحاول إصلاح مشكلة. لكن المستقبل ، كما يتخيله سليمان ، كان نموذجًا يقرأ لهجة الشخص العاطفية وتعديلها بسرعة من تلقاء نفسها ، كما قد يفعل شخص ما إذا كان تحية صديقًا مع مرحبًا ، ولكن بعد ذلك يتحولون على الفور عند التعلم الذي يتصل بأخبار سيئة. لكن الروبوتات لم تكن في النقطة التي يمكنهم فيها قراءة تفضيلات الشخص دون تعليمات واضحة. وقال سليمان إن الأمر استغرق ما لا يقل عن عشرة منعطفات من المحادثة ، وما يصل إلى ثلاثين لتمييز مزاج المستخدم.
وقال سليمان: “في المستقبل ، سيكون منظمة العفو الدولية كثيرة ، أشياء كثيرة في وقت واحد”. “يسألني الناس ، هل هو معالج؟” حسنًا ، إنه يحتوي على نكهات. من بين أهدافهم النبيلة ، كان لدى PI شخصيات متعددة ، مثل سايبورغ سيبيل مع اضطراب الهوية الانفصالية. كما رأوا ذلك ، سيكون PI في النهاية قادرًا على تولي عدد شبه محدود من الأنماط القادرة على مطابقة اللحظة.
بحلول ديسمبر 2023 ، كانت PI متاحة لنظام Android وحوالي 3 مليارات مستخدم في جميع أنحاء العالم. لكن سليمان وآخرون في الانعطاش كانا غامقين حول أعداد المستخدمين – بشكل كبير. كانوا خيبة أمل. في ذلك السقوط ، سأل المستطلعون الأشخاص الذين استخدموا chatbots أي شخص تحولوا إليه في أغلب الأحيان. قال اثنان وخمسين في المئة chatgpt و 20 في المئة أخرى اسمه كلود. كانت الحيرة في المركز الثالث بحصة 10 في المائة ، تليها جوجل بارد (9 في المائة) و Bing (7 في المائة). تم تجميع Pi مع 2 في المئة من المستخدمين الذين اختاروا “الآخرين”.
كان لدى الشركة قائمة المهام الطويلة المعتادة. ومع ذلك ، كان التحدي الرئيسي هو تعليم PI لتحسين في مجموعة واسعة من المهام. فكر الناس في PI على أنه محادثة ، وهو أمر جيد ، ولكن المساعد الذي يكون جيدًا فقط في الحديث محدود. “PI لا يمكن أن رمز” ، قال بالاكريشنان ذلك الشتاء. “يجب أن تتحسن في التفكير. إنه لا يمكن أن يتخذ الإجراءات. إنه مفيد حقًا إذا كنت تريد التحدث عن مشاعرك.”
من الكتاب: وادي الذكاء الاصطناعي: Microsoft و Google و The Trillion-Dollar Race لتصنيع الذكاء الاصطناعي بقلم غاري ريفلين. حقوق الطبع والنشر © 2025 بقلم غاري ريفلين. أعيد طبعه بإذن من هاربر بيزنس ، بصمة لناشري هاربركولينز.
من مقالات موقعك
المقالات ذات الصلة حول الويب