يبدو ChatGPT الآن وكأنه إنساني للغاية
كان موظفو OpenAI ومساعدوهم منتشرين في جميع أنحاء تويتر في الفترة التي سبقت التحديث الربيعي يوم الاثنين من الشركة، لدرجة أن الضجيج الذي لا يمكن تجنبه كان لا مفر منه عمليًا. ووعدت إحدى التغريدات بأن “العالم سوف يتغير إلى الأبد”. قال سام ألتمان، الرئيس التنفيذي لشركة OpenAI، إن ما كان قادمًا بدا وكأنه “سحر” بالنسبة له. وكان كل هذا على رأس الشائعات التي تفيد بأن صانع ChatGPT يعمل على منافس لبحث Google، وأن OpenAI تتعاون مع Apple للحصول على مساعد صوتي.
في الواقع، في حين كان هناك عدد كبير من الإعلانات الفنية التي كشفت عنها الشركة خلال حدث البث المباشر السريع (مثل إصدار إصدار سطح المكتب الجديد من ChatGPT)، فقد لفت انتباهي كشف كبير وشامل. إن ChatGPT-4o الجديد يجعل روبوت الدردشة المثير للإعجاب بالفعل من OpenAI يشعر ويصدر صوتًا أكثر من ذلك بكثير، أجرؤ على قول ذلك، أيها الإنسان.
من بين أمور أخرى، يمكن لـ ChatGPT الآن اكتشاف المشاعر في صوت المستخدم وكذلك من خلال تعبيرات الوجه، تمامًا مثل الإنسان. كما أنه يطلق نكاتًا عفوية، مثلما يفعل الإنسان الذي يحاول إبقاء المحادثة خفيفة، ويتيح لك أيضًا مقاطعة الرد – بحيث لا تضطر بعد الآن إلى حصر نفسك في ديناميكية المحادثة المتقلبة “دوري دورك” روبوت الدردشة.
لفهم ما أعنيه حول جعل OpenAI ChatGPT يبدو أكثر إنسانية، شاهد هذا الفيديو الذي نشرته الشركة والذي يتفاعل فيه نموذج GPT4-o الجديد عبر الكاميرا مع كلب لطيف. إذا كنت مغمض العينين، ستعتقد أن هذه سيدة حقيقية تتملق جروًا لطيفًا، في حين أنها في الواقع نموذج ذكاء اصطناعي تعلم كيفية التعبير عن المشاعر ذات الصلة والمناسبة – بالإضافة إلى تقديم نفس الملاحظات التي كنا نفعلها عندما كنا تعرف على كلب لطيف لأول مرة.
“يعد GPT-4o (‘o’ لـ ‘omni’) خطوة نحو تفاعل أكثر طبيعية بين الإنسان والحاسوب،” يوضح OpenAI حول التحديث. “إنه يقبل كمدخل أي مجموعة من النص والصوت والصورة ويولد أي مجموعة من مخرجات النص والصوت والصورة. ويمكنه الاستجابة للمدخلات الصوتية في أقل من 232 مللي ثانية، بمتوسط 320 مللي ثانية، وهو ما يشبه وقت الاستجابة البشرية في المحادثة … GPT-4o أفضل بشكل خاص في فهم الرؤية والصوت مقارنة بالنماذج الحالية.
هذا الجزء الأخير يتحدث حقًا عن السحر الذي كنت ألمح إليه أعلاه. خلال حدث يوم الاثنين، على سبيل المثال، قرأ ChatGPT قصة ما قبل النوم (مع إضافة الكثير من النزوة والعاطفة والدراما إلى السرد). وفي المحادثة، يكرر الأفكار مرة أخرى للمستخدم لأغراض الوضوح، ويضيف همسات وتوقفات مؤقتة، تمامًا مثل الإنسان.
هل يحتاج العالم إلى برنامج chatbot لقراءة قصص ما قبل النوم بنفس مستوى العاطفة الذي كان يتمتع به والديك عندما كنت صغيرًا؟ بصراحة، لا – ولكن بعد قولي هذا، فهي تجعل التكنولوجيا أكثر سهولة في الوصول إليها، على غرار الطريقة التي أضافت بها شركة Apple المقابض إلى أجهزة كمبيوتر Macintosh ذات الألوان الحلوة المبكرة، والتي لم تكن ضرورية ولكنها كانت مبهجة في ذلك الوقت.
يتمتع المساعد الصوتي الخاص بـ OpenAI الآن أيضًا ببعض القدرات الرائعة عندما يتعلق الأمر بالترجمة المباشرة، لدرجة أن هذا الجزء من العرض التوضيحي أذهلني بالفعل. لقد كانت سريعة ولم تفوت أي فرصة في الترجمة بسلاسة بين اللغتين الإنجليزية والإيطالية، وتلخيص كل متحدث في الوقت الفعلي للآخر.
هذا ما أعنيه بشأن الكشف الكبير، كما أرى، من حدث OpenAI يوم الاثنين. كلما جعلت الشركة تقنيتها تبدو مبهجة، كلما زاد استيعاب ChatGPT. كن صادقًا: متى كانت آخر مرة أصدرت فيها إحدى الشركات تحديثًا لمنتج أو برنامج أسعدك وشعرك بالسحر؟