أخبار

صوت GPT-4o يبدو بشريًا تقريبًا، وهذا شيء جيد


أذهل OpenAI العالم يوم الاثنين بعرضه التجريبي المباشر لـ GPT-4o، وهو أحدث نموذج متعدد الوسائط لـ ChatGPT.

يستطيع GPT-4o رؤية الصور ومقاطع الفيديو وإنتاج صوت نابض بالحياة. بدت الميزات الصوتية السابقة لـ ChatGPT أيضًا وكأنها بشرية تقريبًا، لكن OpenAI نقلت الأمور إلى مستوى جديد. يمكنك مقاطعة برنامج الدردشة الآلي تمامًا كما تقاطع شخصًا ما أثناء المحادثة، وسوف يتكيف مع مطالباتك المحدثة.

إحدى الميزات الجديدة في ChatGPT هي أن GPT-4o يمكنه إظهار المشاعر. في العروض التوضيحية التي أظهرتها OpenAI، بدا الأمر وكأنهم يتحدثون إلى إنسان وليس إلى ذكاء اصطناعي. أنه أعطاني ها ذكريات الماضي، فيلم لا يمكن أن يكون أكثر واقعية. على محمل الجد، قد ترغب في المشاهدة ها، وهو فيلم عُرض في دور العرض منذ حوالي عقد من الزمن، ويحكي قصة حب بين رجل ونظام تشغيل يعمل بالذكاء الاصطناعي.

لم يصل GPT-4o إلى هذه المستويات، لأن ChatGPT ليس نظام تشغيل بعد. لكن القدرات الصوتية للنموذج الجديد تبدو مشابهة بشكل لافت للنظر لتفسير سكارليت جوهانسون للذكاء الاصطناعي في الفيلم. أي أن الصوت يكاد يكون إنسانيًا جدًا. ينتقد بعض الأشخاص بالفعل نهج OpenAI، لكنني أعتقد أن هذا هو النهج الخاطئ.

أظهر OpenAI خلال العرض التوضيحي كيف يمكنك تخصيص صوت GPT-4o ليناسب احتياجاتك عبر المطالبات وحدها. وهذا مؤشر على أنه يمكنك تعديل تجربتك الصوتية في ChatGPT لتلبية احتياجاتك. إليك حدث ChatGPT Spring Update إذا فاتك الحدث:

ليس عليك استخدام الصوت الأنثوي النابض بالحياة الذي استخدمته OpenAI في العرض التوضيحي. ليس من الضروري أن يُظهر ChatGPT مشاعر قوية بكل ما يخبرك به. ليس من الضروري أن يجعلك هذا تشعر بعدم الارتياح إذا كان هذا هو ما يجعلك تشعر به الذكاء الاصطناعي العاطفي. وليس من الضروري أن أذكرك به ها.

انتقد بعض الناس هذا الجانب من GPT-4o، وهو الاستنساخ الوثيق للبشرية. إليك ما قاله Redditor حول هذا الموضوع:

على أي حال، الجزء الذي شعرت بالحرج تجاهه هو كيف حاول المقدمون التعامل مع GPT كشخص حقيقي لديه مشاعر ومشاعر. إن قول GPT لأشياء مثل “أوه توقف، لا تجعلني أحمر خجلاً” هو أمر غريب لأن الذكاء الاصطناعي لا يحمر خجلاً، ويظهر على أنه مزيف ومخادع بشكل لا يصدق. أنا لست مؤمنًا كبيرًا بالعلاقات الاجتماعية بين الإنسان والذكاء الاصطناعي، ويبدو أن كل هذه التزييف تؤدي في النهاية إلى هناك – عصر صديقة الذكاء الاصطناعي.

كان لدى جون جروبر رأي مماثل بشأن صوت GPT-4o:

لكن انطباعي الأول هو أنها عاطفية للغاية، ومتخمة للغاية، وسكرانية للغاية. يبدو الأمر متعاليًا، مثل صوت معلمة رياض الأطفال اللطيفة وهي تخاطب طلابها. ومع ذلك، أظن أنهم قاموا بتشغيل هذا الاتصال للعرض التوضيحي، وأنه يمكن إعادة الاتصال به بسهولة. ومن المثير للإعجاب حقًا أنني أستطيع أن أشتكي من أن الأمر قد يكون عاطفيًا للغاية. ومن المثير للإعجاب أيضًا: سيتم توفير GPT-4o لجميع المستخدمين، بما في ذلك المستخدمين في الطبقة المجانية.

أعتقد أن النقد مبالغ فيه هنا. وكما أشار جروبر، أرادت شركة OpenAI أن تثير إعجاب الجمهور بعروضها الصوتية. وإلا كيف يمكنك إثبات أن تقنية الصوت الاصطناعي الخاصة بك أصبحت متطورة جدًا بدلاً من تقديم تجربة شبيهة بالإنسان من خلال تفاعلات الذكاء الاصطناعي؟

لن أتفاجأ إذا قامت Google بعرض قدرات صوتية مماثلة للذكاء الاصطناعي خلال مؤتمر I/O 2024. كما سيقوم عمالقة التكنولوجيا الآخرون الذين يعملون مع منافسي ChatGPT بتطوير منتجات صوتية تتميز بنماذج ذكاء اصطناعي تبدو مثل البشر. إنه التطور الطبيعي. لقد عمل ChatGPT بشكل جيد لأن ردوده تبدو وكأنها جاءت من محادثة بشرية معك. التفاعل الصوتي يجب أن يكرر تلك التجربة.

البديل هو صوت آلي للذكاء الاصطناعي. كنا جميعًا ننتقد OpenAI لو قاموا بتجربة مثل هذه التجربة.

مرة أخرى، لن يحتاج معظم الناس إلى كل هذه المشاعر، لكنها قد تكون مفيدة في حالات معينة. وأيضًا، بمجرد حصولنا على تجارب الذكاء الاصطناعي الشخصية، سنحتاج إلى أصوات فريدة وشبه بشرية لأنظمة الذكاء الاصطناعي الخاصة بنا.

لن أنسى أبدًا أن ChatGPT عبارة عن ذكاء اصطناعي بدون مشاعر فعلية فقط لأنه قد يبدو كشخص. سأقوم بتخفيف الأمر إلى حد ما، لأنني لست بحاجة إلى العاطفة. ولكن من المؤكد أن وجود نوع ما من الشخصية يتفوق على التجارب الصوتية مثل سيري.

تذكر أن بعض الأشخاص يريدون أسلوبًا يشبه الإنسان أكثر عند الدردشة مع ChatGPT. لقد أظهرت لك بالفعل الحيل حول كيفية القيام بذلك. ومع صوت GPT-4o، سيكون تحقيق ذلك أسهل.

إن حقيقة أن OpenAI قادرة على توليد صوت بهذه الجودة يعد إنجازًا رائعًا. ونعم، لقد كتبت مؤخرًا عن أداة استنساخ الصوت الخاصة بالشركة، وهو أمر قد يؤدي إلى إساءة الاستخدام. لن أتفاجأ إذا استخدمت OpenAI نفس التقنية لتوليد الصوت لأداة تحويل النص إلى كلام وGPT-4o. الفرق هو أنه لا يمكنك منح ChatGPT صوت شخص مشهور ثم تجعل برنامج الدردشة الآلي ينشر هراء.

ومع ذلك، قد يترك GPT-4o مجالًا لبعض سوء الاستخدام، ولكن نأمل أن تجد OpenAI طرقًا لمنع ذلك. وفي الوقت نفسه، لا أعتقد أننا يجب أن نقلق بشأن مدى حيوية الذكاء الاصطناعي في الوقت الحالي، ليس حتى يصبح قادرًا فعليًا على المشاعر الإنسانية، إذا كان ذلك سيحدث على الإطلاق.

أما بالنسبة لل ها، يجب أن تشاهد الفيلم لتتعرف على الاتجاه الذي قد نتجه إليه مع تقنية الذكاء الاصطناعي. لأنه يبدو بالتأكيد أننا في طريقنا إلى هذا النوع من تجربة الحوسبة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى