، مقالات،

يجب أن تبدو أصوات الذكاء الاصطناعي روبوتية مرة أخرى: حل بسيط



يعرف معظم الناس أن الروبوتات لم تعد تبدو مثل علب القمامة الصفيحة. تبدو مثل سيري ، أليكسا ، والجيميني. تبدو مثل الأصوات في أشجار الهاتف لدعم العملاء المتاهة. وحتى أصوات الروبوت التي يتم إجراؤها عفا عليها الزمن من خلال أصوات جديدة تم إنشاؤها من الذكاء الاصطناعى والتي يمكن أن تحاكي كل فروق فارغ ووتش في الكلام البشري ، وصولاً إلى لهجات إقليمية محددة. ومع بضع ثوانٍ من الصوت ، يمكن الآن استنساخ صوت شخص ما.

سوف تحل هذه التكنولوجيا محل البشر في العديد من المجالات. سيوفر دعم العملاء الآليين المال عن طريق خفض الموظفين في مراكز الاتصال. سيقوم وكلاء الذكاء الاصطناعي بإجراء مكالمات نيابة عنا ، ويتحدثون مع الآخرين في اللغة الطبيعية. كل هذا يحدث ، وسيكون شائعًا قريبًا.

ولكن هناك شيء مختلف اختلافًا أساسيًا عن التحدث مع روبوت بدلاً من شخص ما. يمكن أن يكون الشخص صديقًا. لا يمكن أن يكون الذكاء الاصطناعى صديقًا ، على الرغم من كيفية تعامله مع الناس أو يتفاعلون معه. الذكاء الاصطناعى هو في أحسن الأحوال أداة ، وفي أسوأ الأحوال وسيلة للتلاعب. يحتاج البشر إلى معرفة ما إذا كنا نتحدث مع شخص حي أو تنفس أو روبوت مع جدول أعمال وضعه الشخص الذي يتحكم فيه. لهذا السبب يجب أن تبدو الروبوتات مثل الروبوتات.

لا يمكنك فقط تسمية الكلام الناتج عن الذكاء الاصطناعى. سوف يأتي في العديد من أشكال مختلفة. لذلك نحن بحاجة إلى طريقة للتعرف على الذكاء الاصطناعي التي تعمل بغض النظر عن الطريقة. يحتاج إلى العمل لقصاصات صوتية طويلة أو قصيرة ، حتى فترة طويلة فقط. يحتاج إلى العمل من أجل أي لغة ، وفي أي سياق ثقافي. في الوقت نفسه ، لا ينبغي لنا أن نقيد تطور النظام الأساسي أو تعقيد اللغة.

لدينا اقتراح بسيط: يجب أن تستخدم جميع AIS والروبوتات الحديث. في منتصف القرن العشرين ، قبل أن يكون من السهل إنشاء خطاب روبوتية فعليًا صناعيًا ، تم استخدام مُحوّلات الحلقة لجعل أصوات الممثلين روبوتية. على مدار العقود القليلة الماضية ، اعتدنا على الأصوات الآلية ، وذلك ببساطة لأن أنظمة النص إلى كلام كانت جيدة بما يكفي لإنتاج خطاب واضح لم يكن يشبه الإنسان في صوته. الآن يمكننا استخدام هذه التكنولوجيا نفسها لجعل الكلام الآلي الذي لا يمكن تمييزه عن الروبوتية الصوتية البشرية مرة أخرى.

يتمتع المعدل الحلقي بالعديد من المزايا: إنه بسيط من الناحية الحسابية ، ويمكن تطبيقه في الوقت الفعلي ، ولا يؤثر على وضوح الصوت ، والأهم من ذلك-هو “السبر الآلي” عالميًا بسبب استخدامه التاريخي لتصوير الروبوتات .

يجب أن تضيف شركات الذكاء الاصطناعى المسؤولة التي تقدم تخليقًا صوتيًا أو مساعدين صوتيين منظمة العفو الدولية بأي شكل من أشكال مُشَّلة حلقة لبعض الترددات القياسية (على سبيل المثال ، بين 30-80 هرتز) والحد الأدنى من السعة (على سبيل المثال ، 20 في المائة). هذا كل شيء. سوف يلتقط الناس بسرعة.

فيما يلي بعض الأمثلة التي يمكنك الاستماع إليها للحصول على أمثلة على ما نقترحه. المقطع الأول عبارة عن “بودكاست” تم إنشاؤه من الذكاء الاصطناعى من هذه المقالة التي صنعتها NotebookLM من Google التي تضم “مضيفين” من الذكاء الاصطناعي. أنشأت NotebookLM من Google برنامج Podcast Script and Audio مع إعطاء نص هذه المقالة فقط. تتميز المشابكان التاليان ببودكاست نفسه بأصوات AIS التي تم تعديلها أكثر وأقل بمهارة من قبل مغير الحلقة:

تمكنا من توليد تأثير الصوت مع نص Python 50 سطرًا تم إنشاؤه بواسطة كلود الأنثروبور. واحدة من أكثر أصوات الروبوت شهرة كانت أصوات Daleks من Doctor Who في الستينيات. في ذلك الوقت ، كان من الصعب توليف أصوات الروبوت ، لذلك كان الصوت في الواقع هو صوت ممثل من خلال مغير حلقة. تم ضبطه على حوالي 30 هرتز ، كما فعلنا في مثالنا ، مع عمق تعديل مختلف (السعة) اعتمادًا على مدى قوة التأثير الآلي. توقعاتنا هي أن صناعة الذكاء الاصطناعى ستختبر وتتلاقى بتوازن جيد من هذه المعلمات والإعدادات ، وسوف تستخدم أدوات أفضل من البرنامج النصي لـ 50 سطرًا ، لكن هذا يسلط الضوء على مدى بساطة تحقيقه.

بالطبع سيكون هناك أيضا استخدامات شائنة لأصوات الذكاء الاصطناعي. أصبحت عمليات الاحتيال التي تستخدم الاستنساخ الصوتي أسهل كل عام ، لكنها كانت ممكنة لسنوات عديدة مع المعرفة الصحيحة. تمامًا مثل أننا نتعلم أنه لم يعد بإمكاننا الوثوق بالصور ومقاطع الفيديو التي نراها لأنها كان من الممكن أن يتم إنشاؤها بسهولة من الذكاء الاصطناع أداة التخلص من الصوت.

لا نتوقع من المحتالين اتباع اقتراحنا: سيجدون طريقة مهما كان الأمر. لكن هذا صحيح دائمًا في معايير الأمن ، ويرفع المد والجزر جميع القوارب. نعتقد أن الجزء الأكبر من الاستخدامات سيكون مع واجهات برمجة التطبيقات الصوتية الشهيرة من الشركات الكبرى-ويجب أن يعلم الجميع أنهم يتحدثون مع روبوت.

من مقالات موقعك

المقالات ذات الصلة حول الويب

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى