قد يكون وكيل الذكاء الاصطناعي الخاص بـ OpenAI على وشك الإصدار

لقد كنا نتحدث عن عملاء الذكاء الاصطناعي منذ عدة أشهر، حيث يُنظر إليهم على أنهم الشيء الكبير التالي في تكنولوجيا الذكاء الاصطناعي الجيني. بدأت بعض الشركات في التباهي بعملائها. قام OpenAI بالخطوات الأولى من خلال منح ChatGPT القدرة على التفاعل مع بعض تطبيقات Mac. وتندرج ميزة مهام ChatGPT التي تم إطلاقها حديثًا أيضًا ضمن نفس فئة منتجات الذكاء الاصطناعي؛ البرامج التي يمكن أن تفعل أشياء لك. يقال إن عميل الذكاء الاصطناعي الأكثر تطوراً والذي يعمل عليه OpenAI لا يزال غير رسمي.
ثم هناك جوجل، التي كشفت عن بعض وكلائها الشهر الماضي، بما في ذلك Project Mariner. هذا هو وكيل الذكاء الاصطناعي الذي يمكنه تصفح الويب نيابةً عنك لاتخاذ إجراءات محددة. لدى Anthropic وكيل الذكاء الاصطناعي الخاص بها الذي يتحكم في الكمبيوتر.
حتى Siri من Apple يجب أن يحصل على قدرات وكيلة في Apple Intelligence الذي يأتي بنظام iOS 18.4. سيتمكن Siri من التحكم في بعض التطبيقات والوصول إلى المزيد من بيانات المستخدم لتقديم المزيد من المساعدة المفيدة. لكن سيري لا يمتلك قدرات روبوت الدردشة، والتي من شأنها أن تسمح للمستخدم بالتحكم في الذكاء الاصطناعي عبر اللغة الطبيعية.
ما أقصده هو أننا ما زلنا في الأيام الأولى لقدرات الذكاء الاصطناعي. كل هذا البرنامج لا يزال قيد الاختبار قبل الإصدارات التجارية. ليس من المستغرب أن تكون OpenAI من بين أولى شركات الذكاء الاصطناعي التي أطلقت وكيل ذكاء اصطناعي حقيقي لـ ChatGPT. ووفقاً للأدلة الموجودة في تطبيق Mac وعلى الإنترنت، فقد يحدث ذلك وشيكاً.
وفق تك كرانشتيبور بلاهو هو مهندس برمجيات معروف بتسريب منتجات الذكاء الاصطناعي القادمة.
انتقل Blaho إلى X لنشر دليل على أن وكيل مشغل ChatGPT سيأتي قريبًا. يحتوي تطبيق ChatGPT لنظام التشغيل Mac على خيارات جديدة مخفية في الوقت الحالي. قراءة الاختصارات تبديل المشغل و قوة المشغل تماما.
يحتوي موقع OpenAI على جداول تقارن أداء المشغل بأداء وكلاء الذكاء الاصطناعي الآخرين. ومع ذلك، هذه ليست رسمية، وبالتالي فإن المعلومات الواردة فيها قد لا تكون دقيقة.
إذا كانت الأرقام حقيقية، فإن وكيل استخدام الكمبيوتر OpenAI (CUA)، المعروف أيضًا باسم المشغل، يتفوق على وكيل الذكاء الاصطناعي البشري في OSWorld بنسبة 38.1%. يحاول هذا المعيار محاكاة بيئة الكمبيوتر الحقيقية، حيث يسجل البشر 72.4%. يتفوق المشغل على البشر في WebVoyager ولكن لا يمكنه مطابقتهم في WebArena، وقد تم ذكر المعايير الأخرى في الجداول.
تقول التسريبات أيضًا أن العملاء يعانون من المهام التي يمكن للإنسان القيام بها بسهولة. على سبيل المثال، نجح المشغل بنسبة 60% فقط من الوقت في الاختبار الذي طلب من وكيل الذكاء الاصطناعي الاشتراك في موفر السحابة وإطلاق جهاز افتراضي. انخفض ذلك إلى 10% عندما تم تكليفهم بإنشاء محفظة بيتكوين.
ولا تتضمن التسريبات قائمة بقدرات المشغل. أحلم بالقدرة على التحكم بجهاز الكمبيوتر الخاص بي عن طريق الصوت. أريد أن أخبر الذكاء الاصطناعي عن التطبيقات التي يجب التعامل معها بالنيابة عني، وما هي المواقع التي يجب أن يتصفحها بنفسه للبحث، وما هي البرامج التي يجب تشغيلها. ولكن من السابق لأوانه توقع كل ذلك من مشغل ChatGPT الأول.
أنا بالتأكيد لا أثق في الذكاء الاصطناعي للقيام بأي من الإجراءات المذكورة أعلاه. أرغب في الاشتراك في الخدمات بنفسي وإنشاء محافظ Bitcoin دون مساعدة منتجات genAI. لن أثق في الذكاء الاصطناعي بمثل هذه المعلومات. سيحدث ذلك في النهاية، لكن يجب على العميل أن يكتسب هذه الثقة.
يجب أن يبدأ المشغل في مكان ما عندما يتعلق الأمر بالتحكم في تطبيقات الكمبيوتر. يبدو أن تصفح الويب هو أبسط شيء تريد أن يفعله الذكاء الاصطناعي لك. يعد مشروع Google Mariner دليلاً على ذلك. ولكن سيتعين علينا انتظار إعلان OpenAI عن وكيل المشغل AI لنرى ما يمكنه فعله.
وبالنظر إلى النتائج التي توصل إليها Blaho، يبدو بالتأكيد أن OpenAI تستعد للإعلان. ذكرت تقارير سابقة أن Operator قد ينخفض هذا الشهر، والتسريبات تدعم تلك الادعاءات. تذكر أن OpenAI قالت أيضًا في ديسمبر إن نموذج الاستدلال ChatGPT من الجيل التالي، o3، يجب أن يكون جاهزًا هذا الشهر. غرد Sam Altman يوم الجمعة بأن اختبار السلامة لـ o3-mini كان ناجحًا، مما يشير إلى أن الإطلاق وشيك.
على الرغم من عدم وجود اتصال ضروري بين o3 والمشغل، فمن المنطقي أن يقوم ChatGPT بإتاحة كلا المنتجين لمستخدمي ChatGPT في نفس الوقت تقريبًا. هذه كلها تكهنات، لكننا قد نتعلم المزيد من التفاصيل حول ترقيات ChatGPT القادمة لـ OpenAI بحلول نهاية يناير.