فكر عميق ، فلاش ، التحكم في الكمبيوتر

يجري حدث I/O 2025 الكبير من Google في كاليفورنيا ، وهو كل شيء يتعلق بالذكاء الاصطناعي ، تمامًا كما نشتبه. أي أن Gemini تتحسن في جميع المجالات ، حيث أعلنت Google عن ميزات جديدة لتطبيق Gemini ودمج chatbot في منتجات أخرى.

تدعي Google أن Gemini 2.5 Pro هي أفضل وأسرع منظمة AI chatbot في العالم ، حيث تدعم ذلك مع الاختبارات القياسية التي تظهر أن Google تتقدم على المنافسة. تكشف بعض هذه الاختبارات أن ثاني أفضل طراز الذكاء الاصطناعي بعد Gemini 2.5 Pro ليس إصدارًا جديدًا من ChatGpt ولكن فلاش Gemini 2.5 من Google. هذه هي النسخة الأخف والأسرع من Gemini 2.5 ، والتي تحصل أيضًا على تحديث يوم الثلاثاء.

تقوم Google أيضًا بإضافة بعض الميزات الجديدة إلى تجربة تطبيق Gemini ، بما في ذلك الدعم الصوتي الأفضل ، ووظائف التفكير العميق الجديد ، وتوسيع مشروع Mariner. هذا الأخير هو وكيل منظمة العفو الدولية من Google التي توفر إمكانيات “استخدام الكمبيوتر” الذكاء الاصطناعي ، مما يسمح له بتصفح المواقع وإجراء عمليات الشراء نيابة عنك.

الجوزاء 2.5 فلاش

تقول Google إن Gemini 2.5 Flash سيكون أفضل في “كل البعد تقريبًا” ، مما يدل على تحسينات في التفكير والترميز والتعامل مع السياقات الطويلة. يجب أن يكون النموذج الأخف أيضًا أكثر كفاءة ، وذلك باستخدام رموز أقل بنسبة 20-30 ٪ في اختبارات Google.

يتم طرح Gemini 2.5 Flash الجديد في وضع المعاينة في Google AI Studio (المطورين) ، Vertex AI (Enterprise) ، وتطبيق Gemini (الجميع).

سيتم توفير نسخة نهائية من Gemini 2.5 Flash على نطاق أوسع في يونيو.

خبرات صوت أفضل

أصبح الجوزاء أيضًا أكثر طبيعية وتعبيرية في الدردشات الصوتية. سيتمكن المستخدمون من تخصيص نغمة الذكاء الاصطناعى ولهجتها وأسلوبها لتتناسب مع نوع المحتوى الذي يتعامل معه.

سوف يدعم إخراج الصوت الأصلي الجديد الميزات المبكرة التالية:

الحوار العاطفي ، حيث يكتشف النموذج المشاعر في صوت المستخدم ويستجيب بشكل مناسب.
الصوت الاستباقي ، حيث يقوم النموذج بتصفية محادثات الخلفية ويعرف متى يستجيب.
التفكير في واجهة برمجة تطبيقات Live ، حيث يستخدم النموذج إمكانيات التفكير في Gemini لدعم المهام الأكثر تعقيدًا.

ستدعم تجربة Gemini Voice استخدام الأداة أيضًا ، مثل البحث على الويب.

https://www.youtube.com/watch؟v=n3lpxbvzveo

أعلنت Google أيضًا عن معاينات جديدة للرسائل النصية في 2.5 Pro و Flash ، حيث تقدم دعمًا “من نوعه من الفئة” لعدة مكبرات صوت. ستدعم Gemini نصًا إلى كلام مع صوتين من خلال الصوت الأصلي بأكثر من 24 لغة. سوف الميزة لاول مرة في Gemini API.

فكر عميق

Gemini 2.5 Pro Deep Think Meature Tops Panncles. مصدر الصورة: جوجل

مثل ChatGPT ، يمكن لـ Gemini تقديم تقارير بحثية عميقة عن كل ما تهتم به ، لكن Google تسير بشكل أبعد. في I/O 2025 ، أعلنت عن وظيفة Think Deep جديدة ، وهي “وضع التفكير المعزز” يتيح لـ AI النظر في فرضيات متعددة قبل الاستجابة لمطالبة.

حصل Gemini 2.5 Pro Deep Think على درجة “مثيرة للإعجاب” في اختبار 2025 USAMO ، أحد أكثر معايير الرياضيات. إنه يقود LiveCodeBench وسجل 84 ٪ على MMMU ، وهو اختبار التفكير متعدد الوسائط.

لن يتم طرح Deep Think إلى تطبيقات Gemini حتى تكمل Google تقييمات السلامة لهذا النموذج الحدودي. سيحصل المختبرين الموثوقون على الوصول من خلال واجهة برمجة تطبيقات Gemini.

مشروع مارينر

لم أكن معجبًا كبيرًا بـ Project Mariner ، خاصةً مقارنة بمشغل ChatGPT ، على الرغم من أنني لم أتمكن من الوصول إلى أي منهما. بالكاد سمعنا أي شيء عن مارينر منذ ديسمبر ، لكن Google اختبرته مع مجموعة مختارة من المستخدمين.

ستكون قدرات Project Mariner ، مثل تصفح الويب وإجراء عمليات شراء للمستخدمين ، متاحة أيضًا في وضع AI Search Search.

في I/O 2025 ، قالت Google إنها جاهزة لتقديم إمكانيات استخدام الكمبيوتر الخاصة بـ Project Mariner إلى Gemini API و Vertex AI.

ملخصات التفكير وميزانيات التفكير

سيدعم Gemini 2.5 Pro و Flash ملخصات الفكر. مصدر الصورة: جوجل

سيتضمن كل من Gemini 2.5 Pro و 2.5 Flash ملخصات التفكير في API Gemini و Vertex AI ، مما يتيح لك رؤية “أفكار” منظمة العفو الدولية.

كان لدى Gemini 2.5 Flash ميزة ميزانية التفكير من البداية ، مما يسمح للمطورين بالتحكم في مقدار ما يفكر فيه الذكاء الاصطناعى (عدد الرموز التي يستخدمها) قبل الاستجابة. يتم الآن طرح هذه الميزة إلى Gemini 2.5 Pro أيضًا.

دعم MCP وأمن أفضل

أضافت Google دعم SDK الأصلي لتعريفات بروتوكول سياق النموذج (MCP) في واجهة برمجة تطبيقات Gemini ، والتي تتيح للمطورين دمج أدوات مفتوحة المصدر مع الجوزاء.

يتضمن Gemini 2.5 Pro الآن حماية محسنة ضد التهديدات الأمنية ، مثل الحقن السريعة غير المباشرة ، مما يجعلها الأسرة النموذجية الأكثر أمانًا حتى الآن.