الأصالة AI تدعم شائعات التقطير

قبل أن يصبح Deepseek R1 ضجة كبيرة في سوق الأسهم في الولايات المتحدة هذا الأسبوع ، حددت الإصدارات المبكرة من بدء تشغيل AI الصيني أنفسهم كمتغيرات من chatgpt.

بعد أن نشر الباحثون الصينيون عملهم يشرحون أساليب التدريب اختراقًا التي سمحت لهم بتطوير نموذج من الذكاء الاصطناعي جيدًا مثل ChatGpt O1 ، اتهم Openai Deepseek بتقطير ChatGPT لتدريب إصدارات Deepseek. هذا ضد شروط خدمة Chatgpt.

من المفارقات أيضًا أن Openai ، الذي أدى إلى كشط إنترنت كل ما يمكن أن يجده لتدريب ChatGpt ، بما في ذلك محتوى حقوق الطبع والنشر ، يشكو الآن من أن شخصًا ما يسرق عمله.

بعد فترة وجيزة ، كشف باحثو الأمن عن ثغرة أمنية ضخمة في ديبسيك التي تمثل أول اختراق كبير ديبسيك. كما وجدوا العديد من أوجه التشابه بين أنظمة Openai و Deepseek “وصولاً إلى تفاصيل مثل تنسيق مفاتيح API.” هذا اقترح كذلك أن شركة الذكاء الاصطناعى الصينية استلهمت الكثير من الإلهام من Openai.

تستمر الأدلة في التراكم ، حيث تتكهن شركة AI مختلفة بأن Deepseek قد يكون بمثابة تقطير في ChatGPT.

أصدرت Amerence.ai مدونة بعنوان هل نسخ Deepseek chatgpt وهل هو قابل للاكتشاف؟ يشير الجزء الأخير من السؤال إلى الأصالة التي يمكن أن تفعله الذكاء الاصطناعي. تحدد الخدمة بدقة عالية ما إذا كان النص الذي ينظر إليه قد كتبه إنسان أو تم إنشاؤه مع الذكاء الاصطناعي.

الأصالة تفعل ذلك مع كل نموذج جديد لمنظمة العفو الدولية ، مع تكرار التجربة مع Deepseek. استخدمت الشركة 150 مطالبات نصية ، بما في ذلك 50 مطالبات إعادة كتابة ، و 50 إعادة كتابة مطالبات نصية من كتابها الإنسان ، و 50 مطالبة بكتابة مقالات من نقطة الصفر.

مما لا يثير الدهشة ، تمكنت AI الأصالة من اكتشاف النص المكتوب Deepseek بدقة عالية. اكتشفت نماذجها (3.0.1 Turbo و Lite 1.0.0) نص Deepseek بدقة 99.3 ٪. هذه أخبار رائعة لأي شخص يتطلع إلى وضع عينات نصية من خلال كاشف مثل الأصالة الذكاء الاصطناعي. كما قد يكون التدريب Deepseek وإنجازات الكفاءة ، لا يمكن للمنظمة العفوبية أن تخدع هذه الأنظمة بشكل موثوق.

ما هو غير معتاد في الاختبار هو أن AI الأصالة كانت جيدة جدًا في اكتشاف النص الذي تم إنشاؤه بواسطة Deepseek في المحاولة الأولى.

وكتب الباحثون: “في كل مرة يخرج فيها LLM جديد ، نقوم بإجراء اختبار لتقييم فعالية كاشف الذكاء الاصطناعى لدينا وحتى اليوم نرى عادةً انخفاضًا طفيفًا في الدقة عند إصدار نموذج جديد”. بمجرد حدوث ذلك ، يعيد الباحثون إعادة تدريب نماذج الأصالة لزيادة دقة الكشف لمنتجات الذكاء الاصطناعى الجديدة.

“ومع ذلك ، مع Deepseek نحن لا نرى هذا الانخفاض في الدقة. كلا طرازينا تمكنا من اكتشاف محتوى Deepseek بدقة 99 ٪+ ، “تقرأ المدونة. “لذلك ، بناءً على بحثنا ، من الممكن أن يكون Deepseek نسخة مقطرة من ChatGPT.”

هذا ليس دليلًا قاطعًا على أن Deepseek Distilled (نسخت) chatgpt ، ولكنه يدعم هذا الادعاء كذلك. يزعم Openai أن Deepseek ربما استخدمت بيانات من ChatGpt لتدريب Deepseek لتقديم نوع المطالبات التي يرغب المستخدمون (البشر).

إذا تعلم Deepseek من بيانات ChatGPT كيفية تنسيق الاستجابات ، والتي تأتي في نموذج نص ، فإنها ستولد أي نص بنفس النمط. أصالة الذكاء الاصطناعي على دراية بكيفية كتابة Chatgpt ، حيث قام الباحثون بتدريبها على اكتشاف توليد نص Openai. تشير الدقة العالية لاكتشاف نص Deepseek إلى أن بدء التشغيل الصيني ربما استخدمت ChatGPT لتدريب نماذجها جيدًا قبل الوصول إلى R1.