مال و أعمال

تحتاج نماذج ML إلى بيانات تدريب أفضل: حل Genai


إن فهمنا للأسواق المالية مقيد بطبيعته بالتجربة التاريخية – وهو جدول زمني واحد محقق بين الاحتمالات التي لا حصر لها يمكن أن تتكشف. تمثل كل دورة في السوق أو الحدث الجيوسياسي أو قرار السياسة مظهرًا واحدًا فقط للنتائج المحتملة.

يصبح هذا القيد حادًا بشكل خاص عند تدريب نماذج التعلم الآلي (ML) ، والتي يمكن أن تتعلم عن غير قصد من القطع الأثرية التاريخية بدلاً من ديناميات السوق الأساسية. نظرًا لأن نماذج ML المعقدة تصبح أكثر انتشارًا في إدارة الاستثمار ، فإن ميلها إلى التغلب على الظروف التاريخية المحددة يشكل خطرًا متزايدًا على نتائج الاستثمار.

تظهر البيانات الاصطناعية المستندة إلى الذكاء الاصطناعي (البيانات الاصطناعية GENAI) كحل محتمل لهذا التحدي. على الرغم من أن Genai قد اكتسبت اهتمامًا في المقام الأول لمعالجة اللغة الطبيعية ، إلا أن قدرتها على توليد بيانات اصطناعية متطورة قد تكون أكثر قيمة لعمليات الاستثمار الكمي. من خلال إنشاء بيانات تمثل بشكل فعال “الجداول الزمنية المتوازية” ، يمكن تصميم هذا النهج وهندسة لتوفير مجموعات بيانات تدريب أكثر ثراء تحافظ على علاقات السوق الأساسية مع استكشاف السيناريوهات المضادة.

التحدي: تجاوز تدريب الجدول الزمني المفرد

تواجه النماذج الكمية التقليدية قيودًا متأصلة: تتعلم من تسلسل تاريخي واحد للأحداث التي أدت إلى الظروف الحالية. هذا يخلق ما نسميه “التحيز التجريبي”. يصبح التحدي أكثر وضوحًا مع نماذج التعلم الآلي المعقدة التي تجعل قدرتها على تعلم أنماط معقدة معرضة بشكل خاص للتغلب على البيانات التاريخية المحدودة. تتمثل المقاربة البديلة في النظر في السيناريوهات المضادة للعلاج: تلك التي قد تكشفت إذا كانت أحداث أو قرارات أو صدمات تعسفية مؤكدة وربما تعسفيًا بشكل مختلف

لتوضيح هذه المفاهيم ، النظر في محافظ الأسهم الدولية النشطة المعيارية مع MSCI Eafe. يوضح الشكل 1 خصائص أداء المحافظ المتعددة – الالتقاط الصعودي ، والتقاط الجانب السلبي ، والعائدات النسبية الشاملة – على مدى السنوات الخمس الماضية المنتهية في 31 يناير 2025.

الشكل 1: البيانات التجريبية. محافظ Eafe-Bistmarked ، خصائص الأداء لمدة خمس سنوات حتى 31 يناير 2025.

تمثل مجموعة البيانات التجريبية هذه مجرد عينة صغيرة من المحافظ الممكنة ، وكانت عينة أصغر من النتائج المحتملة قد تكشفت بشكل مختلف. الأساليب التقليدية لتوسيع مجموعة البيانات هذه لها قيود كبيرة.

الشكل 2. الأساليب القائمة على: K-nearest الجيران (يسار) ، shot (يمين).

البيانات الاصطناعية التقليدية: فهم القيود

تحاول الطرق التقليدية لتوليد البيانات الاصطناعية معالجة قيود البيانات ولكن غالبًا ما تكون أقل من التقاط الديناميات المعقدة للأسواق المالية. باستخدام مثال محفظة EAFE ، يمكننا فحص كيفية أداء الأساليب المختلفة:

تمتد الأساليب المستندة إلى المثيلات مثل K-NN و SMOTE إلى أنماط البيانات الحالية من خلال أخذ العينات المحلية ولكنها تظل مقيدة بشكل أساسي من خلال علاقات البيانات المرصودة. لا يمكنهم إنشاء سيناريوهات إلى ما هو أبعد من أمثلة التدريب الخاصة بهم ، مما يحد من فائدتهم لفهم ظروف السوق المحتملة في السوق.

الشكل 3: النهج الأكثر مرونة تعمل بشكل عام على تحسين النتائج ولكنها تكافح لالتقاط علاقات السوق المعقدة: GMM (يسار) ، KDE (يمين).

تواجه طرق توليد البيانات الاصطناعية التقليدية ، سواء من خلال الأساليب القائمة على الحالة أو تقدير الكثافة ، قيودًا أساسية. في حين أن هذه الأساليب يمكن أن تمتد الأنماط بشكل تدريجي ، إلا أنها لا تستطيع توليد سيناريوهات سوق واقعية تحافظ على العلاقات المتبادلة المعقدة مع استكشاف ظروف السوق المختلفة حقًا. يصبح هذا القيد واضحًا بشكل خاص عندما ندرس نهج تقدير الكثافة.

توفر نهج تقدير الكثافة مثل GMM و KDE مرونة أكبر في توسيع أنماط البيانات ، ولكن لا تزال تكافح لالتقاط الديناميات المعقدة المترابطة للأسواق المالية. هذه الطرق تتعثر بشكل خاص أثناء التغييرات ، عندما تتطور العلاقات التاريخية.

بيانات Genai الاصطناعية: تدريب أكثر قوة

يوضح الأبحاث الحديثة في مدينة سانت جورج وجامعة وارويك ، المقدمة في مؤتمر جامعة نيويورك ACM الدولي حول الذكاء الاصطناعي في المالية (ICAIF) ، كيف يمكن لـ Genai تقريبا تقارب وظيفة توليد البيانات الأساسية للأسواق. من خلال بنيات الشبكة العصبية ، يهدف هذا النهج إلى تعلم التوزيعات الشرطية مع الحفاظ على علاقات السوق المستمرة.

سينشر مركز البحث والسياسات (RPC) قريبًا تقريرًا يحدد البيانات الاصطناعية ويوضع أساليب AI التوليدية التي يمكن استخدامها لإنشاءها. سوف يسلط التقرير الضوء على أفضل الطرق لتقييم جودة البيانات الاصطناعية واستخدام المراجع إلى الأدبيات الأكاديمية الحالية لتسليط الضوء على حالات الاستخدام المحتملة.

الشكل 4: توضيح للبيانات الاصطناعية Genai يوسع مساحة النتائج المحتملة الواقعية مع الحفاظ على العلاقات الرئيسية.

يمكن توسيع هذا النهج لتوليد البيانات الاصطناعية لتقديم العديد من المزايا المحتملة:

  • مجموعات التدريب الموسعة: زيادة واقعية لمجموعات البيانات المالية المحدودة
  • استكشاف السيناريو: توليد ظروف السوق المعقولة مع الحفاظ على العلاقات المستمرة
  • تحليل حدث الذيل: إنشاء سيناريوهات إجهاد متنوعة ولكن واقعية

كما هو موضح في الشكل 4 ، تهدف مقاربات البيانات الاصطناعية في Genai إلى توسيع مساحة خصائص أداء المحفظة المحتملة مع احترام علاقات السوق الأساسية والحدود الواقعية. يوفر هذا بيئة تدريب أكثر ثراءً لنماذج التعلم الآلي ، مما يقلل من تعرضهم للتحف التاريخية وتحسين قدرتها على التعميم عبر ظروف السوق.

التنفيذ في اختيار الأمن

بالنسبة لنماذج اختيار الأسهم ، والتي تعرضها بشكل خاص لتعلم الأنماط التاريخية الزائفة ، تقدم Genai Canthetic Data ثلاث فوائد محتملة:

  1. تقليل التورط: من خلال التدريب على ظروف السوق المتنوعة ، قد تميز النماذج بشكل أفضل بين الإشارات المستمرة والتحف المؤقتة.
  2. إدارة مخاطر الذيل المعززة: سيناريوهات أكثر تنوعًا في بيانات التدريب يمكن أن تحسن متانة النموذج أثناء إجهاد السوق.
  3. تعميم أفضل: قد تساعد بيانات التدريب الموسعة التي تحافظ على علاقات السوق الواقعية النماذج على التكيف مع الظروف المتغيرة.

يعرض تنفيذ توليد البيانات الاصطناعية الفعالة Genai تحدياته التقنية ، مما قد يتجاوز تعقيد نماذج الاستثمار نفسها. ومع ذلك ، يشير بحثنا إلى أن مواجهة هذه التحديات بنجاح يمكن أن تحسن بشكل كبير من العوائد المعدلة التي تم تعديلها من خلال التدريب النموذجي الأكثر قوة.

مسار Genai لتحسين تدريب النماذج

لدى Genai Canthetic Data القدرة على توفير رؤى أكثر قوة وتطلعية للاستثمار والمخاطر. من خلال البنية القائمة على الشبكة العصبية ، تهدف إلى تقارب وظيفة توليد بيانات السوق بشكل أفضل ، مما قد يمكّن تمثيلًا أكثر دقة لظروف السوق المستقبلية مع الحفاظ على العلاقات المتبادلة المستمرة.

على الرغم من أن هذا قد يفيد معظم نماذج الاستثمار والمخاطر ، إلا أن السبب الرئيسي الذي يمثله مثل هذا الابتكار المهم في الوقت الحالي هو زيادة اعتماد التعلم الآلي في إدارة الاستثمار والمخاطر ذات الصلة المتمثلة في التعويض. يمكن لبيانات Genai الاصطناعية توليد سيناريوهات السوق المعقولة التي تحافظ على العلاقات المعقدة أثناء استكشاف ظروف مختلفة. توفر هذه التقنية طريقًا إلى نماذج استثمار أكثر قوة.

ومع ذلك ، حتى البيانات الاصطناعية الأكثر تقدماً لا يمكن أن تعوض عن تطبيقات التعلم الآلي الساذج. لا يوجد حل آمن للتعقيد المفرط ، أو النماذج غير المعتمة ، أو أبرر الأسرار الاستثمارية الضعيفة.


سيستضيف مركز الأبحاث والسياسات ندوة عبر الإنترنت غدًا ، 18 مارس ، يضم ماركوس لوبيز دي برادو ، خبير عالمي شهير في التعلم الآلي المالي والبحث الكمي.

محادثات مع Frank Button

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى