سلوك الذكاء الاصطناعي في التداول
دراسة جديدة من جامعة وارتون تسلط الضوء على سلوك الذكاء الاصطناعي في التداول، بعدما أظهرت تجارب المحاكاة أن الخوارزميات قد تتصرف بشكل جماعي يشبه التفاهم السعري بين المتداولين — دون أي تواصل بينها.
إذا كان يتصرف كالبطة، ويعوم كالبطة، ويصدر صوتًا كالبطة… فهل يجوز اعتباره بطة؟ هذا السؤال الاستعاري يشكل مدخلًا لورقة بحثية صدرت عن باحثين من جامعة وارتون وجامعة هونغ كونغ للعلوم والتكنولوجيا، لكن في سياق مختلف تمامًا: كيف يمكن تقييم سلوك وكلاء التداول المعتمدين على الذكاء الاصطناعي حين يبدو شبيهًا بالتواطؤ؟ وهل يصبح من العدل أن تتعامل الجهات التنظيمية مع هذا السلوك كما لو أنه تواطؤ حقيقي، حتى وإن لم تكن هناك نية أو اتصال مباشر؟
سلوك الذكاء الاصطناعي في التداول
الورقة البحثية التي نُشرت تحت عنوان: “التداول المدعوم بالذكاء الاصطناعي، التواطؤ الخوارزمي، وكفاءة التسعير” ضمن منشورات المكتب الوطني للبحوث الاقتصادية (NBER)، تسعى للإجابة عن هذا التساؤل من خلال تجارب محاكاة استخدمت فيها خوارزميات تداول تعتمد على تقنيات التعلم المعزز (Reinforcement Learning). الهدف من هذه التجارب كان تقييم كيفية اتخاذ هذه الخوارزميات لقرارات البيع والشراء بناءً على تاريخ السوق، واتجاهاته، وتوقعاته المستقبلية.
الباحثون الثلاثة، وينستون وي دُو، إيتاي جولدستين، ويان جي، توصلوا إلى نتيجة جوهرية مفادها أن التواطؤ بين الخوارزميات يمكن أن ينشأ بقوة من خلال آليتين مختلفتين:
-
الأولى تقوم على استراتيجيات التحفيز السعري، حيث تُظهر الخوارزميات سلوكًا يُعاقب الوكلاء الآخرين في حال تصرفوا بشكل عدواني، مما يولد بيئة ردع تجعل كل طرف يلتزم بالتسعير “المتفاهم عليه” دون تواصل مباشر.
-
الثانية تستند إلى ما يُعرف بـ “تحيز فرط التقليم” في التعلم (Over-pruning Bias)، وهو ميل الخوارزميات للتوقف عن اختبار خيارات جديدة بعد مرورها بتجارب غير ناجحة. هذا النمط يؤدي في النهاية إلى سلوك محافظ متكرر يشبه التواطؤ، دون أن يكون هناك وعي أو نية.
الباحثون لم يترددوا في سلوك الذكاء الاصطناعي في التداول الأول بأنه ناتج عن “الذكاء الاصطناعي” الحقيقي، أما الثاني فوصفوه بأنه نتيجة “الغباء الاصطناعي” — حيث تتصرف الخوارزميات بطريقة غير منطقية نتيجة فشلها في التعلّم من تجاربها.
تجدر الإشارة إلى أن الورقة البحثية احتوت على مصطلحات رياضية معقدة وأسماء تقنية غير معرفة بشكل تفصيلي، ما يدفعنا للاعتماد في هذا العرض على مقدمة وخاتمة الورقة بشكل أساسي. وبعيدًا عن التعقيد الرياضي، فإن جوهر الفكرة قابل للفهم بمجرد معرفة كيف تعمل خوارزميات الذكاء الاصطناعي: الهدف النهائي هو تعظيم احتمالات الربح وتقليل احتمالات الخسارة. ولتحقيق ذلك، غالبًا ما تنتهي هذه الخوارزميات إلى اتخاذ قرارات متشابهة في ظروف متشابهة — ما ينتج عنه سلوك جماعي غير مقصود يشبه تمامًا منطق الكارتيلات الاقتصادية.
التفكير المنطقي والاستراتيجي
أشار الباحثون إلى هذه الظاهرة بقولهم إن: “الاعتماد الكامل على التعرف على الأنماط يمكن أن يؤدي إلى سلوك الذكاء الاصطناعي في التداول يشبه التفكير المنطقي والاستراتيجي”، مضيفين أن تحيز فرط التقليم لا يعكس وجود عيوب برمجية نادرة، بل هو سمة عامة متكررة في أنظمة التعلم المعزز — حتى في السياقات المتقدمة.
من ناحية تنظيمية، يطرح هذا النموذج تحديًا غير مسبوق. إذ أن محاولات الجهات الرقابية لكبح “العدوانية” الزائدة في أداء الخوارزميات قد تؤدي إلى نتيجة عكسية، وهي تعزيز “السلوك الخائف”، أي ذلك الناتج عن الغباء الاصطناعي، مما قد يدفع الخوارزميات لتجنب المخاطر كليًا والتمسك بخيارات آمنة جدًا — وهو ما يعطل ديناميكية السوق.
لعل أفضل توضيح لهذه الإشكالية يتمثل في تجربة منشورة منذ 12 عامًا، تم خلالها تدريب روبوتات على لعب ألعاب Nintendo، مثل “Super Mario Bros” و”Tetris”. في اللعبة الأولى، أدت الخوارزمية أداءً ممتازًا، أما في Tetris، والتي تنتهي فقط عندما يخسر اللاعب، فقد وجدت الخوارزمية أن أفضل طريقة لتجنب الخسارة هي إيقاف اللعبة (Pause) إلى الأبد.
بنفس المنطق، قد يتجه سلوك الذكاء الاصطناعي في التداول إلى تجنّب الممارسات التي قد تبدو كتواطؤ عبر إلغاء أي سلوك عدواني أو تنافسي حاد — وهو ما يعيد إنتاج نفس النتيجة ولكن بطريقة أكثر “ذكاءً غبيًا”.
رغم أن الباحثين لا يدّعون أن هذا النوع من التواطؤ يحدث فعليًا في الأسواق الحالية، فإن تجارب المحاكاة كافية لإطلاق إنذار أولي حول السلوك الذي يمكن أن يظهر حين تترك الخوارزميات لتطور نفسها دون رقابة واضحة. فإذا ظهرت الخوارزميات كأنها تتواطأ، وتصرفت بنفس الشكل، وأنتجت نفس النتائج — حتى لو في بيئة افتراضية — فهل ننتظر حتى تظهر في السوق الحقيقية قبل أن نتعامل معها على هذا الأساس؟
التعليقات مغلقة.