کاربرد یادگیری عمیق در دینامیک سنجش ریسک مشروط و آربیتراژ آماری
کد مقاله : 1022-FEMATH8
نویسندگان
زهرا نعمتی *1، عرفان صلواتی2
1دانشجوی کارشناسی ارشد ریاضیات و کاربردها گرایش ریاضی مالی دانشگاه امیر کبیر
2استاد دانشکده ریاضی و علوم کامپیوتر دانشگاه امیر کبیر
چکیده مقاله
در این مقاله، راهکاری نوین برای چالش‌های مدیریت ریسک در یادگیری تقویتی معرفی می‌شود. هدف عامل در این رویکرد، بهینه‌سازی دینامیک اندازه ریسک طیفی پیوسته در طول زمان است. این روش با استفاده از مفهوم استخراج‌پذیری مشروط، توابع امتیازدهی را ایجاد کرده که به طور موثری انحراف معیار را در فرآیند تخمین، جریمه می‌کنند. این پایان‌نامه را می‌توان در سه محور اصلی خلاصه کرد: نخست، یک راهکار کارآمد برای تخمین دسته‌ای از دینامیک سنجه ریسک طیفی با بهره‌گیری از شبکه‌های عصبی عمیق پیشنهاد می‌شود. دوم، نشان داده می‌شود که این سنجه‌ها را می‌توان با دقت دلخواه با استفاده از شبکه‌های عصبی عمیق تقریب زد. در نهایت، الگوریتمی برای عامل مخالف حساس به ریسک طراحی می‌شود که نیاز به انتقال‌های تودرتوی اضافی را برطرف می‌سازد. برای ارزیابی عملکرد این الگوریتم یادگیری تقویتی، کارایی آن با استفاده از رویکرد شبیه‌سازی تودرتو در سناریوی آربیتراژ آماری نشان داده می‌شود.
کلیدواژه ها
یادگیری تقویتی، توابع امتیازدهی ثابت، مدل سنجه ریسک، الگوریتم عامل مخالف
وضعیت: پذیرفته شده برای ارسال فایل های ارائه پوستر
login