کاربرد یادگیری عمیق در دینامیک سنجش ریسک مشروط و آربیتراژ آماری |
کد مقاله : 1022-FEMATH8 |
نویسندگان |
زهرا نعمتی *1، عرفان صلواتی2 1دانشجوی کارشناسی ارشد ریاضیات و کاربردها گرایش ریاضی مالی دانشگاه امیر کبیر 2استاد دانشکده ریاضی و علوم کامپیوتر دانشگاه امیر کبیر |
چکیده مقاله |
در این مقاله، راهکاری نوین برای چالشهای مدیریت ریسک در یادگیری تقویتی معرفی میشود. هدف عامل در این رویکرد، بهینهسازی دینامیک اندازه ریسک طیفی پیوسته در طول زمان است. این روش با استفاده از مفهوم استخراجپذیری مشروط، توابع امتیازدهی را ایجاد کرده که به طور موثری انحراف معیار را در فرآیند تخمین، جریمه میکنند. این پایاننامه را میتوان در سه محور اصلی خلاصه کرد: نخست، یک راهکار کارآمد برای تخمین دستهای از دینامیک سنجه ریسک طیفی با بهرهگیری از شبکههای عصبی عمیق پیشنهاد میشود. دوم، نشان داده میشود که این سنجهها را میتوان با دقت دلخواه با استفاده از شبکههای عصبی عمیق تقریب زد. در نهایت، الگوریتمی برای عامل مخالف حساس به ریسک طراحی میشود که نیاز به انتقالهای تودرتوی اضافی را برطرف میسازد. برای ارزیابی عملکرد این الگوریتم یادگیری تقویتی، کارایی آن با استفاده از رویکرد شبیهسازی تودرتو در سناریوی آربیتراژ آماری نشان داده میشود. |
کلیدواژه ها |
یادگیری تقویتی، توابع امتیازدهی ثابت، مدل سنجه ریسک، الگوریتم عامل مخالف |
وضعیت: پذیرفته شده برای ارسال فایل های ارائه پوستر |