افزایش سرعت فرایند یادگیری DQN با مکانیزم آثار شایستگی

نویسنده:

سید علی خوشرو ، سید حسین خواسته*

پیام:

نوع مقاله:

مقاله پژوهشی/اصیل (دارای رتبه معتبر)

چکیده:

برای سرعت بخشیدن به فرآیند یادگیری در مسایل یادگیری تقویتی با ابعاد بالا، معمولا از ترکیب روش های TD، مانند یادگیری Q یا سارسا، با مکانیزم آثار شایستگی، استفاده می شود. در الگوریتم شبکه عمیق Q (DQN)، که به تازگی معرفی شده، تلاش شده است که با استفاده از شبکه های عصبی عمیق در یادگیری Q، الگوریتم های یادگیری تقویتی را قادر سازد که به درک بالاتری از دنیای بصری رسیده و به مسایلی گسترش یابند که در گذشته رام نشدنی تلقی می شدند. DQN که یک الگوریتم یادگیری تقویتی عمیق خوانده می شود، از سرعت یادگیری پایینی برخوردار است. در این مقاله سعی می شود که از مکانیزم آثار شایستگی که یکی از روش های پایه ای در یادگیری تقویتی به حساب می آید، در یادگیری تقویتی در ترکیب با شبکه های عصبی عمیق استفاده شود تا سرعت فرایند یادگیری بهبود بخشیده شود. همچنین برای مقایسه کارایی با الگوریتم DQN، روی تعدادی از بازی های آتاری 2600، آزمایش انجام شد و نتایج تجربی به دست آمده در آنها نشان می دهند که روش ارایه شده، زمان یادگیری را در مقایسه با الگوریتم DQN، به طرز قابل توجهی کاهش داده و سریعتر به مدل مطلوب همگرا می شود

کلیدواژگان:

شبکه های عصبی عمیق ، Deep Q Network (DQN) ، آثار شایستگی ، یادگیری تقویتی عمیق

زبان:

فارسی

انتشار در:

مجله کنترل، سال چهاردهم شماره 4 (زمستان 1399)

صفحات:

13 تا 23

لینک کوتاه:

magiran.com/p2269588

دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:

اشتراک شخصی

با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!

اشتراک سازمانی

به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!

اطلاعات بیشتر

توجه!

حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.

In order to view content subscription is required

Personal subscription

Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.

Organization subscription

Please contact us to subscribe your university or library for unlimited access!

More information

علمی مصوب

مجله کنترل

Journal of Control

فصلنامه فنی مهندسی

آخرین شماره | آرشیو

ISSN: 2008-8345 eISSN: 2538-3752

صاحب امتیاز:

انجمن مهندسان کنترل و ابزار دقیق ایران

مدیر مسئول:

دکتر ایرج گودرزنیا

سردبیر:

دکتر علی خاکی صدیق

تلفن نشریه: ۰۲۱-۸۱۰۳۲۲۲۳

اطلاعات بیشتر نشریه

درباره نشریه پیام به نشریه سایت اختصاصی نشریه پذیرش الکترونیکی مقاله

به جمع مشترکان مگیران بپیوندید!

افزایش سرعت فرایند یادگیری DQN با مکانیزم آثار شایستگی

سید علی خوشرو ، سید حسین خواسته*

شبکه های عصبی عمیق ، Deep Q Network (DQN) ، آثار شایستگی ، یادگیری تقویتی عمیق

مجله کنترل

Journal of Control