جستجوی مقالات مرتبط با کلیدواژه « temporal abstraction » در نشریات گروه « برق »

تکرار جستجوی کلیدواژه «temporal abstraction» در نشریات گروه «فنی و مهندسی»

انتخاب همه

ارائه روشی جدید برای کسب مهارت در یادگیری تقویتی با کمک خوشه بندی گراف

مرضیه داودآبادی فراهانی، ناصر مزینی *

نشریه مهندسی برق و مهندسی کامپیوتر ایران، سال شانزدهم شماره 2 (پیاپی 47، تابستان 1397)، ص 131

یادگیری تقویتی، یکی از انواع یادگیری ماشین است که در آن عامل با استفاده از تراکنش با محیط، به شناخت محیط و بهبود رفتار خود می‎پردازد. یکی از مشکلات اصلی الگوریتم‎های استاندارد یادگیری تقویتی مانند یادگیری Q این است که نمی‎توانند مسایل بزرگ را در زمان قابل قبولی حل کنند. کسب خودکار مهارت ها می تواند به شکستن مساله به زیرمساله‎های کوچک تر و حل سلسله مراتبی آن کمک کند. با وجود نتایج امیدوارکننده استفاده از مهارت ها در یادگیری تقویتی سلسله مراتبی، در برخی تحقیقات دیگر نشان داده شد که بر اساس وظیفه مورد نظر، اثر مهارت ها بر کارایی یادگیری می تواند کاملا مثبت یا منفی باشد و اگر به درستی انتخاب نشوند می توانند پیچیدگی حل مساله را افزایش دهند. از این رو یکی از نقاط ضعف روش های قبلی کسب خودکار مهارت ها، عدم ارزیابی هر یک از مهارت های کسب شده می باشد. در این مقاله روش های جدیدی مبتنی بر خوشه بندی گراف برای استخراج زیرهدف ها و کسب مهارت ها ارائه می گردد. همچنین معیارهای جدید برای ارزیابی مهارت ها مطرح می شود که با کمک آنها، مهارتهای نامناسب برای حل مساله حذف می گردند. استفاده از این روش ها در چندین محیط آزمایشگاهی افزایش سرعت یادگیری را به شکل قابل ملاحظه ای نشان می دهد.

کلید واژگان: یادگیری تقویتی سلسله مراتبی, گزینه, انتزاع زمانی, مهارت, ارزیابی مهارت ها, خوشه بندی گراف}

چکیده مشاهده متن مقاله پژوهشی/اصیل زبان: فارسی

Proposing a New Method for Acquiring Skills in Reinforcement Learning with the Help of Graph Clustering

M. Davoodabadi Farahani, N. Mozayani *

Iranian Journal of Electrical and Computer Engineering, Volume:16 Issue: 2, 2018, P 131

Reinforcement learning is atype of machine learning methods in which the agent uses its transactions with the environment to recognize the environment and to improve its behavior.One of the main problems of standard reinforcement learning algorithms like Q-learning is that they are not able to solve large scale problems in a reasonable time. Acquiring skills helps to decompose the problem to a set of sub-problems and to solve it with hierarchical methods. In spite of the promising results of using skills in hierarchical reinforcement learning, it has been shown in some previous studies that based on the imposed task, the effect of skills on learning performance can be quite positive. On the contrary, if they are not properly selected, they can increase the complexity of problem-solving. Hence, one of the weaknesses of previous methods proposed for automatically acquiring skills is the lack of a systematic evaluation method for each acquired skill. In this paper, we propose new methods based on graph clustering for subgoal extraction and acquisition of skills. Also, we present new criteria for evaluating skills, with the help of which, inappropriate skills for solving the problem are eliminated. Using these methods in a number of experimental environments shows a significant increase in learning speed.

Keywords: Hierarchical reinforcement learning , option , temporal abstraction , skill , skills evaluation , graph clustering}

Abstract View Paper Research/Original Article Original: Persian

نکته

نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.

به جمع مشترکان مگیران بپیوندید!

جستجوی مقالات مرتبط با کلیدواژه « temporal abstraction » در نشریات گروه « برق »