برنامه ریزی بهره برداری ریزشبکه ها مبتنی بر الگوریتم یادگیری تقویتی عمیق
در این مقاله، برنامه ریزی بهره برداری ریزشبکه ها مشتمل بر منابع تولید انرژی و سیستم های ذخیره انرژی مبتنی بر یادگیری تقویتی عمیق ارایه شده است. با توجه به خاصیت پویایی مسیله، ابتدا در قالب یک فرایند تصمیم گیری مارکوف متشکل از چهارتایی (حالت، اقدام، تابع احتمال انتقال و پاداش) فرمول بندی شده است. سپس، الگوریتم گرادیان استراتژی قطعی عمیق به منظور یادگیری استراتژی بهینه برنامه ریزی بهره برداری ریزشبکه با هدف کمینه کردن هزینه های بهره برداری ارایه شده است. این الگوریتم یک روش بی نیاز از مدل، مستقل از استراتژی و بر مبنای معماری عامل-نقاد است که می تواند به خوبی فضای حالت و اقدام مسیله را به صورت پیوسته مدل سازی و بر چالش بزرگ بودن ابعاد مسیله غلبه کند. به منظور ارزیابی الگوریتم ارایه شده، نتایج با الگوریتم یادگیری Q عمیق و روش تحلیلی مقایسه شد. نتایج حاصل از شبیه سازی، کارایی الگوریتم گرادیان استراتژی قطعی عمیق ارایه شده را از جهت همگرایی، زمان اجرا و هزینه کل نشان دادند.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.