جستجوی مقالات مرتبط با کلیدواژه « Dilemma » در نشریات گروه « فنی و مهندسی »

انتخاب همه

دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده

سمیرا فرزانه، فرشته زندی، جواد سلیمی سرتختی*

مجله محاسبات و سامانه های توزیع شده، سال سوم شماره 2 (پیاپی 6، پاییز و زمستان 1399)، صص 12 -21

امروزه معمای زندانی یکی از مسایل اولیه‌ و مهم در نظریه بازی‌ها است. در این معما نقطه تعادل نشی وجود دارد و چنانچه عامل‌ها منطقی رفتار کنند در آن نقطه بازی می‌کنند؛ بدین منظور عامل‌ها برای دستیابی به سود بیشتر از بین دو عمل همکاری و عدم همکاری، عدم همکاری را انتخاب می‌کنند. در حالیکه برای عامل‌ها نقطه بهتری نسبت به نقطه نش وجود دارد و آن هم این است که هر دو عامل همکاری را انتخاب کنند. بنابراین، در جهت افزایش میزان همکاری عامل‌ها معمای زندانی به صورت معمای زندانی تکرارشونده با یک رویکرد یادگیری تقویتی در نظر گرفته‌شده است. نتایج مقاله نشان‌دهنده این است که رویکرد مورد نظر سبب افزایش میزان همکاری عامل‌ها شده است و اگر عاملی همکاری را پیشه کند عامل دیگر نیز همکاری را انتخاب می‌کند و بالعکس.

کلید واژگان: عدم همکاری متقابل, معمای زندانی تکرارشونده, یادگیری تقویتی, همکاری متقابل, LSTM}

چکیده مشاهده متن مقاله پژوهشی/اصیل زبان: فارسی

Achieving Cooperation Through Multi agent Reinforcement Learning In Iterated Prisoner's Dilemma

Samira Farzaneh, Fereshteh Zandi, Javad Salimi Sartakhti*

Distributed computing and Distributed systems, Volume:3 Issue: 2, 2021, PP 12 -21

Nowadays, the prisoner’s dilemma is one of the primary and important issues in game theory. In this dilemma, there is a Nash Equilibrium, and if the agents behave rationally, they play at point; For this purpose, the agents choose defection between the two actions of cooperation and defection to achieve greater profit. However there is a better point for the agents than the Nash Equilibrium, it is that both agents choose the cooperation. However there is a better point for the agents than the Nash Equilibrium, it is that both agents choose the cooperation. Therefore, in order to increase the rate of cooperation of the agents, the prisoner's dilemma has been considered as iterated prisoner's dilemma with a reinforcement learning approach. The results of the article show that the desired approach let has increased the rate of cooperation of the agents, and if one agent choose the cooperation, the other agent also chooses cooperation and vice versa.

Keywords: Mutual Defection, Iterated Prisoner’s, Dilemma, Reinforcement learning, Mutual Cooperation, LSTM(Long Short TermMemory)}

Abstract View Paper Research/Original Article Original: Persian

نکته

نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.

به جمع مشترکان مگیران بپیوندید!

جستجوی مقالات مرتبط با کلیدواژه « Dilemma » در نشریات گروه « فنی و مهندسی »