به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت

جستجوی مقالات مرتبط با کلیدواژه « Dilemma » در نشریات گروه « فنی و مهندسی »

  • سمیرا فرزانه، فرشته زندی، جواد سلیمی سرتختی*

    امروزه معمای زندانی یکی از مسایل اولیه‌ و مهم در نظریه بازی‌ها است. در این معما نقطه تعادل نشی وجود دارد و چنانچه عامل‌ها منطقی رفتار کنند در آن نقطه بازی می‌کنند؛ بدین منظور عامل‌ها برای دستیابی به سود بیشتر از بین دو عمل همکاری و عدم همکاری، عدم همکاری را انتخاب می‌کنند. در حالیکه برای عامل‌ها نقطه بهتری نسبت به نقطه نش وجود دارد و آن هم این است که هر دو عامل همکاری را انتخاب کنند. بنابراین، در جهت افزایش میزان همکاری عامل‌ها معمای زندانی به صورت معمای زندانی تکرارشونده با یک رویکرد یادگیری تقویتی در نظر گرفته‌شده است. نتایج مقاله نشان‌دهنده این است که رویکرد مورد نظر سبب افزایش میزان همکاری عامل‌ها شده است و اگر عاملی همکاری را پیشه کند عامل دیگر نیز همکاری را انتخاب می‌کند و بالعکس.

    کلید واژگان: عدم همکاری متقابل, معمای زندانی تکرارشونده, یادگیری تقویتی, همکاری متقابل, LSTM}
    Samira Farzaneh, Fereshteh Zandi, Javad Salimi Sartakhti*

    Nowadays, the prisoner’s dilemma is one of the primary and important issues in game theory. In this dilemma, there is a Nash Equilibrium, and if the agents behave rationally, they play at point; For this purpose, the agents choose defection between the two actions of cooperation and defection to achieve greater profit. However there is a better point for the agents than the Nash Equilibrium, it is that both agents choose the cooperation. However there is a better point for the agents than the Nash Equilibrium, it is that both agents choose the cooperation. Therefore, in order to increase the rate of cooperation of the agents, the prisoner's dilemma has been considered as iterated prisoner's dilemma with a reinforcement learning approach. The results of the article show that the desired approach let has increased the rate of cooperation of the agents, and if one agent choose the cooperation, the other agent also chooses cooperation and vice versa.

    Keywords: Mutual Defection, Iterated Prisoner’s, Dilemma, Reinforcement learning, Mutual Cooperation, LSTM(Long Short TermMemory)}
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال