فهرست مطالب

پردازش علائم و داده ها - سال بیستم شماره 4 (پیاپی 58، زمستان 1402)

فصلنامه پردازش علائم و داده ها
سال بیستم شماره 4 (پیاپی 58، زمستان 1402)

  • تاریخ انتشار: 1402/12/11
  • تعداد عناوین: 10
|
  • امیر خشکبارچی، حمیدرضا شهریاری* صفحات 3-22

    سیستم های مدیریت اعتماد در محیط های تعاملی، جایی که یک عامل باید در مورد استفاده از یک سرویس تصمیم بگیرد، استفاده می شوند. به دلیل فراگیر شدن این سیستم ها، موجودیت های بدخواه انگیزه مضاعفی برای تاثیرگذاری بر سیستم های مدیریت اعتماد و ایجاد خدشه در فرایند تصمیم گیری دارند. با وجود روش های ارائه شده برای کاهش فعالیت های مخرب در مدل های اعتماد قبلی، بسیاری از آنها نتوانستند به طور موثر این مشکل را حل نمایند. به عنوان مثال، مقابله با تغییر رفتار عامل ها یک مشکل رایج برای بسیاری از مدل های اعتماد است. علاوه بر این، هیچ رویکرد قوی، منعطف و تطبیقی ارائه نشده است و این مشکل همچنان وجود دارد. در این مقاله، رویکرد جدیدی برای جلوگیری از اعمال مخرب و شناسایی ناهنجاری ها با استفاده از یک سیستم مدیریت اعتماد مبتنی بر آنتروپی با قابلیت تشخیص ویژگی های ذاتی اقدامات عامل ها، اعم از اینکه اقدام مخرب باشد یا خیر، ارائه شده است. محاسبه اعتماد بر اساس ساختار آنتروپی، از نظریه اخلاق اطلاعات الهام گرفته شده است. با استفاده از این روش، اقدامات مخربی که سیستم مدیریت اعتماد را مختل می کنند، پالایش می شوند و در نتیجه دقت محاسبه اعتماد افزایش می یابد. نتایج تجربی نشان می دهد که عملکرد سیستم پیشنهادی از نظر دقت محاسبه قابلیت اعتماد سرویس ها و همچنین تشخیص رفتار مخرب عامل ها قابل قبول است. به طور خاص، مدل پیشنهادی از نظر سرعت انطباق با تغییرات محیطی و رفتارهای متغیر عامل ها، حدود 10 درصد نسبت به مدل های اعتماد شناخته شده بهبود یافته است.

    کلیدواژگان: اعتماد، نظریه اخلاق اطلاعاتی، آنتروپی، کشف سرویس، محیط مبتنی بر سرویس
  • جواد حمیدزاده*، محمدعلی رشیدی محمودی، منا مرادی صفحات 23-34

    در گذر زمان خصوصیات داده های جریانی ناپایدار بوده و توزیع طبقات متحمل تغییرات می گردند بنابراین مدل های یادگیری غالبا نیاز به تطبیق با رانش مفاهیم دارند. در این مقاله، با هدف حل دو چالش عدم توازن میان طبقات مشاهده شده و وقوع رانش مفهوم، طبقه بند داده های جریانی نامتوازن دارای رانش مفهوم ارائه شده است. روش پیشنهادی سعی در حذف داده های جریانی مرزی و نویزی با کمک خوشه بندی دارد. داده ها با کمک تابع باور وزن دهی شده و با در نظر گرفتن برچسب داده ها، نمونه افزایی در نواحی کم تراکم طبقه اقلیت و با رویکرد آشوبی انجام می گیرد. سپس، با تعریف حد آستانه، رانش مفهوم شناسایی می شود. پیش بینی برچسب توسط طبقه بند ترکیبی و رای گیری وزن دار اکثریت انجام می پذیرد. عملکرد روش پیشنهادی بر روی مجموعه داده های پایگاه داده UCI توسط روش LOO ارزیابی و با طبقه بندهای مرز دانش مقایسه شده است. نتایج آزمایش ها نشان دهنده برتری روش پیشنهادی از نظر معیارهای ارزیابی است.

    کلیدواژگان: تغییر مفهوم، داده جریانی، داده نامتوازن، طبقه بندی برخط، نظریه باور
  • فریبا نمیرانیان، علی محمد لطیف* صفحات 35-44

    در این پژوهش رویکردی نوین برای بخش بندی تصویر بر اساس الگوریتم ژنتیک و جنگل تصادفی معرفی می گردد. در بخش بندی تصویر سعی می شود اجزاء مختلف تصویر از یکدیگر جدا شوند. در این فرایند به تمامی پیکسل های داخل تصویر برچسبی داده می شود؛ به نحوی که پیکسل های با برچسب یکسان ویژگی های مشترکی را داشته باشند. در روش پیشنهادی این ویژگی ها با استفاده از فیلترهای تصویری به دست آورده می شود. با ترکیب این ویژگی ها و با الگوریتم جنگل تصادفی به عنوان طبقه بند بخش بندی تصاویر انجام می شود. فیلترهای تصویری استفاده شده دارای تعدادی ابرپارامتر می باشند که تنظیم صحیح این ابرپارامترها بر کارایی الگوریتم موثر است. در این مقاله انتخاب این ابرپارامترها توسط الگوریتم ژنتیک انجام می شود. ابر پارامترهای فیلترهای گابور به عنوان ژن های کروموزوم الگوریتم ژنتیک در نظر گرفته می شود. تابع برازندگی f1-score حاصل از اجرای الگوریتم جنگل تصادفی برای بخش بندی تصویر تعریف می شود. یافتن مقادیر مناسب ابر پارامترهای فیلترهای گابور و افزایش f1-score در بخش بندی تصویر نسبت به سایر روش های مورد بررسی از دستاوردهای این پژوهش است.

    کلیدواژگان: بخش بندی تصویر، الگوریتم ژنتیک، الگوریتم جنگل تصادفی
  • بیژن مرادی، مهران خلج*، علی تقی زاده هرات صفحات 45-66

    از آنجا که در شرکتهای مخابرات همراه،هزینه حفظ مشتریان فعلی بسیار کمتر از هزینه جذب مشتریان جدید است، پیش بینی دقیق امکان ریزش هر یک از مشتریان و جلوگیری از آن امری ضروری می باشد. بنابراین، پژوهشگران روش های کارآمدی را با استفاده از ابزارهای داده کاوی و هوش مصنوعی برای شناسایی مشتریانی که قصد رویگردانی دارند ارائه کرده اند. در این مقاله، ما به منظور بهبود فرآیند پیش بینی ریزش مشتری، یک راهکار موثر مبتنی بر یادگیری جمعی را پیشنهاد می کنیم که در آن از الگوریتم بهینه سازی گرگ خاکستری، به منظور انتخاب ویژگی های موثر و همچنین تنظیم پارامترهای آزاد مدل پیشنهادی، استفاده شده است. سپس، به منظور ارزیابی عملکرد روش پیشنهادی، آن را با استفاده از مجموعه داده IBM Telco شبیه سازی کرده و نتایج حاصل را به کمک معیارهای ارزیابی متداول شامل صحت، دقت، یادآوری، امتیاز F1 و AUC باسایر روش های مشابه مقایسه کرده ایم.نتایج بدست آمده برتری روش پیشنهادی بر سایر راهکارهای ارزیابی شده را نشان می دهد.

    کلیدواژگان: پیش بینی ریزش مشتری، مخابرات همراه، یادگیری جمعی، هوش ازدحامی، الگوریتم بهینه سازی گرگ خاکستری
  • مهدیه واحدی پور، محبوبه شمسی، عبدالرضا رسولی کناری* صفحات 67-88

    بسیاری از شبکه های اجتماعی و سایت ها به مردم اجازه می دهند تا احساسات و نظرات خود را در مورد محصولات و خدمات مختلف به اشتراک بگذارند. در این مقاله روشی جدید مبتنی بر قطبیت نظرات مثبت و منفی فارسی درباره محصولات تلفن همراه از سایت دیجی کالا و داده های سنتی پرس ارائه شده است. نتیجه اجرا با الگوریتم های بیز ساده، ماشین بردار پشتیبان، کاهش گرادیان تصادفی، رگرسیون لجستیک، جنگل تصادفی و یادگیری عمیق مانند شبکه عصبی کانولوشن و حافظه کوتاه مدت متوالی بر اساس پارامترهایی مانند صحت، بازیابی، معیار فیشر و دقت، موردتوجه قرار گرفته شده است. روش پیشنهادی روی داده های دیجی کالا، با الگوریتم های بیز ساده بین 10 تا 34 درصد و ماشین بردار پشتیبان بین 5 تا 24 درصد و کاهش گرادیان تصادفی بین 7 تا 38 درصد و رگرسیون لجستیک بین 5 تا 38 درصد و جنگل تصادفی بین 4 تا 22 درصد و روش شبکه عصبی کانولوشن به میزان 4 درصد افزایش دقت را به همراه داشته است. هم چنین در داده های سنتی پرس با الگوریتم های بیز ساده بین 12 تا 46 درصد و ماشین بردار پشتیبان بین 5 تا 46 درصد و کاهش گرادیان تصادفی بین 5 تا 35 درصد و رگرسیون لجستیک بین 6 تا 46 درصد و جنگل تصادفی بین 4 تا 46 درصد دقت نسبت به قبل از اعمال روش پیشنهادی به دست آمده است.

    کلیدواژگان: تحلیل احساسات، نظرکاوی، یادگیری ماشین، یادگیری عمیق، قطبیت
  • صمد محمدی، واهه آغازاریان*، علیرضا هدایتی صفحات 89-106

    سامانه های پیشنهادگر که رتبه بندی کاربران را برای مجموعه ای از قلم ها پیش بینی می کنند به عنوان زیر مجموعه سامانه های پالایش اطلاعات شناخته می شوند. سامانه های توصیه فیلم از شناخته ترین و پر کاربردترین این سامانه ها می باشند که در این پژوهش به آن پرداخته شده است. سامانه های توصیه فیلم ابزارهای کارآمدی هستند که به کاربران کمک می کنند فیلم های مورد علاقه خود را با بررسی علایق قبلی کاربران پیدا کنند. این سیستم ها بر اساس امتیاز کاربران به فیلم های گذشته و استفاده از آنها برای پیش بینی علایق آنها در آینده ایجاد شده اند. با این حال، امتیازدهی نامناسبی که کاربران ارائه می دهند منجر به ایجاد مشکلی به نام پراکندگی داده می شود. این مشکل موجب کاهش کارایی سیستم های توصیه فیلم می شود. از سوی دیگر، سایر داده های موجود مانند ژانر فیلم ها و اطلاعات جمعیت شناختی کاربران، نقش حیاتی در کمک به روش های توصیه کننده برای تولید بهتر توصیه ها دارند. این مقاله یک روش توصیه فیلم را با استفاده از ژانرهای فیلم و اطلاعات جمعیت شناختی کاربران پیشنهاد می کند. همچنین ما مدلی کارآمد جهت ارزیابی پروفایل امتیازدهی کاربر و تعیین حداقل امتیاز مورد نیاز برای تولید یک پیش بینی دقیق را پیشنهاد می کنیم. سپس، امتیازات مجازی مناسب با پروفایل هایی که امتیازات نامناسبی دارند ترکیب می شوند. این امتیازدهی مجازی با استفاده از شباهت مقادیر بین کاربران به دست آمده از ژانرهای فیلم و اطلاعات جمعیت شناختی کاربران محاسبه می شوند. علاوه بر این، یک معیار مفید برای تعیین میزان قابل اعتماد بودن یک آیتم معرفی شده است که قابلیت اطمینان امتیازدهی مجازی را تضمین می کند. در نهایت، امتیازهای ناشناخته برای کاربر هدف براساس پروفایل های امتیازدهی توسعه یافته پیش بینی می شوند. آزمایش های انجام شده بر روی دو مجموعه داده توصیه فیلم معروف نشان می دهد که رویکرد پیشنهادی کارآمدتر از سایر توصیه کننده های مقایسه شده است.

    کلیدواژگان: سامانه های توصیه، فیلم، شروع سرد، پراکندگی داده ها، اطلاعات جمعیت شناختی، ژانر
  • جواد فروتن راد*، مریم حورعلی، محمدعلی کیوان راد صفحات 107-120

    پاسخ سریع و دقیق به سوالات مطرح شده به زبان طبیعی یکی اهداف مهم در توسعه سیستم های پرسش وپاسخ است که در آن رایانه یک متن و سوال را درک می کند و پاسخ دقیق را برای کاربر ارائه می‎ نماید. با اینکه پیشرفت های زیادی در این حوزه صورت گرفته است اما همچنان جزو مسائلی است که نیاز به ارتقا خصوصا برای زبان های غیر از انگلیسی مثل زبان فارسی است. در این مقاله دادگان پرسش وپاسخ زبان فارسی (FarsiQuAD) تهیه شده که توسط انسان و از مقالات ویکی پدیای فارسی ایجاد گردیده و در دو نسخه منتشر شده است. نسخه 1 شامل  10000+ پرسش وپاسخ و نسخه 2 این شامل مجموعه بیش از 145000+ ردیف است. این دادگان قابلیت تجمیع با نسخه انگلیسی SQuAD و سایر دادگان زبان های دیگر که از این استاندارد استفاده کرده باشند را دارد و برای عموم منتشر شده است. این دادگان جهت ساخت مدل های هوش مصنوعی مبتی بر یادگیری عمیق و برای استفاده در سامانه های پرسش و پاسخ زبان فارسی است.  نتایج این تحقیق نشان می دهد دادگان پرسش وپاسخ زبان فارسی ایجاد شده می تواند پاسخ به سوالات مطرح شده به زبان طبیعی فارسی را با معیار تطابق دقیق 78 درصد و معیار F1 87 درصد برساند که هنوز نیازمند ارتقا است.

    کلیدواژگان: دادگان پرسش وپاسخ زبان فارسی، سیستم های پرسش وپاسخ، درک مطلب، یادگیری عمیق، پردازش زبان طبیعی
  • سمیه کریمی*، فاطمه جعفری نژاد صفحات 121-128

    پردازش زبان طبیعی به طور قابل توجهی در حال رشد است و با ظهور وب جهانی و موتورهای جستجو بسیار مورد توجه قرار گرفته است و محققین شاهد انفجاری در اطلاعات به زبان های مختلف شدند. تحلیل احساسات یکی از فعال ترین زمینه های مطالعاتی در پردازش زبان طبیعی است که بر طبقه بندی متن تمرکز دارد و به منظور شناسایی، استخراج و تجزیه و تحلیل اطلاعات ذهنی از منابع متنی استفاده می شود. تحلیل احساسات مبتنی بر جنبه  یک تکنیک تحلیل متن است که نظرات را بر اساس جنبه طبقه بندی می کند و احساسات مربوط به هر جنبه را مشخص می کند. این تحلیل می تواند برای تحلیل اتوماتیک بازخورد نظرات مشتریان به بخشهای مختلف کالا یا خدمات مورد استفاده قرار گیرد و به کارفرمایان برای تمرکز بر نقاط نیازمند ارتقای کیفیت کمک کند.  در این مقاله به معرفی یک معماری جدید مبتنی بر یادگیری عمیق برای تحلیل احساسات مبتنی بر جنبه خواهیم پرداخت. این معماری از یک مدل مبتنی بر شبکه رمزگذار توجه با چندین توجه چند سر  و تبدیل کانولوشن نقطه ای (که یک جایگزین قابل موازی سازی و تعاملی  LSTM  است و برای محاسبه حالت های پنهان جاسازی های ورودی اعمال می شود) استفاده خواهد کرد. آزمایش این معماری روی سه دیتاست مختلف شامل رستوران ها و لپتاپ هاSemEval 2014 Task 4 و مجموعه داده توئیتر ACL 14 Twitter  است که در هر سه مجموعه داده،  قطبیت احساسات مثبت، خنثی و منفی است، انجام گردیده است که مقایسه آن با روش های مدرن تحلیل احساس مبتنی بر جنبه، دقت بالای این روش را نشان خواهد داد. بعنوان نمونه، تحلیل احساس مبتنی بر جنبه روی دیتاست رستوران ، 0.8187 درصد دقت را نشان داده است که نسبت به روش های مدرن 1.97% درصد دقت را بالا برده است.

    کلیدواژگان: تجزیه و تحلیل احساس مبتنی بر جنبه، یادگیری عمیق، شبکه رمزگذار توجه، توجه چند سر
  • مهدی رعایائی اردکانی*، علی افروغه صفحات 129-140

    بازی های رایانه ای در سال های اخیر نقش مهمی در پیشرفت هوش مصنوعی داشته اند. بازی ها به عنوان محیطی مناسب برای آزمون و خطا، آزمایش ایده ها و الگوریتم های مختلف هوش مصنوعی مورد استفاده قرار گرفته اند. بازی match-3 یک سبک از بازی های محبوب در تلفن های همراه است که از فضای حالت تصادفی و بسیار بزرگ تشکیل شده که عمل یادگیری در آن را دشوار می کند. در این مقاله یک عامل هوشمند مبتنی بر یادگیری تقویتی عمیق ارائه می شود که هدف آن بیشینه سازی امتیاز در بازی match-3 است. در تعریف عامل پیشنهادی از نگاشت فضای عمل، حالت و همچنین ساختار شبکه عصبی مبتکرانه ای برای محیط بازی match-3 استفاده می شود که توانایی یادگیری حالت های زیاد را داشته باشد. مقایسه روش پیشنهادی با سایر روش های موجود از جمله روش یادگیری تقویتی مبتنی بر سیاست، روش یادگیری تقویتی مبتنی بر ارزش، روش های حریصانه و عامل انسانی نشان از عملکرد برتر روش پیشنهادی در بازی match-3 دارد.

    کلیدواژگان: یادگیری تقویتی عمیق، بازی تصادفی، match-3، فضای حالت بزرگ
  • نیلوفر علوی، جعفر طهمورث نژاد* صفحات 141-159

    یادگیری تقویتی به آموزش مدل های یادگیری ماشین برای اتخاذ تصمیمات متوالی اشاره می کند که در آن یک عامل از طریق تعامل با محیط، آموزش دیده، نتایج این تعامل را مشاهده کرده و بر این اساس، پاداش مثبت یا منفی دریافت می کند. یادگیری تقویتی کاربردهای زیادی برای سیستم های چند عاملی به خصوص در محیط های پویا و ناشناخته دارد. با این حال، اکثر الگوریتم های یادگیری تقویتی چند عاملی با مشکلاتی همچون پیچیدگی محاسباتی نمایی برای محاسبه فضای حالت مشترک مواجه هستند که منجر به عدم مقیاس پذیری الگوریتم ها درمسائل چند عاملی واقعی می شود. کاربردهای یادگیری تقویتی چند عاملی را می توان از فوتبال ربات ها، شبکه ها، محاسبات ابری، زمانبندی شغل تا اعزام نیروی واکنشی دسته بندی کرد. در این مقاله یک الگوریتم جدید به نام انتقال دانش تنظیم شده برای یادگیری تقویتی چند عاملی (RKT-MARL) معرفی می شود که براساس مدل تصمیم گیری مارکوف کار می کند. این الگوریتم برخلاف روش های یادگیری تقویتی سنتی، مفاهیم تعاملات پراکنده و انتقال دانش را برای رسیدن به تعادل بین عامل ها استفاده می کند. علاوه بر این، RKT-MARL از مکانیزم مذاکره برای یافتن مجموعه تعادل و از روش حداقل واریانس برای انتخاب بهترین عمل در مجموعه تعادل به دست آمده استفاده می کند. همچنین الگوریتم پیشنهادی، دانش مقادیر حالت-عمل را در میان عامل های مختلف انتقال می دهد. از طرفی، الگوریتم RKT-MARL مقادیر Q را در حالت های هماهنگی به عنوان ضریبی از اطلاعات محیطی جاری و دانش قبلی مقداردهی می کند. به منظور ارزیابی عملکرد روش پیشنهادی، یک گروه از آزمایشات بر روی پنج بازی جهانی انجام شده و نتایج حاصل بیانگر همگرایی سریع و مقیاس پذیری بالا در RKT-MARL است.

    کلیدواژگان: یادگیری تقویتی چند عاملی، انتقال دانش، تعادل های متا و نش، تنظیم پذیری، تعاملات پراکنده، مذاکره بین عامل ها
|
  • Amir Khoshkbarchi, HamidReza Shahriari* Pages 3-22

    Trust management systems are used in interactive environments, where an agent needs to make a decision about using a service. Due to the preponderance of these systems, malicious entities have strong incentives to influence trust management systems and divert their decisions. In spite of approaches presented in previous trust models to mitigate the malicious activities, many of them could not cope with the problem efficiently. For example, tackling the variable behavior of agents is a common failure point for many trust models. Moreover, no rigid, flexible and adaptive general approach has been presented and the problem somehow remains.In this paper, a novel approach has been presented to prevent malicious actions and recognize anomalies using an entropy-based trust management system with capability of recognizing intrinsic characteristics of the actions, whether the action is malicious or not. the trust calculation is carried out based on an entropy structure derived from information ethics theory. Using this method, malicious actions disrupting the trust management system are filtered thus increasing the trust calculation accuracy. The experimental results demonstrate that the performance of the proposed system is promising in terms of trust calculation accuracy as well as detection of malicious behavior. specifically, the proposed model achieves a 10 percent advantage to well-known trust models in terms of speed of adaption to environmental changes and varying agent behaviors.

    Keywords: Trust, Information Ethics Theory, Entropy, Service Discovery, Service-Oriented environment
  • Javad Hamidzadeh*, MohammadAli Rashidi Mahmoodi, Mona Moradi Pages 23-34

    Continual learning from data streams is a pivotal aspect of machine learning, requiring the development of algorithms capable of adapting to incoming data. However, the ongoing evolution of data streams presents a formidable challenge as previously acquired knowledge may become outdated. This challenge, known as concept drift, demands timely detection for the effective adaptation of learning models. While various drift detectors have been proposed, they often assume a relatively balanced class distribution. In scenarios with imbalanced data streams, these detectors may exhibit bias toward majority classes, overlooking shifts in minority classes. Moreover, the imbalance among classes can change over time, with roles shifting between majority and minority classes, especially when relationships among classes become complex due to overlapping regions. In this paper, a novel classification method is introduced for imbalanced streaming data affected by concept drift. The proposed method continuously monitors arriving streams to detect and adapt to both imbalances and concept drift. Upon receiving a new block of data, the proposed method employs the k-means clustering approach to identify non-dense regions and performs oversampling for minority classes. Cluster centers are selected using the belief function to address overlapping issues between majority and minority classes. Utilizing a chaotic approach, the new sample is added based on its neighborhood and the size of that neighborhood. Subsequently, concept drift detection is conducted using three pre-defined thresholds that cover time intervals and classification errors. Finally, the label prediction process is done by ensemble learning and weighted majority voting. Experiments conducted on benchmark datasets from the UCI database evaluate the performance of the proposed method using Leave-One-Out (LOO) validation and comparisons with state-of-the-art methods. The results demonstrate the superiority of the proposed method across various evaluation criteria, highlighting its effectiveness in addressing imbalanced streaming data with concept drift.

    Keywords: Belief Theory, Concept Drift, Data Stream, Imbalanced Data, Online Classification
  • Fariba Namiranian, Ali mohammad Latif* Pages 35-44

    In this research, a new approach for image segmentation based on genetic algorithm and random forest is presented. Image segmentation can be done using supervised learning. In this learning, there are a number of images from data set with their labels. In image segmentation, different parts of the image separate from each other. In this process, all the pixels in the image are given a label, so that the pixels with the same label have common characteristics with each other. To provide a model that can perform image segmentation, it is necessary to extract features from input images and perform segmentation using a suitable classifier and these features. Image feature extraction is done using image filters. In this research, a hybrid combination of 4 Gabor filter banks and Sobel, Prewitt, Canny edge, Scharr, Gaussian, median, and Roberts filters are used for effective feature extraction. One of the most important of these filters, which also has a degree of freedom, is the Gabor filter. This filter has a number of   hyperparameters that change the efficiency of the classifier by changing these hyperparameters. In this research, an attempt has been made to adjust these hyperparameters using genetic algorithm. The fitness function proposed in this research is f1-score. random forest classifier is utilized for image segmentation and classification. The results of the experiments show that the hyperparameters found by the genetic algorithm have been able to perform a satisfactory segmentation on data set.

    Keywords: Image Segmentation, Genetic Algorithm, Random Forest Algorithm
  • Bijan Moradi, Mehran Khalaj*, Ali Taghizadeh Harat Pages 45-66

    In today’s competitive world, companies need to analyze, identify and predict the behaviorof their customers and respond to their demands earlier than their competitors. Moreover, in manyindustries such as mobile telecommunications, the cost of maintaining existingcustomers (customer retention)is much lower than the cost of attracting a new customer. Therefore,the problem of identifying customers who are going to leave the company, so-called Customer Churn Prediction (CCP),and preventing themby offering Incentivesis essential in these industries. In this direction, researchers have presentedefficient methods using data mining and artificial intelligence tools to identify potentialchurners. In order to improve the process of predicting customer churn, in this paper we propose a novelensemble learningbased approach, in which the Gray Wolf Optimization(GWO) algorithm is utilized to select the effective features and also adjust the hyper-parameters in the proposed model. We have implemented our proposed model using Python and simulated it on the IBM Telco dataset to evaluate itsperformanceand compared the obtained results with existingmethods using common evaluation criteria including accuracy, precision, recall,and AUC. The experimentalresults show the superiority of the proposed method over other evaluated solutions.

    Keywords: Customer Churn Prediction, Mobile Telecommunication, Ensemble Learning, Swarm Intelligence, Gray Wolf Optimization Algorithm
  • Mahdieh Vahedipoor, Mahboubeh Shamsi, Abdolreza Rasouli Kenari* Pages 67-88

    In recent years, the massive growth of generated content by users in social networks and online marketing sites, allows people to share their feelings and opinions on a variety of opinions about different products and services. Sentiment analysis is an important factor for better decision-making that is done using natural language processing (NLP), computational methods, and text analysis to extract the polarity of unstructured documents. The complexity of human languages and sentiment analysis have created a challenging research context in computer science and computational linguistics. Many researchers used supervised machine learning algorithms such as Naïve Bayes (NB), Stochastic Gradient Descent (SGD), Support Vector Machine (SVM), Logistic Regression (LR) Random Forest (RF), and deep learning algorithms such as Convolution Neural Network (CNN) and Long Short-Term Memory (LSTM). Some researchers have used Dictionary-based methods. Despite the existence of effective techniques in text mining, there are still unresolved challenges. Note that user comments are unstructured texts; Therefore, in order to structure the textual inputs, parsing is usually done along with adding some features, linguistic interpretations and removing additional items, and inserting the next terms in the database, then extracting the patterns in the structured data and finally the outputs will evaluate and interpret. The imbalance of data with the difference in the number of samples in each class of a dataset is an important challenge in the learning phase. This phenomenon breaks the performance of the classifications because the machine does not learn the features of the unpopulated classes well. In this paper, words are weighted based on the prescribed dictionary to influence the most important words on the result of the opinion mining by giving higher weight. On the other hand, the combination of the adjacent words using n-gram methods will improve the outcome. The dictionaries are highly related to the domain of the application. Some words in an application are important but in mobile comments are not impressive. Another challenge is the unbalanced train data, in which the number of positive sentences is not equal to the number of negative sentences. In this paper, two ideas are applied to build an efficient opinion mining algorithm. First, we build a precise dictionary for mobile Persian comments, and the second idea is to balance the positive and negative comments in train data. In summary, the main achievements of the current research can be mentioned: creating a weighted comprehensive dictionary in the field of mobile phone opinions to increase the accuracy of opinion analysis, balancing positive and negative opinions to improve the accuracy of opinion analysis, and eliminating the negative effect of overfitting and providing a precise approach to Determining the polarity of users' opinions about mobile phones using machine learning and recurrent deep learning algorithms. This new method is presented on mobile phone products from the Digikala site and Senti-Pers data. The result is performed with Naive Bayesian, Support Vector Machine, Stochastic Gradient Descent, Logistic Regression, Random Forest, and deep learning methods such as Convolutional Neural Network and Long Short-Term Memory based on parameters such as Accuracy, Precision, Retrieval, and F-Measure. The proposed method increases accuracy on Digikala, with NB between 10% and 34% and SVM between 5% and 24%, SGD between 7% and 38%, LR between 5% to 38%, and RF between 4% Up to 22% and CNN by 4%. The results show an accuracy increment on Senti-Pers, with NB between 12% and 46% and SVM between 5% and 46%, SGD between 5% and 35%, LR between 6% to 46%, and RF between 4% Up to 46%.

    Keywords: Sentiment Analysis, Opinion Mining, Machine Learning, Deep Learning, Polarity
  • Samad Mohammadi, Vahe Aghazarian*, Alireza Hedayati Pages 89-106

    Recommender systems that predict users' ratings for a set of fonts are known as a subset of information filtering systems. Movie recommendation systems are one of the most well-known and widely used systems that have been discussed in this research. Movie recommendation systems are efficient tools that help users find their favorite movies by checking users' previous interests. These systems are based on users' ratings of past movies and use them to predict their interests in the future. However, the inappropriate scoring that users provide leads to a problem called data sparsity. This problem reduces the efficiency of movie recommendation systems.On the other hand, other available data, such as the genre of movies and demographic information of users, play a vital role in helping recommender methods to generate better recommendations. This paper proposes a movie recommendation method using movie genres and users' demographic information. Also, we propose an efficient model to evaluate the user's scoring profile and determine the minimum score required to produce an accurate prediction.Then, suitable virtual scores are combined with profiles that have inappropriate scores. These virtual scores are calculated using similarity values ​​between users obtained from movie genres and users' demographic information. In addition, a useful criterion for determining the reliability of an item is introduced, which ensures the reliability of virtual scoring. Finally, unknown scores are predicted for the target user based on the developed scoring profiles. Experiments conducted on two famous movie recommendation datasets show that the proposed approach is more efficient than other compared recommenders.

    Keywords: Recommender systems, movies, cold start, data sparsity, demographic information, genre
  • Javad Forutanrad*, Maryam Hourali, Mohammadali Keyvanrad Pages 107-120

    Fast and accurate answer to the questions asked in natural language is one of the important goals in the development of question and answer systems in which the computer understands a context and question and provides the exact answer to the user. Although there has been a lot of progress in this area, it is still among the issues that need to be improved, especially for languages ​​other than English, such as Persian. FarsiQuAD (FarsiQuAD) was created by humans from Persian Wikipedia articles and published in two versions. Version 1 contains 10,000+ questions and answers and version 2 contains a collection of over 145,000+ rows. This database has the ability to integrate with the English version of SQuAD and other databases of other languages ​​that have used this standard.The results of this research show that the created Persian language question and answer database can provide the user with the answer to the questions asked in the natural Persian language with an exact matching criterion of 78%  and an F1 criterion of 87%, and it still needs to be improved.

    Keywords: Question, Answer Dataset, Answer systems, Reading comprehension, Deep Learning, Natural Language Processing
  • Somayeh Karimi*, Fatemeh Jafarinejad Pages 121-128

    Natural language processing is growing significantly and has gained much attention with the advent of the World Wide Web and search engines, and researchers have witnessed an explosion of information in different languages. Sentiment analysis is one of the most active fields of study in natural language processing that focuses on text classification and is used to identify, extract and analyze subjective information from text sources. Aspect-based sentiment analysis is a text analysis technique that classifies comments by aspect and identifies the sentiment associated with each aspect. This analysis can be used to automatically analyze the feedback of customers' comments to different parts of goods or services and help employers to focus on points that need quality improvement. In this paper, we will introduce a new architecture based on deep learning for aspect-based sentiment analysis. This architecture will use an attention-encoder network-based model with multiple multi-head attention and a pointwise convolutional transform (which is a parallelizable and interactive alternative to LSTM and is applied to compute hidden states of input embeddings). Testing this architecture on three different datasets, including restaurants and laptops, SemEval 2014 Task 4 and  ACL 14 Twitter dataset, in all three datasets, the polarity of emotions is positive, neutral and negative, which is compared with modern methods of sentiment analysis. Based on the aspect, it will show the high accuracy of this method. For example, the aspect-based sentiment analysis on the restaurant dataset has shown 0.8187% accuracy, which has increased the accuracy by 1.97% compared to modern methods.

    Keywords: Aspect-Based Sentiment Analysis (ABSA), Deep Learning, Attentional Encoder Network, Multi-Head Attention (MHA)
  • Mehdy Roayaei Ardakany*, Ali Afroughrh Pages 129-140

    Computer games have played an important role in the development of artificial intelligence in recent years. Throughout the history of artificial intelligence, computer games have been a suitable test environment for evaluating new approaches and algorithms to artificial intelligence. Different methods, including rule-based methods, tree search methods, and machine learning methods (supervised learning and reinforcement learning) have been developed to create intelligent agents in different games. Games have been used as a suitable environment for trial and error, testing different artificial intelligence ideas and algorithms. Among these researches, we can mention the research of Deep Blue in the game chess and AlphaGo in the game Go. AlphaGo is the first computer program to defeat an expert human Go player. Also, Deep Blue is a chess-playing expert system is the first computer program to win a match, against a world champion. In this paper, we focus on the match-3 game. The match-3 game is a popular game in cell phones, which consists of a very large random state space that makes learning difficult. It also has random reward function which makes learning unstable.  Many researches have been done in the past on different games, including match-3. The aim of these researches has generally been to play optimally or to predict the difficulty of stages designed for human players. Predicting the difficulty of stages helps game developers to improve the quality of their games and provide a better experience for users. Based on the approach used, past works can be divided into three main categories including search-based methods, machine learning methods and heuristic methods. In this paper, an intelligent agent based on deep reinforcement learning is presented, whose goal is to maximize the score in the match-3 game. Reinforcement learning is one of the approaches that has received a lot of attention recently. Reinforcement learning is one of the branches of machine learning in which the agent learns the optimal policy for choosing actions in different spaces through its experiences of interacting with the environment. In deep reinforcement learning, reinforcement learning algorithms are used along with deep neural networks. In the proposed method, different mapping mechanisms for action space and state space are used. Also, a novel structure of neural network for the match-3 game environment has been proposed to achieve the ability to learn large state space. The contributions of this article can be summarized as follow. An approach for mapping the action space to a two-dimensional matrix is presented in which it is possible to easily separate valid and invalid actions. An approach has been designed to map the state space to the input of the deep neural network, which reduces the input space by reducing the depth of the convolutional filter and thus improves the learning process. The reward function has made the learning process stable by separating random rewards from deterministic rewards. The comparison of the proposed method with other existing methods, including PPO, DQN, A3C, greedy method and human agents shows the superior performance of the proposed method in the match-3 game

    Keywords: deep reinforcement learning, random game, match-3, large state space
  • Niloofar Alavi, Jafar Tahmoresnezhad* Pages 141-159

    Reinforcement learning (RL) refers to the training of machine learning models to make a sequence of decisions on which an agent learns by interacting with its environment, observing the results of interactions and receiving a positive or negative reward, accordingly. RL has many applications for multi-agent systems, especially in dynamic and unknown environments. However, most multi-agent reinforcement learning (MARL) algorithms suffer from some problems specifically the exponential computational complexity to calculate the joint state-action space, which leads to the lack of scalability of algorithms in realistic multi-agent problems. Applications of MARL can be categorized from robot soccer, networks, cloud computing, job scheduling, and to optimal reactive power dispatch. In the area of reinforcement learning algorithms, there are serious challenges such as the lack of application of equilibrium-based algorithms in practice and high computational complexity to find equilibrium.  On the other hand, since agents have no concept of equilibrium policies, they tend to act aggressively toward their goals, which it results the high probability of collisions. Consequently, in this paper, a novel algorithm called Regularized Knowledge Transfer for Multi-Agent Reinforcement Learning (RKT-MARL) is presented that relies on Markov decision process (MDP) model. RKT-MARL unlike the traditional reinforcement learning methods exploits the sparse interactions and knowledge transfer to achieve an equilibrium across agents. Moreover, RKT-MARL benefits from negotiation to find the equilibrium set. RKT-MARL uses the minimum variance method to select the best action in the equilibrium set, and transfers the knowledge of state-action values across various agents. Also, RKT-MARL initializes the Q-values in coordinate states as coefficients of current environmental information and previous knowledge. In order to evaluate the performance of our proposed method, groups of experiments are conducted on five grid world games and the results show the fast convergence and high scalability of RKT-MARL. Therefore, the fast convergence of our proposed method indicates that the agents quickly solve the problem of reinforcement learning and approach to their goal.

    Keywords: Multi-agent reinforcement learning, Knowledge transfer, Meta, Nash equilibriums, Regularization, Sparse interactions, Agents negotiations