توسعه یک روش انتخاب مشخصه مبتنی بر نظریه اطلاعات و الگوریتم ژنتیک

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
هدف
در مواجهه با مجموعه داده های با ابعاد بالا، کاهش بعد یک گام پیش پردازشی مهم برای حصول دقت بالا، کارایی و مقیاس پذیری در مسایل کلاسبندی است. هدف تحقیق حاضر ارایه یک روش انتخاب مشخصه در مواجهه با مجموعه داده های با ابعاد بالا، با استفاده از کاهش بعد و الگوریتم ژنتیک است.
روش
در این تحقیق یک الگوریتم ابتکاری توسعه یافته است که با استفاده از یک معیار جدید، اطلاعات متقابل بین ویژگی ها و کلاس هدف را مشخص می کند. در این روش مشخصه های جدید براساس ترکیب یا تبدیل مشخصه های اصلی تولید می شود و به این ترتیب فضای چند بعدی، به فضایی جدید با ابعاد کمتر نگاشت پیدا می کند. همچنین علاوه بر در نظر گرفتن معیار جدید اطلاعات متقابل، از الگوریتم ژنتیک به منظور بهبود سرعت روش پیشنهادی استفاده شده است.
یافته ها
عملکرد این روش بر روی مجموعه داده هایی با ابعاد مختلف، که تعداد مشخصه ها در آن ها از 13 تا 60 متفاوت بوده، ارزیابی شده است. ارزیابی روش پیشنهادی در مقایسه با روش های مشابه، از لحاظ دقت کلاسبند بررسی شده و نتایج نویدبخشی بدست آمد.
نتیجه گیری
روش پیشنهادی با روش های MRMR, DISR, JMI, NJMIM در مجموعه داده های متفاوت اعمال شده است. متوسط دقت های به دست آمده از روش پیشنهادی 65.32، 74.51، 70.88 و 58.2 درصد می باشد، که حاکی از کارآمدی روش پیشنهادی است. طبق نتایج بدست آمده، به جز در مورد مجموعه داده sonar که نتیجه ای بهتر از روش پیشنهادی داشته است، متوسط عملکرد روش پیشنهادی بهتر از DISR, JMI, NJMIM و MRMR بوده است.
زبان:
فارسی
صفحات:
7 تا 32
لینک کوتاه:
https://magiran.com/p2672864 
مقالات دیگری از این نویسنده (گان)