روش انتخاب ویژگی براساس یادگیری زیرفضا و تجزیه ماتریس پایه برای داده های میکرو-آرایه ای DNA
داده های میکرو-آرایه ای DNA در یادگیری ماشین و تشخیص انواع مختلف ساختارهای سرطانی نقش مهمی را ایفا می کنند. داده های میکرو-آرایه ای، به طور معمول شامل تعداد زیادی از ویژگی ها و تعداد کمی نمونه می باشند. همچنین، اینگونه داده ها به دلیل داشتن برخی ویژگی های نامرتبط می توانند موجب بیش برازش و دقت پیش بینی پایین طبقه بند کننده ها شوند. بنابراین، آنالیز داده های میکرو-آرایه ای امری مهم و پرچالش در یادگیری ماشین و فناوری ژنتیک مولکولی محسوب می شوند. راه مستقیم برای مقابله با این چالش، کاهش بعد داده می باشد. در این راستا، روش انتخاب ویژگی به عنوان یک راه کار مهم برای کاهش ابعاد و افزایش کارآیی الگوریتم های یادگیری عمل می کند. در این مقاله، با استفاده از مفهوم پایه برای مجموعه داده های میکرو-آرایه ای، یک روش جدید انتخاب ویژگی معرفی می شود. به عبارت دیگر، یک پایه که شامل یک زیرمجموعه بسیار کوچک از ژن ها است، بجای کل مجموعه داده های میکرو-آرایه ای در تعریف مسئله انتخاب ویژگی استفاده می شود. در این روش، مسئله انتخاب ویژگی براساس دیدگاه یادگیری زیرفضا و تجزیه ماتریس پایه فرمول بندی می شود. در نهایت، با استفاده از مجموعه داده های میکرو-آرایه ای DNA، کارایی روش پیشنهادی بررسی می شود و نتایج بدست آمده با چند روش انتخاب ویژگی مشهور با نظارت مقایسه می شوند.
-
معرفی یک روش انتخاب ویژگی چند-برچسبه مبتنی بر کمینه کردن افزونگی
حکیمه حسنیه، بهزاد ابراهیمی، ، مهدی افتخاری*
نشریه پژوهش های نظری و کاربردی هوش ماشینی، پاییز و زمستان 1402