طبقه بندی داده های نامتعادل با ترکیب منحنی اصلی و smote بهبود یافته درجه پشتیبان

نویسنده:

ریحانه کمال پور * ، عادل قاضی خانی

پیام:

نوع مقاله:

مقاله پژوهشی/اصیل (بدون رتبه معتبر)

چکیده:

مسئله طبقه بندی داده های نامتعادل به عنوان یکی از چالش های اصلی در حوزه داده کاوی است. در مجموعه داده های نامتعادل، تعداد نمونه ها در کلاسهای گوناگون اختلاف بسیاری دارند. در داده های نامتعادل هدف اصلی شناسایی صحیح نمونه های کلاس اقلیت است. بهعنوان مثال در حوزه پزشکی، تعداد نمونه های مثبت از یک بیماری در مقابل تعداد نمونه های منفی بسیار کمتر است. در حالیکه برای این مسئله ارائه ،SdCurveSmote اهمیت شناسایی نمونه های مربوط به دسته مثبت، بسیار زیاد است. در این مقاله الگوریتمی بانام شده است. این الگوریتم شامل سه بخش کلی است بخش اول محاسبه پارامتری بنام درجه پشتیبانی برای انتخاب نمونه های مناسبب ر روی این نمونه های مناسب با درجه پشتیبان بالا و تولید نمونه جدید است Smote و بخش دوم انجام عمل Smote مرزی برای عمل و در بخش آخر محاسبات منحنی اصلی و حد آستانه و بررسی نمونه های تولید شده میباشد. در این مقاله از 5 مجموعه داده نامتعادل، استفاده شده است که میزان عدم تعادل متفاوت دارند. الگوریتم پیشنهادی نسبت به الگوریتمهای مشابه، KEEL و UCI برگرفته از سایت نشان میدهد که در آن تفاوت معنادار بسیار مطلوبی بین Adaboost با آزمون فریدمن نتایج بهتری داشت در این آزمون برای طبقه بند وجود دارد. SdSmote و Smote روش پیشنهادی و روش های

کلیدواژگان:

طبقه بندی ، داده های نامتعادل ، نمونه افزایی ، منحنی اصلی ، حد آستانه عضویت

زبان:

فارسی

انتشار در:

مجله فناوری اطلاعات در طراحی مهندسی، سال دهم شماره 2 (پاییز و زمستان 1396)

صفحات:

42 تا 54

لینک کوتاه:

magiran.com/p1891108

دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:

اشتراک شخصی

با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!

اشتراک سازمانی

به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!

اطلاعات بیشتر

توجه!

حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.

In order to view content subscription is required

Personal subscription

Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.

Organization subscription

Please contact us to subscribe your university or library for unlimited access!

More information

مجله فناوری اطلاعات در طراحی مهندسی

Information Technology on Engineering Design

دوفصلنامه

آخرین شماره | آرشیو

ISSN: 1735-1985

صاحب امتیاز:

دانشگاه آزاد اسلامی واحد مشهد

مدیر مسئول:

دکتر مهرداد جلالی

سردبیر:

مجید وفایی جهان

تلفن نشریه: ۰۵۱-۳۶۶۲۵۰۵۵

اطلاعات بیشتر نشریه

درباره نشریه پیام به نشریه سایت اختصاصی نشریه پذیرش الکترونیکی مقاله راهنمای نویسندگان

به جمع مشترکان مگیران بپیوندید!

طبقه بندی داده های نامتعادل با ترکیب منحنی اصلی و smote بهبود یافته درجه پشتیبان

ریحانه کمال پور * ، عادل قاضی خانی

طبقه بندی ، داده های نامتعادل ، نمونه افزایی ، منحنی اصلی ، حد آستانه عضویت

مجله فناوری اطلاعات در طراحی مهندسی

Information Technology on Engineering Design