رایانش سریع از طریق ارتقای جنگل تصادفی با استفاده از دو تکنیک فشرده سازی و موازی سازی
در این پژوهش به دنبال ارتقای یکی از الگوریتم های کارامد در یادگیری ماشین، به نام جنگل تصادفی هستیم. برای این منظور از تکنیک های فشرده سازی و موازی سازی بهره می بریم. چالش اساسی مورد توجه در این پژوهش، در رابطه با به کارگیری جنگل تصادفی در پردازش و تحلیل داده های حجیم می باشد. در چنین مواردی، این الگوریتم به دلیل مراجعات پرشمار به حافظه، کارایی معمول و مورد نیاز را ندارد. این پژوهش نشان می دهد که چگونه می توان با به کارگیری یک شیوه فشرده سازی ابتکاری، در کنار تکنیک های موازی سازی به هدف مورد نظر دست یافت. در این رابطه، اجزای مشترک درختان در جنگل تصادفی با یکدیگر به اشتراک گذاشته می شوند. علاوه بر این، روش موازی سازی مبتنی بر دستورات برداری سازی به همراه روش موازی سازی مبتنی بر حافظه اشتراکی در جریان پردازش داده ها به کار می روند. به منظور ارزیابی عملکرد روش پیشنهادی، آن را بر روی مجموعه داده های محک Kaggle که در رقابت های مربوط به الگوریتم های یادگیری به وفور به کار می روند، اجرا نمودیم. نتایج به دست آمده حاکی از آن است که به کارگیری روش فشرده سازی پیشنهادی، 66 درصد بهبود در سرعت پردازش داده ها به دنبال داشته است. همچنین به کارگیری فشرده سازی به همراه موازی سازی یادشده، 96 درصد بهبود را به همراه داشته است. به طور کلی نتایج آزمایشی و تحلیل ها دلالت بر این دارند که راهکارهای پیشنهادی، قدمی موثر در راستای رسیدن به رایانش سریع برای جنگل تصادفی در اختیار می گذارد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.