راضیه هاشمی عالم
-
طبقهبندی زیرگروههای سرطان وظیفه بسیار مهمی در تشخیص و پیش بینی سرطان هاست. در سالهای اخیر، روشهای یادگیری عمیق به همین دلیل محبوبیت قابلتوجهی به دست آوردهاند. بااینحال، تعیین ساختار شبکه عصبی دشوار است زیرا عملکرد شبکه عمیق تا حد زیادی به ساختار آن بستگی دارد. علاوه بر این، تعداد بالای ژنها در مجموعه داده بیان ژن و عدم تعادل دادهها بین ردههای مختلف تاثیر مستقیمی بر پیچیدگی و عملکرد مدلهای طبقهبندی زیرگروه سرطان دارد. برای پرداختن به مشکل دادههای نامتعادل، یک مدل شبکه عصبی پیچشی با استفاده از یک راهبرد حساس به هزینه برای افزایش دقت مدل در شناسایی ردههای اقلیت پیشنهادشده است. از سوی دیگر، از سه تکنیک نسبت فیشر، مجموعههای ناهنجار و ترکیبی برای کاهش ژنها در مرحله پیشپردازش استفاده شده است. در روش حساس به هزینه، ماتریس هزینه بر اساس توزیع ردهها ایجاد شده و سپس از این ماتریس در مرحله تابع هزینه شبکه پیچشی برای محاسبه میزان خطا استفاده شده است. دو مجموعه از مجموعه دادههای سرطان برای ارزیابی روش پیشنهادی استفاده شده است. نتایج با استفاده از چهار معیار دقت، فراخوانی، صحت و F1-Score مقایسه شده است. نتایج نشان میدهد که انتخاب ژنهای مناسب و استفاده از یادگیری حساس به هزینه توانسته است عملکرد روش پیشنهادی را نسبت به مدل پیچشی بدون انتخاب ویژگی و یادگیری حساس به هزینه در حدود11%، 10% ، 18%، 21%، به ترتیب برای دقت، فراخوانی، صحت و F1-Score افزایش دهد.
-
طبقهبندی زیرگروههای سرطان وظیفه بسیار مهمی برای تشخیص و پیش آگهی سرطان است. در سالهای اخیر، روشهای یادگیری عمیق به همین دلیل محبوبیت قابلتوجهی به دست آوردهاند. بااینحال، تعیین ساختار شبکه عصبی دشوار است زیرا عملکرد شبکه عمیق تا حد زیادی به ساختار آن بستگی دارد. علاوه بر این، تعداد بالای ژنها در پایگاه داده بیان ژن و عدم تعادل دادهها بین طبقات مختلف تاثیر مستقیمی بر پیچیدگی و عملکرد مدلهای طبقهبندی زیرگروه سرطان دارد. برای پرداختن به مشکل دادههای نامتعادل، یک مدل شبکه عصبی کانولوشن (CNN) با استفاده از یک استراتژی حساس به هزینه برای افزایش دقت مدل در شناسایی کلاسهای اقلیت پیشنهادشده است. از سوی دیگر، از تکنیک ضریب فیشر برای کاهش ژنها در مرحله پیشپردازش استفاده میشود. در روش حساس به هزینه، ماتریس هزینه بر اساس توزیع کلاسها ایجاد میشود و سپس از این ماتریس در مرحله تابع هزینه شبکه CNN برای محاسبه میزان خطا استفاده میشود. دو مجموعه از مجموعه دادههای سرطان برای ارزیابی روش پیشنهادی استفاده میشود. نتایج با استفاده از سه معیار دقت، فراخوانی و دقت مقایسه میشوند. نتایج نشان میدهد که انتخاب ژنهای مناسب برای طبقهبندی به همراه استفاده از یادگیری حساس به هزینه برای این منظور میتواند عملکرد روش پیشنهادی نسبت به مدل CNN بدون انتخاب ویژگی و یادگیری حساس به هزینه حدود 11%، 10% و 18% به ترتیب برای دقت، فراخوانی و صحت افزایش دهد.
کلید واژگان: دسته بندی, داده های نامتوازن, زیرگروه های سرطان, داده های بیان ژن, یادگیری عمیق CNNClassification of cancer subtypes is very important task for the diagnosis and prognosis of cancer. In recent years, deep learning methods have gained considerable popularity for this reason; however, it is difficult to determine the structure of the neural network because the function of the deep network depends largely on its structure. In addition, the high number of genes in the gene expression database and the imbalanced data between different classes have a direct effect on the complexity and performance of cancer subgroup classification models. To address the problem of unbalanced data, a convolution neural network (CNN) model using a cost-sensitive strategy is proposed to increase the model's accuracy in identifying minority classes. On the other hand, the fisher ratio technique is used to reduce genes in the preprocessing stage. In techniques the cost-sensitive method, a cost matrix is created based on the distribution of classes, and then this matrix is used in the CNN network cost function step to calculate the amount of error. Two sets of cancer datasets are used to evaluate the proposed method. The results show that selecting the appropriate genes for classification along with the use of cost-sensitive learning can increase the performance of the proposed method compared to the CNN model without selecting the feature and cost-sensitive learning about 11%, 10% and 18% in terms of three criteria of accuracy, recall and precision, respectively.
Keywords: Classification, Imbalanced Data, Cancer subgroups, Geneexpression, Convolution Neural Networks, Cost-sensitive learning
- در این صفحه نام مورد نظر در اسامی نویسندگان مقالات جستجو میشود. ممکن است نتایج شامل مطالب نویسندگان هم نام و حتی در رشتههای مختلف باشد.
- همه مقالات ترجمه فارسی یا انگلیسی ندارند پس ممکن است مقالاتی باشند که نام نویسنده مورد نظر شما به صورت معادل فارسی یا انگلیسی آن درج شده باشد. در صفحه جستجوی پیشرفته میتوانید همزمان نام فارسی و انگلیسی نویسنده را درج نمایید.
- در صورتی که میخواهید جستجو را با شرایط متفاوت تکرار کنید به صفحه جستجوی پیشرفته مطالب نشریات مراجعه کنید.