ارزیابی و به کارگیری مدل های مختلف طبقه بندی به منظور استخراج ژن های شاخص مرتبط با عود سرطان سینه از داده های میکرو آرایه
نویسنده:
چکیده:
مقدمه
در این پژوهش، سعی شد تا با به کارگیری موثر الگوریتم های محاسباتی و مدل های ریاضی، اعتبار ژن های شاخص مستخرج از داده های میکروآرایه و تفسیرپذیری آن ها در مطالعات زیستی بهبود یابد.روش ها
ابتدا، بهترین مدل طبقه بند با هدف دستیابی به بیشترین صحت پیش بینی عود سرطان سینه در داده های بیان ژن میکروآرایه انتخاب شد. بدین منظور، از داده های بیان 50 ژن شاخص مربوط به تومور سینه در 1271 بیمار مبتلا به سرطان (379 نفر با عود سرطان و 892 نفر بدون عود) استفاده شد و با مقایسه ی عملکرد چند طبقه بند مطرح بر روی این ژن ها، یک سیستم پیش بین مناسب برای عود به دست آمد. در این راستا، ابتدا به منظور افزایش صحت از طریق کاهش بعد و انتخاب مناسب ترین ژن ها (ویژگی ها) روش های Correlation-based feature selection (CFS)، Principal component analysis (PCA)، Independent component analysis (ICA)، الگوریتم ژنتیک (GA یا Genetic algorithm) و همچنین، روش انتخاب تصادفی چند ویژگی در ترکیب با انواع مدل های طبقه بند مورد بررسی قرار گرفت.یافته ها
در مجموع، 5 ژن شاخص از ترکیب روش الگوریتم ژنتیک، روش Top scoring set (TSS) و انتخاب تصادفی ژن ها انتخاب شدند که در اغلب طبقه بند ها، بهترین نتایج را داشتند. 5 ژن شاخص نهایی شامل TRIP13، KIF20A، NEK2، RACGAP1 و TYMS، به صورت معنی داری در ساختمان Microtubule و Spindle شرکت داشتند و فرایند زیستی اتصال میکروتوبول های Spindle به Kinetochore را تنظیم می کردند.نتیجه گیری
با استفاده از مدل های ترکیبی، علاوه بر اجتناب از بروز خطای انطباق بیش از حد مدل بر داده های آموزش، می توان به صحت مناسب با ژن های شاخصی که از نظر زیست شناسی معنی دار و تفسیرپذیر باشند، دست پیدا کرد.کلیدواژگان:
زبان:
فارسی
صفحات:
98 تا 103
لینک کوتاه:
https://www.magiran.com/p1681952