جستجوی مقالات مرتبط با کلیدواژه "بیوانفورماتیک" در نشریات گروه "ریاضی"
تکرار جستجوی کلیدواژه «بیوانفورماتیک» در نشریات گروه «علوم پایه»-
فیلوژنتیک شاخه ای از دانش بیوانفورماتیک است که تاریخچه روابط تکاملی بین گونه های موجودات زنده را بررسی می کند و مدل هایی را ارایه می دهد و گونه ها را دسته بندی نیز می کند. فیلوژنتیک از شبکه ها برای بیان روابط تکاملی در یک مدل جامع استفاده می کند. ساده ترین مدل شبکه ای، یک درخت است که درخت فیلوژنتیک نامیده می شود. درختهای فیلوژنتیک به دو زیرمجموعه ریشه دار و بدون ریشه تقسیم می شوند. در این پژوهش علاقه ما، درخت های فیلوژنتیک ریشه دار است. ورودی های مختلفی برای ساخت درخت های فیلوژنتیک ریشه دار موجود است. سه تایی های ریشه دار یکی از انواع مهم ورودی ها در تحلیل روابط بین گونه ها و ساخت درخت فیلوژنتیک ریشه دارند که در این پژوهش از آن استفاده می کنیم. سه تایی ریشه دار یک درخت دودویی ریشه دار با سه برگ است. سه تایی ریشه دار ساده ترین مدل درختی ریشه دار است که حاوی اطلاعات است. مساله ساخت درخت فیلوژنتیک ریشه داری که دربرگیرنده بیش ترین سه تایی ورودی باشد، یک مساله بهینه سازی است و به مساله MRTC مشهور است. چالش مهم در فیلوژنتیک، -NP سخت بودن مساله MRTC است. از این رو در این مقاله، یک الگوریتم نوین برای مساله MRTC با هدف افزایش میزان سازگاری سه تایی های ریشه دار ورودی با درخت نهایی، معرفی می شود. با هدف بیان کارایی الگوریتم نوین، روش معرفی شده را با روش TRH و بر روی داده های واقعی مقایسه می کنیم. الگوریتم TRH یکی از بهترین روش ها برای حل مساله MRTC و بر روی سه تایی های ریشه داری است که از روی داده های واقعی به دست آمده اند. نتایج آزمایش ها نشان می دهد که با در نظر گرفتن زمان اجرا و سازگاری سه تایی ها با درخت نهایی، الگوریتم ما نتایج TRH را بهبود می بخشد.
کلید واژگان: بیوانفورماتیک, توالی زیستی, مساله MRTC, درخت فیلوژنتیک ریشه دار, سه تایی ریشه دارPhylogenetics is a field in bioinformatics that categorizes and structures the evolutionary hisotiry of currently living species. Phylogenetics uses network tools to represent evolutionary histories in a comprehensive model. The simpleset possible network model is a tree model that is called a phylogenetic tree. Phylogenetic trees are divided into two categories, which are rooted and un-rooted. In this research, rooted phylogenetic trees are of interest. There are different types of input for constructing rooted phylogenetic trees. Rooted triplets are one of the important inputs for constructing rooted phylogenetic trees, which are used in this study. A rooted triplet is a rooted binary tree with three leaves. The rooted triplet is the most simplest model, which contains valuable information. The problem of building a rooted phylogenetic tree that includes the maximum number of a set of rooted triplets is an optimizataion problem, known as MRTC problem. The important challenge in phylogenetics is that MRTC is NP-hard. Therefore, the focus of this research is to introduce a novel algorithm for MRTC problem. The aim of the new algorithm is to improve the consistency of input rooted triplets with the final rooted phylogenetic tree. In order to indicate the performance of the new algorithm, it is compared with on of the best methods on biological data which is called TRH. The Experimental results on triplets that are obtained from biological data show that our new algorithm outperforms TRH base on time complexity and consistency.
Keywords: Bioinformatics, Biological sequence, MRTC problem, Rooted phylogenetic tree, Rooted triplet -
در این مقاله یک توزیع فوق هندسی تعمیم یافته که به کمک فرایند تولد- مرگ و برای مدل بندی داده های بیوانفورماتیک ساخته شده است را در نظر می گیریم. تحت برقراری بعضی شرایط، یک سیستم معادلات درست نمایی را به دست می آوریم که جواب حاصل از آن منطبق بر برآوردگرهای بیشینه درست نمایی پارامترهای مورد نظر است. یک روش تقریبی همراه با بررسی شبیه سازی برای برآورد پارامترها ارایه می شود. هم چنین به منظور ارایه کاربردهای این توزیع، سه نوع داده واقعی در بیوانفورماتیک را با توزیع مورد نظر برازش داده و نتایج را با استفاده از شاخص های آماری با چهار توزیع گسسته دیگر مقایسه می کنیم که بر این اساس ملاحظه می شود توزیع فوق هندسی تعمیم یافته نسبت به چهار توزیع گسسته دیگر مدل مناسب تری است.
کلید واژگان: توزیع فوق هندسی تعمیم یافته, فرایند تولد - مرگ, بیوانفورماتیک, برآورد بیشینه درست نمایی, روش مونت کارلوی زنجیر مارکفی (MCMC).کد موضوع بندی ریاضی (2010): 10F62, 30F62, 10P62, 28J60In this paper, we consider a three parametric regularly varying generalized Hypergeometric distribution which have been generated by Birth-Death process for describing phenomena in bioinformatics (Danielian and Astola, 2006). Under satisfying some conditions, we obtain the system of likelihood equations which its solution coincides with the maximum likelihood estimators. The given maximum likelihood estimators are the same as some moment estimators.Moreover, an approximate computation of the maximum likelihood estimations for the unknown parameters is given. Using MCMC, simulation studies are proposed. Finally, in order to present applications, some real data sets in bioinformatics are fitted with the model. Based on some important criterions, this model is compared with four other discrete distributions in bioinformatics. We see that the generalized Hypergeometric distribution provides a better fit than four other discrete distributions.
Keywords: Generalized Hypergeometric Distribution, Birth-Death Process, Bioinformatics, Maximum likelihood estimation (MLE), Markov Chain Monte Carlo (MCMC)
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.