جستجوی مقالات مرتبط با کلیدواژه "naive bayes" در نشریات گروه "پزشکی"
-
مقدمه
بیماری های قلبی - عروقی اصلی ترین عامل مرگ و میر در سراسر جهان بوده و یکی از ده دلیل اول مرگ در 15 سال اخیر می باشد. بیماری های ایسکمیک قلبی نوعی بیماری قلبی است که به دلیل تنگ شدن شریان های تغذیه کننده بافت قلب (عروق کرونر) ایجاد می شود. هدف از این پژوهش مقایسه الگوریتم های داده کاوی در پیش بینی زودهنگام بیماری قلبی با توجه به علایم اولیه بیمار می باشد.
روش بررسیدر این پژوهش از داده های فاز اول مطالعه سلامت مردم یزد (یاس) که شامل 10000 شرکت کننده و با استفاده از 21 ویژگی آنان مانند سن، نوع درد قفسه سینه، میزان قند خون، وضعیت شغلی، مصرف الکل، شاخص توده بدنی و غیره که از سال 1393 تا کنون جمع آوری شده بود استفاده شد.
نتایجتجزیه و تحلیل داده ها جمع آوری شده با استفاده از الگوریتم های Random Forest و Naive Bayes، دقت 74/51 درصد را در پیش بینی بیماری کرونر قلبی نشان داد.
نتیجه گیریمی توان نتیجه گرفت که با الگوریتم های ساده فوق می توان پیش بینی بیماری ایسکمیک قلب را با دقت بالا انجام داده و با غربالگری زود هنگام و درمان به موقع در مراحل اولیه باعث کاهش مرگ و میر مرتبط شد.
کلید واژگان: داده کاوی, غربالگری, بیماری ایسکمیک قلبی - عروقی, Naïve Bayes, Random Forest, مطالعه سلامت مردم یزدJournal of Shaeed Sdoughi University of Medical Sciences Yazd, Volume:31 Issue: 7, 2023, PP 6824 -6835IntroductionCardiovascular diseases, including ischemic heart disease (IHD), are one of the main cause of mortality and morbidity worldwide and are currently one of the top ten causes of death. Ischemic heart disease is a type of heart disease that is caused by narrowing of arteries feeding the heart itself. The present study aimed to use data mining algorithms in screening and early prediction of IHD according to the patient's characteristics and risk factors.
MethodsIn this research, data of the first phase of Yazd Health Study (YaHS), focusing on 21 characteristics of 10,000 participants aged 20-70 years such as age, type of chest pain, blood sugar level, body mass index, employment status, etc. which have been collected since 2013 were analyzed.
ResultsData analysis was conducted using Random Forest and Naive Bayes algorithms which showed 74.51% accuracy in predicting IHD.
ConclusionThe study findings revealed that via applying Random Forest and Naive Bayes algorithms, ischemic heart disease can be predicted with high accuracy. Moreover, early screening and timely treatment in the early stages of disease may reduce mortality and morbidity.
Keywords: Data mining, Screening, Coronary heart Disease, Naive Bayes, Random Forest, YaHS -
Introduction
Air pollution increases the load of hospitalization cases, especially for those who have respiratory problems. For effective environmental management, this study aims to compare the performance of two classification algorithms in machine learning (logistic regression and naive bayes) and to evaluate the selection of the best algorithm for predicting the air quality class.
Materials and methodsPollutants data (PM10, SO2 , NO2) have been collected from the Haldwani, Kashipur and Rudrapur regions in Uttarakhand (India). In part I of the study, the Air Quality Index (AQI) is calculated and assigned a class accordingly. In part II, the performance of algorithms is compared, and the air quality class is predicted through the best algorithm. In part III, accuracy is calculated after comparing the predicted class with the actual class. Then, it is compared with the accuracy of our selected algorithm.
ResultsThe study finds a positive correlation between PM10 and SO2 pollutants. The result shows that the highest accuracy is achieved through logistic regression to predict the air quality class. Further, logistic regression has achieved the same accuracy i.e., 98.70% after comparing predicted values with the actual values.
ConclusionLogistic regression is the best algorithm to predict the air quality class in the regions of Uttarakhand, where pollutants are being measured in the Government’s hospital. The research also indicates that asthma patients in the Kashipur and Rudrapur regions may experience more health effects dueto moderately polluted air quality; however, the situation is improving during the monsoon season.
Keywords: Pollutants, Air quality, Logistic regression, Naive bayes, Environmental management -
زمینه و هدف
سرطان پستان شایع ترین سرطان و اصلی ترین علت مرگ ناشی از سرطان در زنان سراسر جهان به شمار می رود. تکنولوژی هایی مثل داده کاوی، به متخصصان این حوزه، امکان بهبود تصمیم گیری را در زمینه ی تشخیص زودهنگام فراهم آورده اند. هدف از این پژوهش توسعه ی مدل تشخیص خودکار سرطان پستان با به کارگیری روش های داده کاوی و انتخاب مدل بومی ویژه بیماران استان فارس با بالا ترین دقت تشخیص می باشد.
روش بررسیدر این مطالعه، تعداد 654 پرونده در دسترس از بیماران کلینیک تخصصی سرطان پستان مطهری شیراز به عنوان نمونه مورد استفاده قرار گرفت که بعد از عملیات پیش پردازش این تعداد به 621 پرونده کاهش یافت. برای هر کدام از نمونه ها دارای 22 ویژگی در پرونده پزشکی ثبت شده بود که در نهایت 10 ویژگی تاثیر گذار در ساخت مدل استفاده شد. از سه روش درخت تصمیم، بیز ساده و شبکه عصبی مصنوعی به منظور تشخیص ابتلا به سرطان پستان و روش 10-fold cross-validation برای ساخت و ارزیابی مدل بر روی مجموعه داده ی جمع آوری شده بهره گرفته شد.
یافته هانتایج به دست آمده از سه تکنیک ذکر شده نشان داد که هر سه مدل، نتایج امیدبخشی در تشخیص این سرطان دارند. در نهایت، شبکه عصبی مصنوعی، بالا ترین دقت 94/49%(حساسیت 96/19%، ویژگی 86/36%)، در تشخیص ابتلا به سرطان پستان به خود اختصاص داد.
نتیجه گیریبر طبق نتایج حاصل از درخت تصمیم ایجاد شده، ریسک فاکتورهایی چون سن، وزن، سن شروع قاعدگی، یائسگی، مدت زمان مصرف OCP و سن اولین بارداری از جمله عوامل موثر در ابتلای زنان به سرطان پستان در استان فارس شناخته شدند.
کلید واژگان: سرطان پستان, مدل تشخیص, درخت تصمیم, بیز ساده, شبکه عصبی, عوامل خطرزاBackground and AimBreast cancer is the most common type of cancer and the main cause of death from cancer in women worldwide. Technologies such as data mining, have enabled experts in this area to improve decision making in the early diagnosis of the disease. Therefore, the purpose of this research is to develop an automatic diagnostic model for breast cancer by employing data mining methods and selecting the model with the highest accuracy of diagnosis.
Materials and MethodsIn this study, 654 available patient records of Motahari breast cancer Clinic in Shiraz" were used as the sample. The number of records was reduced to 621 after the pre-processing operation. These samples had 22 features that ultimately used ten were used as effective features in the design of the model. Three types of Decision tree, Naive Bayes and Artificial neural network were used for diagnosis of breast cancer and 10-fold cross-validation method for constructing and evaluating the model on the collected data set.
ResultsThe results of the three techniques mentioned all three models showed promising results in detecting breast cancer. Finally, the artificial neural network accounted for the highest accuracy of 94/49%(sensitivity 96/19%, specificity 86/36%) in the diagnosis of breast cancer.
ConclusionBased on the results of the decision tree, the risk factors such as age, weight, Age of menstruation, menopause, OCP of records duration, and the age of the first pregnancy were among the factors affecting the incidence of breast cancer in women.
Keywords: Breast Cancer, Diagnostic Model, Decision Tree, Naive Bayes, Artificial Neural Network, Risk Factors -
زمینه وهدفاندومتریوز یکی از بیماری های شایع در زنان ایرانی است که منجر به ناباروری و کم باروری در آن ها می شود، بنابراین شناسایی علل ژنتیکی بیماری در زنان می تواند به درمان آن کمک کند. با توجه به اینکه توارث ژنتیکی به عنوان یکی از عوامل مهم خطرساز بیماری اندومتریوز می باشد لزوم تشخیص درست و زود هنگام این بیماری با توجه به عوارضی که در پی دارد دو چندان می شود. از این رو مطالعه ی حاضر جهت تعیین اثر برخی از موتاسیون های ژنی در بیماری اندومتریوز با روش های داده کاو ی انجام گردید.روش بررسیدر این پژوهش اثر 9 ژن دخیل در بیماری اندومتریوز بر روی افراد مبتلا به اندومتریوز و افراد سالم (جمعا 260 نمونه) بررسی شد. داده های مورد استفاده در این پژوهش، از مرکز درمان فوق تخصصی ناباروری پژوهشگاه فن آوری های نوین علوم زیستی جهاد دانشگاهی ابن سینا دریافت شد. مراحل اجرای پژوهش مبتنی بر فرایند استاندارد کریسپ در داده کاوی بود. مدل سازی به کمک چهار الگوریتم داده کاوی و در نرم افزارWeka 7/3 )University of Waikato، New Zealand( پیاده سازی شد.یافته هابا مقایسه ی چهار الگوریتم، مشاهده شد که مدلK-Star بالاترین میزان دقت را دارا می باشد و فیلتر اعمال شده بر روی ویژگی ها سبب کاهش درصد مدل ها شد ولی بر روی مدل MLP تاثیر مثبتی داشت. همچنین پایین ترین درصد مربوط به روش Naïve Bayes بود.نتیجه گیریمدلK-Star بدون اعمال هیچگونه فیلتر با نتیجه ای برابر 61/99 بالاترین میزان دقت را در تشخیص زود هنگام بیماری اندومتریوز دارا می باشد.کلید واژگان: داده کاوی, اندومتریوز, طبقه بندی, Weka, MLP, K, star, Naïve bayes, J48Background And ObjectiveEndometriosis is a prevalent disease in women which may lead to infertility or low fertility. Grasping the genetic grounds for the disease may contribute to its treatment because it is presumed that genetic factors predispose to endometriosis risk factors.Materials And Methods9 genes involved in endometriosis in patients suffering from endometriosis and also in healthy individuals (total 260 samples) were examined. The data were obtained from Ibn Sina (Jahad Daneshgahi) Research Center of new Technologies in Biological Sciences Institute. The study incorporated standard process Crisp for data mining. Weka data mining and software modeling were implemented with the aid of four algorithms.ResultsComparison of four algorithms implied prominent accuracy of K-Star model. Meanwhile, filtering, while reducing the percentage of models, presented a positive impact on the MLP model. The lowest percentage pertained to Naïve Bayes.ConclusionK-Star model without any filtering proved to have the highest accuracy in the early diagnosis of endometriosis.Keywords: Data Mining, Endometriosis, Classification, Weka, MLP, K, star, Naïve bayes, J48
-
مقدمهپیش بینی اهداف miRNA ها از اهمیت ویژه ای برخوردار است. توسعه روش های محاسباتی و متعاقبا صرفه جویی در هزینه و زمان پژوهش های آزمایشگاهی، تاثیر به سزایی در افزایش سرعت ساخت داروهای درمانی از جمله داروهای ضد سرطانی دارد. با توجه به این که زمان کمی از شناخت miRNA ها می گذرد، روند پژوهش ها در ابتدا کند بود. اما به مرور با شکل گیری دیتابیس های بیولوژیکی و درک اهمیت آن ها، دانشمندان بر روی این زمینه سرعت مطالعات و توجه خود را افزایش داده اند. تاکنون چندین روش کامپیوتری برای پیش بینی اهداف miRNAها ساخته شده است ولی اکثر این روش ها دارای نرخ بالایی از مثبت های اشتباه هستند و هنوز جا برای بهبود این روش ها وجود دارد. از آنجا که مطالعات جدید نشان می دهد که miRNAها در بافت های مختلف دارای اهداف متفاوتی هستند، هدف از این مقاله ارائه یک روش کامپیوتری برای پیش بینی اهداف، در سرطان سینه می باشد، تا به این طریق با اطمینان بیشتری بتوان به پیش بینی اهداف در این سرطان پرداخت.روشدر این پژوهش، ابتدا انواع ویژگی ها استخراج شده، سپس ویژگی های برتر توسط دو روش CFS و ReliefF انتخاب گردیدند. انواع مدل های هوشمند از جمله شبکه عصبی، ماشین بردار پشتیبان با سه هسته متفاوت، الگوریتم نائیوبیز و درخت تصمیم گیری Random Forest بر روی داده ها با روش اعتبارسنجی ضربدری 10تایی تست و نتایج آن ها با یکدیگر مقایسه و تحلیل شد. سپس برای تایید نتایج حاصل از داده های بیان ژن بهره گرفته شد.نتایجبا استفاده از این روش 124 اثر متقابل عملگر، شامل 21 miRNA و 38 mRNA، در سرطان مورد نظر پیش بینی گردید.نتیجه گیریاین رویکرد از لحاظ بیوانفورماتیکی برای سرطان سینه مورد تایید قرار گرفت اما برای تایید بیشتر این پیش بینی ها، نیاز به استفاده از روش های آزمایشگاهی می باشد.کلید واژگان: پیش بینی اهداف miRNA ها, سرطان سینه, ماشین بردار پشتیبان, بیزIntroductionPrediction of MicroRNAs (miRNAs) targets has a major importance. Development of calculating methods and also cost-effective and time-saving laboratory researches, has great effect on the production of therapeutic medicines like anti cancerous drugs. Since miRNAs have been recently identified, the researches trend was slow at first but by development of biologic databases and understanding its importance, scientists enhanced the speed of studies and paid more attention to this field. Until now, several computerized methods have been developed for prediction of microRNAs (miRNAs) targets but most of these methods have high false positive and further studies are required to improve these methods. Since, recent studies show that miRNAs have different targets in several tissues, this study aimed to provide a computerized method for prediction of miRNAs target in breast cancer.MethodIn this study, at first, all types of features were extracted, then, dominant features were selected via CFS and Relief methods. Smart models such as nervous network, Support Vector Machine with three different cores, Naïve Bayes algorithm and Random Forest decision tree using ten cross accreditation method were tested and its results compared and analyzed. In order to validate the results, gene expression profiling was used.ResultsAnalyzing miRNA and gene expression profiles, the classifier predicted 124 functional interactions involving 21 miRNAs and 38 mRNAs in breast cancer.ConclusionIn terms of bioinformatics, this approach was validated for breast cancer but for further validation, experimental methods also should be used.Keywords: MicroRNAs Targets Prediction, Breast Cancer, Support Vector Machine, Naïve Bayes
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.