جستجوی مقالات مرتبط با کلیدواژه « خوشه بندی » در نشریات گروه « پزشکی »
-
مقدمه
با ظهور چالش های جدید این صنعت، تلاش برای یافتن راهکارهای نوین جهت بهبود کیفیت خدمات، مدیریت بهینه منابع، و افزایش رضایت بیمه شدگان اهمیت بیشتری پیدا کرده است. یکی از رویکردهای مهم در بهبود این حوزه، استفاده از تکنیک های داده کاوی به منظور شناسایی الگوهای رفتاری بیمه شدگان در مراجعات سرپایی به موسسات تشخیصی و درمانی می باشد.
روش بررسیمطالعه حاضر از نوع توصیفی- مقطعی بوده و مجموعه داده های آن متعلق به اداره کل بیمه سلامت استان بوشهر است. پس از آماده سازی داده ها، تحلیل با استفاده از نرم افزار SPSS Clementine12.0 انجام گردید. برای مدل سازی الگوریتم K-means در دو حالت جمعیت شناختی و مبتنی بر (Recency-Frequency- Monetary)RFM شامل مقادیر زمان شروع بیمه، تعداد دفعات مراجعه و ارزش نوع بیمه اجرا شد تا ارتباط بین متغیرهای مختلف بدست آید. نمونه گیری با روش سرشماری انجام گردید. جامعه آماری شامل اطلاعات کلیه مراجعات سرپایی بیمه شدگان تحت پوشش بیمه سلامت استان بوشهر به تعداد 1,420,579 مراجعه در سال 1397 به مراکز تشخیصی درمانی است که با مراجعه مستقیم پژوهشگر به بانک اطلاعاتی اسناد پزشکی تهیه گردیده است.
یافته هامقدار شاخص ریشه میانگین مربع انحراف از معیار برای خوشه بندی مبتنی برRFM و جمعیت شناسی به ترتیب 21 و 21.65 است. و شاخص دان (Dunn) بهتر بودن خوشه بندی مبتنی بر RFM را تایید کرد. الگوریتم K-Means مبتنی RFM، داده ها را در 4 خوشه قرار داد به طوریکه 44 درصد بیمه شدگان در خوشه یک، 4 درصد در خوشه دو، 22 درصد در خوشه سه و 30 درصد در خوشه چهار قرار گرفتند. بر این اساس بیمه شدگان خوشه 2 شامل زنان دارای بیمه سایر اقشار با 4 درصد جمعیت به عنوان پرمراجعه ترین و خوشه 3 شامل زنان دارای بیمه روستایی با 22درصد جمعیت کم مراجعه ترین بیمه شدگان مشخص گردیدند.
نتیجه گیریمدل بدست آمده بیمه شدگان را در 4 خوشه قرارداد. این تحلیل به سازمان این امکان را می دهد که الگوهای مراجعه برای هر یک از این خوشه ها را نسبت به متغیرهای سن، جنسیت و نوع بیمه شناسایی نماید. نقطه قابل بهبود در این حیطه حفظ منافع بیمه شدگان و ارائه خدمات شایسته و درخور برای هر خوشه است. نتایج نهائی حاصل شده نشان دهنده وجود الگوهای مطلوب به عنوان یک ابزارتصمیم گیری مناسب جهت افزایش رضایت مندی بیمه شدگان در سازمان مطرح می گردد.
کلید واژگان: داده کاوی, خوشه بندی, بیمه سلامتIntroductionIn recent decades, the field of health insurance has emerged as one of the vital components of the healthcare system, propelled by continuous advancements in technology and the increasing complexity of medical services and technologies. With the advent of new challenges in this industry, there has been a heightened effort to find innovative solutions to enhance service quality, optimize resource management, and increase the satisfaction of insured individuals. One significant approach in improving this domain involves the application of data mining techniques to identify behavioral patterns among health insurance policyholders during outpatient visits to diagnostic and treatment facilities.
MethodsThe present study is a descriptive cross-sectional study. The claim data of health insurance in Bushehr province of Iran was used. After data preparation, analysis was performed using SPSS Clementine12.0 software. The values of insurance start time, number of visits, and the value of the type of insurance were used to model the K-means algorithm in two modes including demographic mode and Recency-frequency-monetary (RFM). Sampling was done by census method. The statistical population includes the information of all outpatient referrals of the insured covered by health insurance of Bushehr province to 1,420,579 referrals to diagnostic and medical centers in 2018, which has been prepared by the researcher’s direct referral to the database of medical records.
ResultsThe root mean square deviation values for RFM-based clustering and demographics are 21 and 21.65, respectively. And the Dunn’s Index confirmed the better RFM-based clustering. The RFM-based K-Means algorithm classified the data into four clusters, with 44% of the insured in Cluster One, 4% in Cluster Two, 22% in Cluster Three, and 30% in Cluster Four. Based on this, cluster 2 insured, including women with insurance of other classes with 4% of the population, were identified as the most referred, and cluster 3, including women with rural insurance, with 22% of the population, were identified as the least referred insured.
ConclusionThe obtained model divided the insured into 4 clusters. This model allows the organization to predict the referral patterns of each insurer based on their age, gender, and type of insurance and provide appropriate services for different clusters. By using these models and technique in decision making process, the insurers satisfaction will be improved.
Keywords: Data Mining, Clustering, Health Insurance -
مقدمه
استفاده از روش های آماری برای رسیدن به خوشه بندی و رتبه بندی سلامت در جامعه می تواند نمای مناسبی از وضعیت سلامت در استان های ایران را به دولتمردان ارایه دهد. هدف پژوهش حاضر خوشه بندی و رتبه بندی استان های ایران بر اساس برخی از شاخص های سلامت بود.
مواد و روش کارمطالعه حاضر از نوع کاربردی بود که به روش توصیفی-تحلیلی اجرا شد. در این مطالعه شاخصهای تعداد کارکنان شاغل در دانشکده های علوم پزشکی، پزشکان، پیراپزشکان، بیمارستان، تخت های فعال، مراکز ارایه دهنده مراقبت اولیه بهداشتی، آزمایشگاه ها، مراکز توانبخشی، مراکز پزشکی هستهای، درمانگاه و پایگاه اورژانس به عنوان شاخص های سلامت 31 استان کشور جهت خوشه بندی و رتبه بندی در نظر گرفته شد. داده های مورد نیاز از سالنامه های آماری مرکز آمار ایران جمع آوری و برای خوشه بندی و رتبه بندی استفاده شد. خوشه بندی و مصورسازی داده ها با استفاده از نرم افزار R و رتبه بندی با استفاده از نرم افزار تاپسیس انجام شد.
یافته هابر اساس نتایج استانهای ایلام، یزد، سمنان، خراسان جنوبی، زنجان، اردبیل، فارس، کهگیلویه و بویراحمد و چهارمحال و بختیاری به ترتیب بیشترین امتیاز سلامت را داشتند که بر اساس روش خوشه بندی نیز در خوشه سوم قرار گرفتند. کمترین امتیازات نیز متعلق به خوشه اول بود. در این خوشه، استان های قم، تهران، البرز و همدان به ترتیب با امتیازهای 0/552، 0/540، 0/460 و 0/36 رتبه های 28 الی 31 را داشتند. همچنین استان های خوشه دوم با امتیاز تقریبا برابر در رتبه های 10 الی 27 قرار گرفتند.
نتیجه گیریبه منظور رسیدن به عدالت در سلامت باید شاخص های آن در استان های همدان، البرز، تهران و قم تا رسیدن به سرانه استاندارد ارتقا یابد.
کلید واژگان: تاپسیس, خوشه بندی, رتبه بندی, شاخص های سلامتPayesh, Volume:23 Issue: 1, 2024, PP 7 -17Objective (s)The use of statistical methods to reach the clustering and ranking of health in the society can give a proper view of the state of health in Iranian provinces. The aim of the current research was to cluster and rank Iranian provinces based on some health indicators.
MethodsThis was a descriptive study. Clustering and ranking Iranian provinces were carried out according to several items such as the number of employees working in faculties of medical sciences, doctors, paramedics, hospitals, active beds, primary health care providers, laboratories, rehabilitation centers, nuclear medicine centers, clinics and emergency centers. The data were collected from the statistical yearbooks of the provinces. Clustering analysis and data visualizations were performed in R software and ranks were obtained using Topsis software.
ResultsThe results showed that the provinces of Ilam, Yazd, Semnan, South Khorasan, Zanjan, Ardabil, Fars, Kohgiluyeh and Boyer Ahmad, and Chaharmahal and Bakhtiari had the highest health scores and belonged to the third cluster. Their ranks were 1 to 9 respectively. In the first cluster the following provinces were observed: Qom, Tehran, Alborz, and Hamedan with scores of 0.552, 0.540, 0.460, and 0.36 respectively indicating that these provinces had the lowest health scores and their ranks were 28 to 31. The other provinces appeared on the second cluster and ranked 10 to 27 with almost equal scores.
ConclusionIn order to achieve health equity, the indicators should be improved in provinces belonged to the first cluster to in order to achieve the standard per capita.
Keywords: Topsis, Clustering, Ranking, Health indicators -
سابقه و هدف
ترکیب سیستم های بازیابی مبتنی بر هستی شناسی موجب بازیابی معنایی کلمات می شود. هدف از پژوهش حاضر بررسی مقالات حوزه هستی شناسی در بازیابی اطلاعات با استفاده از تکنیک های علم سنجی است.
مواد و روش هاپژوهش حاضر با استفاده از روش اسنادی و تحلیل خوشه بندی واژگان انجام شده است. جامعه پژوهش شامل 2595 مقاله نمایه شده در دو پایگاه اسکوپوس و وب آو ساینس طی بازه زمانی 2001 تا 2023 است. تجزیه و تحلیل داده های پژوهش با کمک نرم افزار Excel، Bibexcel، SPSS 26، و نرم افزار UciNet صورت گرفت. ترسیم نقشه های پژوهش نیز با نرم افزار VOSviewer انجام شد.
یافته هارشد مقالات در زمینه هستی شناسی و بازیابی اطلاعات کم و نرخ رشد سالانه آن به طور متوسط برابر با 0/11% است. دانشگاه Stanford و California با همکاری در 6 مقاله و حوزه علوم کامپیوتر با نگارش 43% از مقالات، پرکارترین سازمان و حوزه بودند. خوشه بندی واژگان، منجر به تشکیل 4 خوشه موضوعی؛ بازیابی معنایی اطلاعات، هستی شناسی غیر انسانی، طبقه بندی سیستم ها و نقش فناوری شد. همچنین همبستگی مثبتی بین تولید علم و مرکزیت ها (مرکزیت درجه 0/323، مرکزیت نزدیکی 0/278 و مرکزیت بینابینی 0/447) وجود دارد.
نتیجه گیریسیر تکامل واژگان به کار رفته در مقالات نشان داد که اگرچه رشد تولید مقاله این حوزه از ابتدا افزایشی بوده؛ ولی پیشرفت فناوری های هستی شناسی در بازیابی اطلاعات از آغاز از یک سیستم معنایی ضعیف به نام طبقه بندی اطلاعات آغاز شده و با پشت سر گذاشتن مراحل تکامل خود در حال حاضر با بهره گیری از یادگیری ماشین، در پی درک خواسته های کاربران و پردازش اطلاعات با کمک هوش مصنوعی است.
کلید واژگان: هستی شناسی, بازیابی اطلاعات, بازنمون دانش, علم سنجی, خوشه بندی, هم رخدادی واژگانBackground and aimThe combination of ontology-based retrieval systems leads to the semantic retrieval of words. The aim of this study was to review ontology articles in information retrieval using scientometric techniques.
Materials and methodsThe present study was conducted using the documentary method and word cluster analysis. The research population comprised 2595 articles indexed in two databases, Scopus and Web of Science, from 2001 to 2023. The data were analyzed using Excel, BibExcel, SPSS 26 and UCINET. VOSviewer was used to draw research maps.
FindingsThe growth of articles in ontology and information retrieval was low and the annual growth rate averaged 0.11%.Stanford and California universities were the most prolific organizations, contributing to 6 articles, and the field of computer science was the most prolific with 43% of the articles written. The word clustering led to the formation of 4 thematic clusters: semantic retrieval of information, non-human ontology, classification of systems, and role of technology. In addition, there was a positive correlation between science production and centralities (degree centrality 0.323, closeness centrality 0.278, and betweenness centrality 0.447).
ConclusionThe evolution of the words used in the articles has shown that although the growth of article production in this field has increased from the beginning, the development of ontology technologies in information retrieval started with a weak semantic system called information classification, and after the various stages of development, it now uses machine learning to understand user requirements and process information with the help of artificial intelligence.
Keywords: Ontology, Information retrieval, Knowledge retrieval, Scientometrics, Clustering, Word co-occurrence -
زمینه و اهداف
حجم بسیار بالای انتشارات معتبر COVID-19 در سراسر جهان، ضرورت پایش و تحلیل متون علمی COVID-19 را برای پژوهشگران در سطح خرد و برای سیاست گذاران و برنامه ریزان در سطح کلان بیش از پیش آشکار می سازد. به بیان دیگر، نتایج منتج از تحلیل مدارک منتشرشده COVID-19 با روش ها و تکنیک های متنکاوی از جایگاه و اهمیت ویژهای برای پژوهشگران، سیاست گذاران و برنامه ریزان علوم پزشکی در سطح ملی و بین المللی برخوردار است و ضرورت انجام چنین پژوهشی را بیش از پیش آشکار می سازد. هدف اصلی پژوهش حاضر شناسایی موضوعات نو ظهور و روند تغییر در واژگان علمی در سطح ملی و بین المللی حوزه موضوعی COVID-19 با روش متن کاوی است.
مواد و روش کارنوع پژوهش حاضر، کاربردی است. این پژوهش با استفاده روش متن کاوی و الگوریت مها و تکنیک های مربوط به آن و همچنین طبقه بندی متون با رویکرد تحلیلی-تطبیقی انجام شده است. جامعه پژوهش حاضر شامل کلیه انتشارات COVID-19 نمایه شده در پایگاهPubMed Central® (PMC) است. تا تاریخ بیست خردادماه سال 1400 تعداد رکوردهای بازیابی شده از پایگاه PubMed Central® (PMC)، 160862 مورد بود. از این تعداد 3143 مورد انتشارات ملی و 157719 مورد انتشارات بین المللی COVID-19 است. در این پژوهش از زبان برنامه نویسی پایتون و کتابخانه های مرتبط با این برنامه استفاده شد. مهم ترین واژگان بر اساس وزن دهی TF-IDF نیز شناسایی و گزارش شد. موضوعات نوظهور با توجه به رشد میانگین وزنی، شناسایی شدند.
یافته هاتحلیل داده ها حاکی از آن است که “covid”، “infect” و “cell” از مهم ترین واژگان بکار رفته در انتشارات بین المللی COVID-19 و “patient”، “SARS-Cov” و “covid” مهم ترین واژگان انتشارات ملی هستند.
نتیجه گیریدر خصوص روند تغییرات واژگان مورد استفاده در انتشارات COVID-19 از مهمترین نتایجی که میتوان استنباط نمود تفاوت اساسی بین مهمترین واژه های انتشارات بین المللی با ملی و تاکید پژوهش های بین الملل بر کرونا و عفونت ناشی از آن و در سطح ملی بر بیماران و کرونا است. نتیجه مهم دیگر تغییرات سالانه بوجود آمده در واژه ها در سطح انتشارات ملی و بین المللی است. شایان ذکر است که تغییرات واژه ها به خصوص در انتشارات ملی و بین المللی همراستا با اتفاقات و رویدادهای مهم علمی است.
کلید واژگان: کووید-19, متن کاوی, فراوانی وزنی تی اف-آی دی اف, طبقه بندی, خوشه بندی, موضوعات نوپدید, پایتونBackground and AimThe results from the analysis of COVID-19 literature by employing text-mining techniques are of particular importance for researchers, policymakers, and planners of medical sciences at the national and international levels, avoiding parallel research and waste of time and budget. The paper explore emerging topics and the trend of scientific words at the national and international levels in the subject area of COVID-19.
Materials and MethodsThis applied research was conducted by employing the text-mining and its related algorithms and classifying texts. The population consists of all COVID-19 articles indexed in PubMed Central® (PMC). The number of records retrieved was 160,862 items until June 10, 2021. Among these, 3143 national and 157,719 international COVID-19 articles. Python and its related libraries were applied. The most significant words were also identified and reported based on TF-IDF weighting. Emerging topics were identified according to the weighted average growth.
Results"COVID", "infect", and "cell" were among the most important words used in international COVID-19 articles. In addition, the most important words in the national COVID-19 articles were "patient", "SARS-Cov", and "COVID".
ConclusionAmong the most important conclusions that can be inferred from the trend of word change used in the COVID-19 literature is that the most significant words in international literature differ significantly from those in national literature, as international research focuses on COVID-19 and the infections caused by it. In contrast, national research focuses on COVID-19 and patients. Another significant result is the annual word-changing national and international literature.
Keywords: Covid-19, Text Mining, TF-IDF, Classification, Clustering, Emerging Topics, Python -
زمینه
از زمان شروع همه گیری کووید-19 تاکنون کشورهای بسیاری درگیر مبارزه با این بیماری شده اند. شیوع این بیماری آسیب های زیادی به کشورها از جنبه های گوناگونی مانند صدمه به نیروی انسانی، وضعیت اقتصادی، رفاه اجتماعی و سایر موارد، وارد کرده است. هدف این پژوهش ارزیابی عملکرد کشورها در مواجهه با کوید-19 با در نظر گرفتن نقش واکسیناسیون بوده است. همچنین این مطالعه براساس یافته های تحقیق راهکارهای اجرایی را برای بهبود وضعیت کشورهای با عملکرد ضعیف تر ارایه کرده است.
روش کاردر این پژوهش یک روش سه فازی برای ارزیابی عملکرد کشورها در مواجهه با کووید-19 توسعه داده شد. در فاز اول، 88 کشور با استفاده از الگوریتم k-means خوشه بندی شدند. در فاز دوم مدل تحلیل پوششی داده یکبار بر روی خوشه ها و بار دیگر بر روی تمامی کشورها بدون در نظر گرفتن خوشه ها پیاده سازی شد. در فاز سوم، بعد از ارایه مفهوم تاب آوری در دوران کرونا، مدل تحلیل سلسله مراتبی با سه معیار شامل نتایج حاصل از مدل تحلیل پوششی داده بدون در نظر گرفتن خوشه ها، نتایج مدل تحلیل پوششی داده با در نظر گرفتن خوشه ها و تاب آوری، اجرا شده و رتبه بندی عملکرد کشورها در مواجهه با کووید-19 ارایه شد.
یافته هابراساس نتایج، 15 رتبه عملکردی برای کشورها در مواجهه با کووید-19 به دست آمد که در این میان، کشورهای چین، فیجی، سیشل، قرقیزستان و تانزانیا دارای بالاترین رتبه بوده و کشورهای بنگلادش، نپال، گرجستان و پاکستان پایین ترین سطح عملکرد را داشتند. ایران در رتبه ششم و در جایگاه متوسط عملکردی کشورها قرار داشت.
نتیجه گیریبر اساس یافته های این مطالعه، کشورهایی که در رتبه های پایین از نظر عملکرد سیستم سلامت در مواجهه با کووید-19 قرار دارند لازم است استراتژیها و راهکارهایی در حوزه های مختلف شامل برنامه ریزی و تصویب برنامه های کنترل و جلوگیری از شیوع بیماری، اعمال قرنطینه و محدودیت در اجتماعات، برنامه ریزی و اجرای استراتژی های مناسب در خصوص صادرات و واردات داروها و تجهیزات پزشکی، تخصیص بودجه های مناسب برای پروژه های تحقیقاتی در زمینه کووید-19، ممنوعیت صادرات داروهای موثر در درمان کرونا، و ارایه اطلاعات دقیق و به روز برای آگاه سازی افراد، اتخاذ کنند تا بتوانند وضعیت عملکردی خود را بهبود دهند.
کلید واژگان: کووید-19, سیستم سلامت, تحلیل پوششی داده, فرآیند تحلیل سلسله مراتبی, خوشه بندی, تاب آوریBackgroundSince the beginning of the Covid-19 epidemic, many countries have been involved in fighting the disease. The outbreak of this disease has caused irrecoverable damages to countries in various aspects such as human resources, economic situation, and social welfare. The purpose of this study was to evaluate the performance of world countries in the face of covid-19 in respect of the role of vaccination and to propose applicable approaches for countries with lower performance.
MethodsIn this research, a three-phase method was developed to evaluate the performance of 88 countries in the face of Covid-19. In the first phase, the countries were clustered, using the k-means algorithm. In the second phase, the data envelopment analysis model was implemented once on the clusters and then on all the countries without considering the clusters. In the third phase, after presentation of the concept of resilience in the Covid-19 era, an Analytic Hierarchy Process was implemented with three criteria, including the results of data envelopment analysis model without considering the clusters, the results of data envelopment analysis model considering the clusters and resilience, and then the ranking of the countries' performance in the face of Covid-19 was provided.
ResultsBased on the results, 15 performance scores were obtained for the countries in the face of Covid-19, among which China, Fiji, Seychelles, Kyrgyzstan and Tanzania had the highest rankings and Bangladesh, Nepal, Georgia and Pakistan had the lowest performance levels. Iran is in the sixth place and in the average performance position of the countries.
ConclusionBased on the findings of this study, the countries with low performance level in the face of Covid-19 need to apply various strategies in different areas in order to improve their performance level. These strategies include planning and approval of joint programs to control and prevent the spread of disease, applying quarantine policy and restrictions on communities, planning and implementation of appropriate strategies regarding the export and import of drugs and medical equipment, allocating appropriate funds to research projects on Covid-19, banning the export of drugs effective in the treatment of Covid-19, and providing accurate and up-to-date information for raising people’s awareness.
Keywords: Covid-19, Health Care Systems, Data Envelopment Analysis, Analytic Hierarchy Process, Cluster Analysis, Resilience -
مقدمه
هدف از انجام پژوهش حاضر، خوشه بندی دانشجویان با نیم رخ های باورهای انگیزشی و جهت گیری هدف پیشرفت بالا و پایین، از لحاظ عملکرد تحصیلی بود.
روش هاروش تحقیق این مطالعه، از نوع همبستگی و جزء طرح های خوشه بندی بود. جامعه آماری، کلیه دانشجویان ورودی دانشگاه علوم پزشکی شهر کرمانشاه در سال تحصیلی 98-1397 بودند که به روش نمونه گیری طبقه ای نسبی انتخاب شدند. داده ها از طریق پرسشنامه های استاندارد راهبردهای انگیزشی برای یادگیری پینتریچ و دی گروت، جهت گیری هدف پیشرفت الیوت و مک گریگور و برای سنجش عملکرد تحصیلی از میانگین نمرات دروس دانشجویان (معدل نیمسال) به صورت خودگزارش دهی استفاده شد. تحلیل اطلاعات به دست آمده با استفاده از نرم افزارSPSS و روش های آمارتوصیفی و آمار استنباطی تحلیل خوشه ای، تجزیه تابع تشخیص و آزمون تی برای گروه های مستقل استفاده شد.
یافته هابراساس نتایج پژوهش، دو خوشه برای دانش آموزان شناسایی گردید. نخستین خوشه، با باورهای انگیزشی و جهت گیری هدف پیشرفت بالا، خوشه انگیزش بالا- گرایش و خوشه دوم با باورهای انگیزشی و جهت گیری هدف پیشرفت پایین، به عنوان خوشه انگیزش پایین- اجتناب نامیده شد. در ادامه برای تایید خوشه بندی، تجزیه تابع تشخیص انجام گرفت که نتایج حاکی از تایید خوشه بندی بود، آزمون تی با سطح معنی داری 01/0 نشان داد بین دو خوشه از نظر عملکرد تحصیلی تفاوتی معنی دار وجود دارد.
نتیجه گیریباورهای انگیزشی و جهت گیری هدف پیشرفت بالا از عوامل مهم در افزایش عملکرد تحصیلی دانشجویان به شمار می آیند.
کلید واژگان: خوشه بندی, باورهای انگیزشی, جهت گیری هدف پیشرفت, عملکرد تحصیلی, دانشجویانIntroductionThe purpose of this study was to cluster students with profiles of motivational beliefs and orient the goal of high and low achievement in terms of academic performance.
MethodsThe research method of this study was correlational and part of clustering schemes. The statistical population was all incoming students of Kermanshah University of Medical Sciences in the academic year of 1397-98 who were selected by stratified relative sampling method. Data were used through standard motivational strategies questionnaires for Pintrich and Digrott learning, Elliott and McGregor achievement goal orientation, and self-reported student average scores (semester grade point average) to assess academic performance. Data analysis was performed using SPSS software and descriptive statistics and inferential statistics. Cluster analysis, diagnostic function analysis and t-test were used for independent groups.
ResultsBased on the research results, two clusters were identified for students. The first cluster, with motivational beliefs and high achievement goal orientation, was called high motivation-orientation cluster and the second cluster with motivational beliefs and low progress goal orientation was called low motivation-avoidance cluster. Then, to confirm the clustering, the analysis of the diagnostic function was performed, which showed that the clustering was confirmed. The t-test with a significance level of 0.01 showed that there is a significant difference between the two clusters in terms of academic performance.
ConclusionIt can be concluded that motivational beliefs and high achievement goal orientation are important factors in increasing studentschr('39') academic performance.
Keywords: Clustering, Motivational Beliefs, Progression Orientation, Academic Performance, Students -
زمینه و هدف
آسم یک بیماری مزمن غیرقابل درمان، اما قابل کنترل است که پزشکان جهت دستیابی به سطح مطلوب کنترل بیماری، نظارت مداوم بر علایم و همچنین تنظیم یک برنامه درمانی مبتنی بر خودمراقبتی را پیشنهاد می نمایند. ارایه این برنامه، مطابق با سطح کنترلی که بیمار در آن قرار دارد، تنظیم میگردد. لذا ارزیابی و دسته بندی دقیق سطح کنترل آسم، می تواند در ارایه برنامه درمانی موثر به بیمار حایز اهمیت بوده و موجب بهبود خودمراقبتی و توسعه ی مداخلات پیشگیرانه جهت کاهش علایم آسم شود.
روش بررسیدر این مقاله، داده های 96 بیمار آسمی شامل اطلاعات دموگرافیک، متغیرهای بالینی و سوابق پزشکی بیمار، داده های زیست محیطی موثر بر آسم، معیارهای عملکرد ریه و گروه محرک مبتنی بر پرسش نامه های کنترل آسم، در یک دوره زمانی 9 ماهه از یک بیمارستان تخصصی بیماریهای ریوی تهران جمع آوری و در یک پایگاه داده چندمتغیره و چندکلاسه تجمیع شده و سپس سطح کنترل آسم با کمک یک مدل تلفیقی مبتنی بر خوشه بندی فازی و الگوریتمهای با نظارت در یادگیری ماشین دسته بندی شده است.
یافته هامدل پیشنهادی برای ارزیابی سطح کنترل آسم که حاصل عملیات متوازن سازی، خوشه بندی فازی و انتخاب مشخصه بر روی داده هاست، دقتی به میزان 88% ارایه نموده است.
نتیجه گیریمدل حاضر، علاوه بر کمک به پزشکان برای شناسایی دقیق تر سطح کنترل آسم، می تواند در سیستم های الکترونیکی خودمراقبتی به منظور ارایه هشدارهای شخصی شده در مورد احتمال تضعیف کنترل آسم به کار رود. این چنین ابزارهایی می توانند مراقبت از آسم را از رویکرد مراقبتی واکنشی به یک رویکرد پیشگیرانه ارتقا دهند که در آن تصمیم ها و اقدام های درمانی از سوی پزشک ناشی از سطح کنترل آسم مزمن و پیشگیری از آسم حاد باشد.
کلید واژگان: کنترل آسم, پیشگیرانه, خوشه بندی, دسته بندی با ناظر, خودمراقبتیBackground and AimAsthma is a common and chronic disease of respiratory tracts. The best way to treat Asthma is to control it. Experts of this field suggest the continues monitoring on Asthma symptoms and adjustment of self-care plan with offering the preventive treatment program to have desired control over Asthma. Presenting these plans by the physician is set based on the control level in which the patient is. Therefore, successful recognition and classification of the disease control level can play an important role in presenting the treatment program to the patient and improves the self-care and strengthens the early interventions to alleviate the Asthma symptoms.
Materials and MethodsBased on this objective, we collected the data of 96 Asthma patients within a 9-month period from a specialized hospital for pulmonary diseases in Tehran. Then we classified the Asthma control level by fuzzy clustering and different types of data mining method within a multivariate dataset with the multi-class response variable.
ResultsOur best model resulting from the balancing operations and feature selection on data have yielded the accuracy of 88%.
ConclusionOur proposed model can be applied in electronic Asthma self-care systems to support the decision in real time and personalized warnings on the possible deterioration of Asthma control. Such tools can centralize the Asthma treatment from the current reactive care models into a preventive approach in which the physician’s decisions and therapeutic actions are resulting from the personal patterns of chronic Asthma control and prevention of acute Asthma.
Keywords: Asthma Control, Preventive, Clustering, Classification, Self-Care -
مجله دانشکده پزشکی دانشگاه علوم پزشکی مشهد، سال شصت و سوم شماره 2 (پیاپی 170، خرداد و تیر 1399)، صص 2358 -2368مقدمه
دیابت یک اختلال سوخت و سازی در بدن است که توانایی تولید هورمون انسولین در بدن از بین می رود . هدف کلی از انجام پژوهش حاضر کشف دانش نهفته در داده های بیماران دیابتی است، که می تواند به پزشکان در خوشه بندی بیماران جدید و تجویز داروی مناسب مطابق هر خوشه کمک نماید.
روش کاردر این مقاله از الگوریتم MR-VDBSCAN استفاده شده است. پیاده سازی این الگوریتم در بستر هدوپ مبتنی بر چارچوب نگاشت-کاهش می باشد. ایده اصلی تحقیق استفاده از چگالی محلی برای یافتن چگالی هر نقطه است. این استراتژی میتواند مانع از اتصال خوشهها با چگالی های متفاوت شود.
نتایجالگوریتم موردنظر بر روی دیتا ست انتخاب شده، تست و ارزیابی و نتایج نشان از دقت بالا و کارایی و مقیاس پذیری آن دارد. نتایج بدست آمده با نتایج اجرای خوشه بندی k-Means مقایسه شد، الگوریتم MR-VDBSCAN در مقایسه با آن از سرعت اجرای بالاتر و دقت تشخیص بهتری برخوردار هست و همچنین توانایی تشخیص خوشه ها با چگالی متفاوت برتری این الگوریتم نسبت به الگوریتم مورد مقایسه است. نتایج نشان می دهد که الگوریتم MR-VDBSCAN میتواند عملکرد بهتر را از سایر الگوریتم ها فراهم کند.
نتیجه گیرینتایج نشان می دهد که که الگوریتم MR-VDBSCAN نسبت به الگوریتم K-means خوشه-بندی بهتری را انجام می دهد و می تواند بیماران را در زیرگروههایی قرار دهد که پزشکان را در تجویز یاری نماید. نتیجه پیش بینی شده برای تشخیص اینکه کدوم گروه سنی و جنسیت بیشتر تحت تاثیر دیابت قرار دارند، استفاده می شود.
کلید واژگان: خوشه بندی, هدوپ, مپ ردیوس, داده انبوه, دیابت, داده کاویAnalysis of Diabetic Patients' Data for Clustering and Prescription Drug Based on Proposed AlgorithmIntroduction:
Diabetes is a metabolic disorder in the body that is impaired by the ability to produce insulin hormone. The main purpose of the present study is to discover the hidden knowledge in the data of diabetic patients, which can assist clinicians in clustering new patients and prescribing appropriate medication according to each cluster.
MethodsIn this paper, we use MR-VDBSCAN algorithm. The implementation of this algorithm is based on the map-reduce framework of Hadoop. The main idea of the research is to use local density to find the density of each point. This strategy can prevent clusters from joining at different densities.
ResultsThe algorithm is based on the selected dataset, tested and evaluated, and the results show high accuracy and efficiency. The results were compared with the results of k-Means clustering, The MR-VDBSCAN algorithm has a higher execution speed than that of the algorithm and has the ability to detect clusters with different density of superiority of this algorithm than the comparable algorithm. The results show that the MR-VDBSCAN algorithm can provide better performance than other algorithms. In particular, the similarity of the proposed algorithm is 97% for the diabetes set.
ConclusionThe results show that the MR-VDBSCAN algorithm performs better clustering than the K-means algorithm and can place patients into subgroups that assist physicians in prescribing.
Keywords: Data mining, Clustering, Hadoop, Map-Reduce, Big data, Diabetic -
سابقه و هدف
هدف این پژوهش تحلیل و مصورسازی تولیدات علمی پژوهشگران دانشگاه آزاد اسلامی در موضوع علوم پزشکی در پایگاه وب-آوساینس بود.
روش بررسیپژوهش حاضر از نوع پژوهش های کاربردی علم سنجی بود که عملکرد کمی حوزه علوم پزشکی دانشگاه آزاد اسلامی در پایگاه وب آو ساینس را از ابتدا تا 2018 میلادی مورد مطالعه قرار داد. جامعه آماری این پژوهش کلیه تولیدات علمی علوم پزشکی دانشگاه آزاد اسلامی (11155 رکورد) در پایگاه وب آو ساینس بود.
یافته هااولین تولید علمی علوم پزشکی دانشگاه آزاد اسلامی در پایگاه وب آو ساینس در سال 1996 و بیشترین در سال 2016 نمایه شده است. کاظم پریور رتبه اول را در پژوهشگران کسب و بیشترین همکاری علمی پژوهشگران با کشور آمریکا بود. نشریه African Journal of Biotechnology هم به عنوان منبع هسته علوم پزشکی دانشگاه آزاد اسلامی در پایگاه وب آوساینس شناخته شد. بیشترین بسامد را کلید واژه "ایران" داشت و کلیدواژه های "شیمی دارویی" و "داروشناسی و داروسازی" بیشترین همایندی واژگان را داشتند. در نهایت، کلیدواژه های تولیدات علمی دانشگاه آزاد اسلامی در زمینه علوم پزشکی در 7 خوشه کلی تقسیم بندی شد.
نتیجه گیرینتایج پژوهش بیانگر این است که پژوهشگران علوم پزشکی دانشگاه آزاد اسلامی توانسته اند با تلاش خوبی رتبه سوم را در بین دانشگاه های علوم پزشکی کشور از پایگاه وب آوساینس کسب کنند. اما، پتانسیل لازم را در شناساندن پیشرفت های ایران در کنترل شیوع بیماری های مسری در سطح جهانی صرف نکرده اند.
کلید واژگان: علم سنجی, نقشه علمی, تولیدات علمی, خوشه بندی, پایگاه وب آو ساینس, علوم پزشکی, دانشگاه آزاد اسلامیMedical Science Journal of Islamic Azad Univesity Tehran Medical Branch, Volume:30 Issue: 2, 2020, PP 204 -220BackgroundThe aim of this research was to analyze and illustrate scientific productions of Islamic Azad University researchers under title of Medical Sciences in Web of Science (WOS) data base.
Materials and methodsThe present study was a kind of applied scientific research which studied the quantitative performance of Islamic Azad University of Medical Sciences in WOS database from beginning to 2018. Statistical population of this study was all scientific productions of Medical Sciences of Islamic Azad University (11155 records) in WOS database.
ResultsThe first scientific output of medical sciences of Islamic Azad University was indexed in 1996 and the highest number of indexed output was in 2016. Kazem Parivar has been ranked the first among all researches and had the highest scientific collaboration was with the USA academic centers. The journal "African Journal of Biotechnology" was also recognized as the source of the medical science core of the Islamic Azad University on the Web of Science. The most frequently use key word was "Iran" and key words "Pharmaceutical Chemistry" and "Pharmacology and Pharmacy" had the most frequent synonyms. Finally, the keywords of Islamic Azad University's scientific productions in medical sciencesweare divided into 7 general clusters.
ConclusionThe results of this study indicate that Islamic Azad University of Medical Sciences researchers have been able to obtain the third rank among the medical universities of Iran with a good effort. But they have not used their potential to recognize Iran's progress in controlling the spread of communicable diseases worldwide.
Keywords: Scientometrics, Scientific products, Clustering, Web of Science database, Medical sciences, Islamic Azad University -
مقدمه
استفاده از فناوری «توالی یابی RNA سلول-منفرد» باعث شناخت بهتر ساختارهای سلولی شده و داده های با وضوح بسیار بالایی از بیان ژن های مختلف هر سلول را در یک زمان واحد ارایه می دهد. یکی از زمینه های پرکاربرد در این حوزه، خوشه بندی داده ها بر اساس ژن های بیان شده است که بعضا منتج به شناسایی جمعیت های سلولی جدید می گردد. عملکرد روش های پیشنهادی عمدتا به شکل جمعیت ها و ابعاد داده ها بستگی دارد؛ لذا توسعه یک روش که بتواند فارغ از این موانع به شناسایی جمعیت های سلولی بپردازد، بسیار مهم است.
روشدر روش پیشنهادی که یک روش کتابخانه ای بود، ابتدا تعداد جمعیت های سلولی تخمین زده شد. این تخمین از آن جهت اهمیت دارد که در دنیای واقعی، اطلاعات اولیه مثل تعداد و نوع جمعیت های سلولی در دسترس نیست. سپس با استفاده از یک کرنل گاوسی مبتنی بر گراف، ضمن کاهش ابعاد مسیله، اقدام به شناسایی جمعیت های سلولی با روش خوشه بندی kmeans++ شد.
نتایجنتایج پیاده سازی نشان داد که روش پیشنهادی می تواند نسبت به سایر روش های یادگیری ماشین ارایه شده در این زمینه، بهبود قابل قبولی را حاصل کند. به عنوان مثال برای معیار ARI، مقادیر 100، 93/47 و 84/69 به ترتیب برای مجموعه داده های سلول-منفرد Kolod، Buettner و Usoskin حاصل شد.
نتیجه گیریروش پیشنهادی بدون هیچ اطلاعات اولیه در مورد تعداد و نوع جمعیت های سلولی و فارغ از ابعاد بالای مسیله، می تواند اقدام به خوشه بندی و در نتیجه شناسایی جمعیت های سلولی با دقت و کیفیت بالایی نماید.
کلید واژگان: توالی یابی RNA سلول-منفرد, خوشه بندی, شناسایی جمعیت های سلولی, کرنل گاوسی مبتنی بر گرافIntroductionThe emergence of single-cell RNA-sequencing (scRNA-seq) technology has provided new information about the structure of cells, and provided data with very high resolution of the expression of different genes for each cell at a single time. One of the main uses of scRNA-seq is data clustering based on expressed genes, which sometimes leads to the detection of rare cell populations. However, the results of the proposed methods mainly depend on the shape of the cell populations and the dimensions of the data. Therefore, it is very important to develop a method that can identify cell populations regardless of these obstacles.
MethodIn the proposed method, which was a library method, at first, the number of clusters (cell populations) was estimated. Estimating the number of clusters is important because in the real world, basic information such as the number and type of cell populations is not available. Thereafter, using a graph-based Gaussian kernel, while reducing the dimensions of the problem, the cell populations were identified by means of the kmeans++ clustering.
ResultsThe results of the implementation showed that the proposed method can achieve an acceptable improvement compared to other machine learning methods presented in this regard. For example, for the ARI criterion, values of 100, 93.47 and 84.69 were obtained for Kolod, Buettner, and Usoskin single-cell data sets, respectively.
ConclusionThe proposed method can cluster and thus identify cell populations with high accuracy and quality without having any basic information about the number and type of cell populations, regardless of the high dimensions of the problem.
Keywords: Single-cell RNA-sequencing, Clustering, Identification of Cell Populations, Graph-based Gaussian Kernel -
زمینه و هدف
امروزه با افزایش تقاضای درمان، بیماران با کمک اینترنت اشیا مراقبت و پایش می شوند. فناوری های پایش جسمی بیمار در محیط اینترنت اشیا شامل اندازه گیری ضربان قلب، فشارخون، قند خون و دیگر علائم حیاتی هستند. هدف مقاله، ارائه مدل خوشه بندی فناوری های مذکور با استفاده از تکنیک های داده کاوی است تا مناسب ترین فناوری، طبق نیازها و ویژگی های کاربر انتخاب شود.
مواد و روش هاپژوهش حاضر، مروری و از منظر نتیجه کاربردی می باشد. داده ها شامل شش مشخصه منحصربه فرد 60 فناوری منتخب، شامل کاربرد، قیمت، نحوه اتصال، منبع تغذیه، مکان استفاده و نوع استفاده می باشد که از سایت های توسعه و تبلیغات فناوری ها و همچنین بررسی مقالات مرتبط استخراج شده است. روش تجزیه وتحلیل داده ها، تکنیک خوشه بندی و الگوریتم K-medoids است. هم چنین برای شناسایی موثرترین مشخصه ها، از الگوریتم جنگل تصادفی استفاده شده است.
یافته هامدل ارائه شده، با در نظر گرفتن مشخصه های انتخاب شده کاربر به عنوان ورودی، خوشه ای از فناوری ها را به عنوان خروجی مدل ارائه می دهد. مطابق با الگوریتم، داده ها در بهترین حالت در چهار دسته خوشه بندی شدند. شاخص سیلوئت برای چهار خوشه، مقدار 45/0 شده است که اعتبار مدل را نشان می دهد. با اجرای الگوریتم جنگل تصادفی، نوع کاربرد و پس از آن قیمت، بیشترین تاثیر را در خوشه بندی داشته اند.
نتیجه گیریتوسط مدل پیشنهادی پژوهش، بیماران یا کاربران می توانند مناسب ترین فناوری را بر حسب نوع بیماری و دیگر ویژگی های موثر همچون قیمت، بیابند و به این ترتیب با پایش جسمی درست و لحظه به لحظه، آمار پیشروی بیماری ها کمتر و پیشگیری آن ها بهتر انجام گیرد
کلید واژگان: پایش بیمار, ابزار و نرم افزار, اینترنت اشیا در سلامت, خوشه بندیHospital, Volume:18 Issue: 3, 2019, PP 63 -72Backgroundwith increasing demand for treatment, patients are monitored with help of Internet of Things(IOT). Patient's monitoring devices and technologies include heart rate measurement, blood pressure measurement, blood glucose and other vital signs. The purpose of study is to provide a model of clustering patient physical monitoring gadgets and apps in Healthcare Internet of Things (HIOT) environment using data mining techniques, so based on the needs and characteristics of the user, the more appropriate results of choosing technologies acquired.
Materials and methodsThis study is a review and functional since its result. The data includes 6 unique features of 60 selected technologies including function, price, connectivity route, power supply, location and type of use that has been extracted from R&D and advertising sites of technologies and also relevant articles. data analysis method is clustering technique and K-medoids algorithm. to identify the most effective features, random forest algorithm has been used.
Resultsthe proposed clustering model takes into account 6 as inputs and clusters gadgets and apps in accordance with selected characteristics as the model outputs. clustering problem data is clustered in 4 categories. Silhouette index is 0.45, which indicates the validity of the model. The type of application and then the price had the greatest impact on clustering.
ConclusionBy this model, patients or users can find the most appropriate technology based on the type of disease and other effective features, such as price. So with accurate physical and momentary monitoring, disease progression decrease and prevention of disease will improve.
Keywords: Patient Monitoring, gadget, app, Healthcare Internet of Things (HIOT), Clustering -
زمینه و هدف
بیماری دیابت یکی از شایع ترین و پر هزینه ترین بیماری ها می باشد که تشخیص به موقع آن می تواند منجر به کاهش پیشرفت این بیماری و عوارض ناشی از آن شود. این پژوهش با هدف تعیین وضیعت بیماری دیابت ازنظر ابتلا و یا عدم ابتلا به آن، با استفاده از تکنیک های داده کاوی انجام شده است.
روش هااین مطالعه از نوع تحلیلی بوده و پایگاه داده آن شامل 254 رکورد مستقل مبتنی بر 13 ویژگی و جمع آوری شده توسط محققین طرح از یکی از مراکز تخصصی دیابت شهرستان مشهد می باشد.
نتایجپس از پیش پردازش داده ها روش های مختلف تشخیص الگو مورد بررسی قرار گرفتند، با استفاده از شبکه عصبی پرسپترون چندلایه MLP، شبکه عصبی LVQ، بردار پشتیبان SVM و روش خوشه بندی K_means، میانگین حداقل مربعات خطا محاسبه گردید. صحت عملکرد هر یاد گیر به ترتیب 94%، 92%، 96% و 93% محاسبه گردید.
نتیجه گیرینتایج مطالعه حاکی از آن است که روش SVM عملکرد بهتری نسبت به سایر روشها در تشخیص بیماری دیابت دارد.
کلید واژگان: دیابت شیرین, شبکه عصبی مصنوعی, بردار یادگیر پشتیبان, خوشه بندیBackground & AimDetecting the abnormal performance of diabetes and subsequently getting proper treatment can reduce the mortality associated with the disease. Also, timely diagnosis will result in irreversible complications for the patient. The aim of this study was to determine the status of diabetes mellitus using data mining techniques.
MethodsThis is an analytical study and its database contains 254 independent records based on 13 characteristics. Data is collected by a researcher from one of the specialized diabetes centers in Mashhad.
ResultsAfter preprocessing of the obtained data, different methods of pattern recognition were applied. Using multilevel MLP neural networks, LVQ neural networks, SVM support vector and Kmeans clustering method, the mean square error (RMSE) was calculated. The correctness of each learner's performance is 94%, 92%, 96%, and 93%, respectively.
ConclusionReducing the diagnosis of diabetes is one of the goals of the researchers. Using data mining techniques can help to reduce this error. In this study, among different protocols used for pattern recognition, SMV method displayed a significantly better performance.
Keywords: Diabetes mellitus, Artificial neural network, Support vector Machine, Clustering -
مقدمهبا توجه به این که گردشگری پزشکی امروزه به یک صنعت تبدیل شده است، شناخت هرچه بهتر بازار این حوزه می تواند حایز اهمیت باشد. یکی از راه های شناخت بازار و مخاطبان آن، خوشه بندی آن ها و شناخت ویژگی های هر خوشه است. مطالعه حاضر با هدف تعیین و تحلیل متغیرهای جمعیت شناختی، جغرافیایی و رفتاری در درون خوشه های بازار گردشگری پزشکی انجام شد.روش بررسیاین پژوهش از نوع توصیفی- پیمایشی بود و داده ها با استفاده از ابزار پرسش نامه جمع آوری شد. بدین منظور، 151 پرسش نامه به صورت نمونه گیری خوشه اییک مرحله ای، توسط بیماران خارجی بیمارستان های منتخب شهر تهران تکمیل گردید. داده های به دست آمده پرسش نامه ها با استفاده از آزمون K-means و ضریب همبستگی χ2 در نرم افزار SPSS مورد تجزیه و تحلیل قرار گرفت.یافته هاچهار خوشه متفاوت اول، دوم، سوم و چهارم شناسایی شد که تفاوت های معنی داری از لحاظ متغیرهای مورد بررسی با یکدیگر داشتند. به عبارت دیگر، جنسیت، سن، تحصیلات و درامد به عنوان متغیرهای جمیت شناختی و کشور مبدا گردشگران نیز به عنوان متغیر جغرافیایی در نظر گرفته شد. متغیرهای رفتاری شامل تعداد دفعات سفر، مدت زمان اقامت در ایران، نوع خدمت درمانی دریافت شده، منبع اصلی اطلاعات برای سفر به ایران، شیوه تنظیم درمان، انجام فعالیت جانبی و نوع آن بود. تفاوت معنی داری در اغلب متغیرهای رفتاری میان خوشه های متفاوت مشاهده شد.نتیجه گیریتوجه به تفاوت خوشه ها باید مد نظر سیاست گذاران و فعالان این حوزه قرار گیرد. ارایه برنامه منظم و مدون جهت شناخت و برنامه ریزی مناسب برای گردشگران پزشکی عراقی حایز اهمیت است. همچنین، مدیران حوزه گردشگری پزشکی می توانند با ارایه برنامه های جانبی و همکاری بیمارستان ها و آژانس ها، هرچه بیشتر از این بازار بالقوه استفاده نمایند.کلید واژگان: گردشگری پزشکی, بازار, خوشه بندی, تهرانگردشگری پزشکی, بیمارستان ها, ایرانIntroductionDue to the current role of medical tourism as an industry, better understanding of its market can be important. One way to understand the market and its targets is through clustering them, and understanding the characteristics of each cluster. The present study was conducted to determine and analyze the demographic, geographic, and behavioral variables within the clusters of medical tourism market.MethodsThis was a descriptive-survey conducted using a questionnaire. 151 questionnaires were completed by foreigner patients in selected hospitals in Tehran City, Iran, who were selected using one-stage cluster sampling. The results of the questionnaires were examined using K-means and chi-square correlation coefficient via SPSS software.ResultsThe findings identified four different clusters of medical tourists, namely first, second, third, and fourth clusters, with significant differences in terms of the studied variables. In other words, the examined demographic variables included gender, age, education and income, the country of origin of tourists was considered as a geographical variable, as well as behavioral variables including the number of trips, the length of stay in Iran, the type of medical service received, the main source of information for travel in Iran, the method of regulating treatment, doing side activity, and the type of side activity. All the variables had significant differences in different clusters.ConclusionThe differences in clusters should be considered by policymakers and activists in this area. It is important to provide a regular and systematic program for recognizing and planning of Iraqi medical tourists. Furthermore, medical tourism managers can provide an increasing number of side plans in cooperation with hospitals and agencies for this potential market.Keywords: Medical Tourism, Hospitals, Clustering, Iran
-
مقدمهبیماری های غیرواگیر به متغیرهای خطرزا مثل مصرف دخانیات، تغذیه نامناسب و نبود تحرک بدنی وابسته هستند. هدف از این مطالعه، به کارگیری روش عاملی در استخراج شاخص تلفیق یافته ای از متغیرهای خطرزا و رتبه بندی استان ها براساس آن می باشد.مواد و روش هاداده های این مطالعه، شامل 20 متغیر خطرزا به تفکیک استان و جنسیت در افراد گروه سنی 15 تا 64 سال، برگرفته از گزارش سازمان نظارت عوامل خطر بیماری های غیرواگیر در ایران در سال 1388 می باشد. تحلیل عاملی، با به کارگیری روش مولفه های اصلی، جداگانه برای مردان و زنان انجام گرفت. در نهایت با محاسبه امتیازات عاملی براساس عامل اول، استان ها رتبه بندی شدند.نتایجبراساس عامل اول، برای مردان، به ترتیب استان های آذربایجان شرقی، قم، اردبیل و مازندران بیشترین خطر ابتلا به بیماری های غیرواگیر و استان های سیستان و بلوچستان، خراسان جنوبی، کرمان و هرمزگان کمترین خطر را داشتند. در زنان، به ترتیب استان های مازندران، قم، کرمانشاه و آذربایجان شرقی بیشترین خطر و استان های سیستان و بلوچستان، خراسان جنوبی، چهارمحال و بختیاری و هرمزگان کمترین خطر را داشتند.نتیجه گیرینتایج حاصل از این مطالعه نشان داد که تجزیه و تحلیل عاملی به خوبی می تواند سیمای خطر ابتلا به بیماری های غیرواگیر را در استان های مختلف ایران نشان دهد. همچنین براساس نتایج مطالعه حاضر استان هایی که خطر بالاتری در ابتلا به بیماری های غیرواگیر دارند نیازمند توجه بیشتر مسئولین جهت ارایه آموزش های تغذیه ای و بهداشتی هستند.کلید واژگان: بیماری های غیرواگیر, بیماری های مزمن, عوامل خطر, تحلیل چند متغیره, تحلیل عاملی, نقشه بندی, خوشه بندیIntroductionNon-communicable diseases are related to the risk factors such as smoking, inappropriate nutrition and lack of physical activity. The purpose of this study was to use factor analysis for obtaining the scale of combined risk factors, to rank the provinces based on it.MethodsThe data of this study were included 20 risk factors according to province and sex among 15-64 year-old subjects. This data were extracted from the report of the non-communicable diseases risk factors surveillance of Iran in 2009. We used the principal component method of factor analysis for men and women, separately. Finally we ranked the provinces by calculated scores of the first factor.ResultsBased on the first factor, for men, East Azerbaijan, Qom, Ardebil and Mazandaran provinces had the highest morbidity risk for non-communicable diseases and Sistan and Baluchistan, South Khorasan, Kerman and Hormozgan provinces had the lowest risk, respectively. Also, among women, Mazandaran, Qom, Kermanshah and eastern Azerbaijan provinces had the highest morbidity risk of non-communicable diseases and Sistan and Baluchistan, South Khorasan, Hormozgan provinces had the lowest risk, respectively.ConclusionThe results showed that factor analysis could show very well the risk of noncommunicable diseases in different provinces of Iran. Based on the results, the provinces which had higher incidence of morbidity of non-communicable diseases need more attention to nutrition and health education.Keywords: Non-communicable diseases, Chronic diseases, Risk factors, Multivariate analysis, Factor analysis, Clustering
-
مقدمهاهدای خون در کشورهای توسعه یافته 18 برابر بیشتر از کشورهای در حال توسعه است. اگر تنها پنج درصد از کل جمعیت جهان به طور مستمر خون اهدا کنند، ذخیره کافی برای تامین نیازهای جامعه وجود خواهد داشت. این رقم در کشورهای در حال توسعه کمتر از یک درصد است. هدف مطالعه حاضر شناخت رتبه وفاداری اهداکنندگان خون به منظور برنامه ریزی مناسب برای گسترش و تقویت رفتار اهدای خون در جامعه است.روش هاپژوهش حاضر به روش توصیفی- مقطعی صورت گرفته و نمونه گیری به روش سرشماری بوده است. جامعه پژوهش متشکل از داده های سازمان انتقال خون تهران از آبان 1383 تا خرداد 1388 است. برای تحلیل داده ها از نرم افزار Clementine12.0 استفاده شده است. برای مدل سازی الگوریتم K-Means در دو حالت جمعیت شناختی و مبتنی بر مقادیر تازگی، بسامد و ارزش خون (Recency-Frequency- Monetary (RFM)) اجرا گردید تا ارتباط بین متغیرهای مختلف بدست آید.
یافته ها: مقدار میانگین شاخص ریشه میانگین مربع انحراف از معیار برای خوشه بندی مبتنی بر تازگی، بسامد و ارزش خون و جمعیت شناختی 72/10 و 14/11 است و خوشه بندی بهتر داده ها توسط الگوریتم مبتنی بر تازگی، بسامد و ارزش خون را تایید کرد. این الگوریتم داده ها را در چهار خوشه قرار داد که خوشه چهارم شامل مردان مجرد حائز بیشترین رتبه وفاداری اهدای خون و خوشه سه شامل زنان متاهل حائز کمترین رتبه وفاداری گردید.
نتیجه گیری: استفاده از روش های نوین داده کاوی برای تحلیل و رده بندی اهدا کنندگان خون، شیوه نگرش سازمان های انتقال خون را به روند اهدای خون تغییر می دهد. بررسی رفتار اهداکنندگان به شناسایی سریع تر و دقیق تر وفاداری اهداکنندگان و مدیریت صحیح پایگاه خون کمک می کند.کلید واژگان: خوشه بندی, تازگی, بسامد, ارزش خون, وفاداری اهداکنندهIntroductionBlood donation rate in developed countries is 18 times higher than developing countries. It is estimated that if only five percent of Iran population embark on blood donation, it will be adequate to meet the needs of the community. The aim of this paper is to identify the blood donators loyalty behavior for proper planning to extend and enhance blood donation habits among the community.MethodsA cross-sectional survey was applied through census in the present study. The data extracted from blood transfusion center of Tehran from 2005 to 2010 was used in this study. Clementine 12.0 was used for data analysis. K-Means clustering is based on demographic data and RFM values modes which were applied to obtain the best ratio among different fields.ResultsThe mean value of root mean square standard deviation for RFB-based clustering and demographic were 10.7194 and 11.1411,respectively. This finding confirmed better data clustering by RFB-based algorithm. The data were placed by RFB-based algorithm in four clusters. The fourth cluster consisted of single males who obtained the best loyalty rank and the third cluster consisted of married females who obtained the least loyalty rank.ConclusionApplying data mining methods for analysis and classification of blood donors changes current attitude towards blood donation procedure. Survey of donor behavior helps us to identify faster and more precise donor loyalty as well as having proper management of the blood transfusion centers.Keywords: Clustering, Recency, Frequency, Blood Value, Donor Loyalty -
مقدمهاین پژوهش باهدف بررسی مستندات رشته مهندسی کامپیوتر بازیابی شده از پایگاه Web of Science به منظور انجام خوشه بندی و متن کاوی آن ها صورت گرفته است.روش پژوهشروش این پژوهش از نوع توصیفی - تحلیلی است که به روش پیمایشی انجام شده و رویکرد متن کاوی را مورد نظر قرار داده است. جامعه پژوهش، مدارک حوزه مهندسی کامپیوتر نمایه شده در پایگاه Web of Science بود که در بازه زمانی 2004 تا 2014، 6186 رکورد گزارش شد. داده های جمع آوری شده، با استفاده از نرم افزار هیست سایت و اکسل نسخه 2013 و همچنین نرم افزار رپیدماینر نسخه 7.3 تجزیه و تحلیل شدند.یافته هابرای خوشه بندی پس از پیش پردازش داده ها و اجرای الگوریتم خوشه بندی k-means، 8 خوشه اصلی با عناوین «اینترنت و فناوری»، «امنیت سیستم های اطلاعات سلامت»، «انسان و تعامل با رایانه»، «وب پنهان»، «مدل های کامیپوتری»، «عملکرد سیستم های کامپیوتری»، «شبکه ها و پایگاه های اطلاعاتی»، «الگوریتم ها و روش های کشف دانش» و خوشه اینیز با عنوان «سایر موضوعات» تشکیل شد. به منظور ارزیابی خوشه ها از دو معیار دقت و بازیافت استفاده شد و برای هر دو معیار عدد 0/81 به دست آمد.نتیجه گیریاستفاده از کلماتی که به عنوان کلمات کلیدی در خوشه بندی ها انتخاب شده اند، می تواند به کاربر در صرفه جویی در وقت و بازیابی اطلاعات مرتبط کمک کند.کلید واژگان: متن کاوی, خوشه بندی, الگوریتم k-means, پایگاه Web of ScienceIntroductionThe aim of this study was to evaluate text mining and clustering of computer engineering documents retrieved from the Web of Science database.MethodsThis is a descriptive-analytical study which was conducted in a survey method using text mining approach. The research community was all computer engineering documents indexed in the Web of Science, among which 6016 cases were reported between 2004 and 2016. The collected data were analyzed by HistCite software, Excel version 2013 and RapidMiner version 7.3.ResultsIn order to perform clustering, after preprocessing the data and running K-means (a clustering algorithm), 8 main clusters were established. The clusters were Internet and Technology, Security of Healthcare Information Systems, Human-Computer Interaction, Semantic Web, Computer Models, Computer Systems Performance, Networks & Databases, Knowledge Discovery Algorithms and Other Topics. To evaluate the clusters, two criteria of precision and recall were used and a value of 0.81 was obtained for both criteria.Discussion and ConclusionUsing words selected as keywords in the clustering can help the user save time and retrieve the related information.Keywords: Text mining, Clustering, K-means algorithm, Web of Science Database
-
مقدمهدر سال های اخیر، سرطان پوست غیرملانوما (NMSC) جزء سه سرطان شایع در ایران بوده است. مدیریت نامناسب این بیماری منجر به افزایش شیوع و هزینه های سربار اقتصادی شده است. تکنیک های داده کاوی به آنالیز داده های پرونده های بیماران و مدیریت صحیح بیماری ها کمک می نمایند. هدف این مطالعه کشف الگوها و روابط پنهان در داده های بیماران NMSC با استفاده از الگوریتم های داده کاوی می باشد.روشجامعه مورد بررسی در این مطالعه کاربردی، 828 پرونده NMSC بود که طی سال های 94-86 به انستیتو کانسر بیمارستان امام خمینی (ره) تهران ارجاع شده بودند. متغیرهای دموگرافیک و ریسک فاکتورهای ابتلا به بیماری با استفاده از الگوریتم K-Means خوشه بندی شدند. همچنین از الگوریتم Apriori برای استخراج قوانین انجمنی و تعیین شاخص های مشترک بیماران با درجه اطمینان بالای 0/9 استفاده گردید.نتایجبیماران NMSC با توجه به متغیرهای مورد بررسی در چهار خوشه توزیع شدند و سه عامل مهم تاثیر گذار بر بیماری، BMI غیرنرمال، شغل های با ریسک بالا و سابقه قبلی سرطان مشخص شد. با استفاده از قوانین انجمنی هفت قانون مورد تایید قرار گرفت و بیشترین ارتباط میان عوامل سابقه قبلی بیماری، موضع درگیر، عود و نوع سرطان پوست غیرملانوما دیده شد.نتیجه گیریاین مطالعه برای اولین بار مهم ترین عوامل موثر بر NMSC را با استفاده از داده کاوی تعیین نمود. این عوامل بایستی در انجام خودآزمایی ها و یا آزمایش های غربالگری پوست در گروه های پرخطر مد نظر قرار بگیرند. همچنین در مطالعات آینده بایستی مشارکت عوامل فیزیولوژیک، اکولوژیک و ژنتیک در ایجاد سرطان پوست تواما داده کاوی شوند.کلید واژگان: سرطان پوست غیر ملانومایی, داده کاوی, خوشه بندی, قوانین انجمنی, ریسک فاکتورIntroductionNon-melanoma skin cancer (NMSC) has recently been one of the three most common cancers in Iran. Inappropriate management of the disease has led to an increase in the prevalence and overhead costs. Data mining techniques are helpful in the analysis of patient records and accurate management of diseases. This study aimed to find hidden patterns and relationships in the data of NMSC patients using data mining algorithms.MethodsIn this applied study, study population consisted of medical records of 828 NMSC patients referred to the Cancer Institute of Imam Khomeini Hospital in Tehran during 2006-2015. Demographic variables and NMSC risk factors were clustered using K-Means algorithm. Apriori algorithm was applied as well for extraction of association rules and determination of patients common information with a confidence of ≥ 0.9.ResultsAccording to the studied variables, NMSC patients were classified in four clusters and three important factors influencing the disease were identified as abnormal BMI, high risk occupations and previous history of cancer. Seven rules were approved by association rules and the highest associations were found between the past history of the disease, the involved site, the relapse, and the type of NMSC.ConclusionFor the first time, this study could highlight the most important factors affecting NMSC using data mining methods. These factors should be considered either in self examination or screening skin tests in high-risk groups. In future studies, the contribution of physiological, ecological and genetic factors in the development of skin cancer should be jointly investigated as well.Keywords: Non-Melanoma Skin Cancer, Data Mining, Clustering, Association rules, Risk Factor
-
مقدمه و اهدافیکی از موارد کاربرد درصد خطر قابل انتساب جمعیت برآورد بار بیماری جمعیت در مواجهه با چند عامل خطر است. این مطالعه به منظور برآورد مقادیر درصد خطر قابل انتساب جمعیت (PAR%) خوشه های زمان مکان موارد سل ریوی در استان همدان اجرا شد.روش کاردر این مطالعه اطلاعات موارد سل ریوی از معاونت بهداشتی دانشگاه علوم پزشکی همدان اخذ شد و پس از کشف خوشه های معنی دار با استفاده از آماره کاوشی زمان-مکان از PAR% به منظور تحلیل خوشه ها و برآورد دقیق تر مکان های کشف خوشه استفاده شد.یافته هادر مجموع 4 خوشه زمان-مکان اولیه،3 خوشه زمان- مکان ثانویه برای موارد سل ریوی و 92 درصد مواردی که وضع مشخصی از نظر ابتلا به اچ آی وی/ایدز نداشتند؛ در نواحی مطالعه کشف شد. با وجود تفاوت مکان های خوشه های کشف شده و تفاوت مقادیر PAR% منتسب به آن ها، دومین خوشه اولیه موارد سل ریوی (متشکل از شهرستان های رزن، فامنین و کبودرآهنگ) بیش ترین مقدار PAR% را داشت که نیازمند توجه بیش تری است.
نتیجه گیری: وجود خوشه های زمانی-مکانی معنی دار در استان همدان لزوم استفاده از درصد قابل انتساب جمعیت را به منظور تمایز دقیق تر نواحی خوشه های کشف شده برای اتخاذ معیارهای پیش گیری و کنترل از بیماری ضروری می سازد. با این حال مطالعه های تحلیلی بیش تری به منظور کشف عوامل موثر بر رخ داد موارد سل ریوی نیاز است.کلید واژگان: تحلیل مکانی, درصد قابل انتساب جمعیت, سل ریوی, خوشه بندی, همدانBackground And ObjectivesOne of the applications of population attributable risk percent (PAR%) is to estimate the disease burden in a population exposed to several risk factors. Therefore, this study was conducted to estimates the PAR% of the space-time clusters of pulmonary tuberculosis.MethodsIn this study, the data of pulmonary TB cases were obtained from the health department of Hamadan University of Medical Sciences. After detecting significant clusters using the spatiotemporal scan statistic, PAR% was used to analyze the clusters and to detect the location of clusters more accurately.ResultsFour primary space-time clusters and three secondary spatiotemporal clusters were detected for patients with pulmonary tuberculosis and 92% of the patients who did not have a clear state in term of HIV infection. Despite differences in the location of clusters and PAR% attributed to them, the second primary cluster of pulmonary tuberculosis cases (consisting of the cities of Razan, Famenain and Kabudrahang) had the highest amount of PAR% that needs more attention.ConclusionThe presence of significance spatiotemporal clusters in Hamadan highlights the necessity of the use of PAR% to distinguish cluster areas and to implement prevention and control policy. However, more analytical studies are needed to detect the on the determinants of the occurrence of pulmonary TB.Keywords: Spatial analysis, Population attributable risk, Pulmonary tuberculosis, Clustering -
مقدمهنیاز فوری به خون و عدم جایگزین مناسب برای آن، ضرورت وجود الگویی برای کمک به پزشکان جهت ارایه خدمات درست به اهداکنندگان و مدیریت صحیح پایگاه خون را نشان می دهد. پژوهش حاضر با هدف شناسایی الگویی برای تشخیص وضعیت اهداکنندگان خون صورت گرفته است.مواد و روش هاپژوهش حاضر به روش پیمایشی- مقطعی و به صورت سرشماری صورت گرفته است. جامعه پژوهش متشکل از داده های سازمان انتقال خون بیرجند در ماه های خرداد تا شهریور 92 است که با مراجعه مستقیم پژوهش گر به سازمان و به صورت فایل اکسل تهیه گردید. جهت تحلیل داده ها از نرم افزار Clementine12.0 استفاده شده است. در پژوهش حاضر ابتدا خوشه بندی Two-Step و سپس الگوریتم های C5.0،C&R Tree ، CHAID و QUEST اجرا گردیدند تا بهترین نسبت بین فیلدهای مختلف به دست آید.نتایجمقدار صحت به دست آمده از اجرای الگوریتم های C5.0، C&R Tree، CHAID و QUEST به ترتیب 9998/0، 9960/0، 9930/0، 8913/0 می باشد. مقادیر به دست آمده برای شاخص های حساسیت، شفافیت، صحت، دقت، شاخص F، میانگین هندسی، نرخ مثبت غلط، نرخ منفی غلط و نرخ خطا برای مدل C5.0 نشان دهنده عملکرد بهتر این الگوریتم نسبت به سایرین می باشد. تاثیرگذارترین شاخص ها در تولید مدل، دسته فشارخون، وضعیت اهدای خون و دمای بدن هستند.نتیجه گیریمدل ارایه شده به پیش بینی سریع تر و دقیق تر وضعیت اهدای خون و نیز مدیریت صحیح پایگاه خون کمک می نماید و می تواند گامی موثر جهت استفاده کارآمد از خون اهدایی و کاهش هزینه های نگهداری خون محسوب گردد.کلید واژگان: اهداکنندگان خون, داده کاوی, درخت تصمیم, خوشه بندیIntroductionUrgent need for blood and lack of an alternative for it necessitates the presence of a model to assist doctors in providing the proper services for the donors and also the right management of blood transfusion centers. The present study is aimed at determining blood donors status.MethodsCross-sectional survey was applied in the present study through census. The population included the data extracted from blood transfusion center of Birjand from Khordad to Shahrivar 1392 which was provided as an Excel file by the direct visit of the researcher from the blood transfusion organization. In the present study, first, two-step clustering and then C50, C&R TREE, CHAID, and QUEST algorithms were executed to obtain the best ratio among different fields. Analysis was performed using Clementine12.0 software.ResultsThe obtained accuracy for executing C50, C&R Tree, CHAID, and QUEST equals 0.9998, 0.9960, 0.9930, and 0.8913, respectively. The results of indices including sensitivity, Specificity, accuracy, precision, FM, GM, FPR, FNR, and ER for C50 are indicators of better performance of this algorithm compared to the other ones. Important variables in modeling are blood pressure label, blood donation status and temperature.ConclusionThe proposed model helps us in predicting faster and more precise status of blood donation and also the proper management of the blood transfusion centers and it canbe and effive step for efficient usage of blood donation and decreasing the blood maintenance costs.Keywords: Blood donors, Data mining, Decision tree, Clustering
-
مقدمهبا توجه به شیوع بالای افسردگی و بار قابل توجهی که این بیماری به فرد، نظام سلامت و جامعه تحمیل می کند، انجام مطالعات گسترده برای اتخاذ روش های مناسب پیشگیری و درمان و مدیریت این بیماری، ضروری به نظر می رسد. به منظور کمک به انجام پژوهش های مفید و مورد نیاز در این حوزه، مطالعه حاضر با هدف تعیین ساختار موضوعی مقالات مرتبط با درمان افسردگی انجام شد.روش بررسیاین پژوهش از نوع مطالعات کاربردی با رویکرد علم سنجی بود که با استفاده از روش تحلیل هم رخدادی واژگان و خوشه بندی انجام گردید. توصیفگرهای مقالات مرتبط، با جستجوی عبارت «Depression» در سرعنوان موضوعی MeSH و با تقسیم فرعی «Therapy» از پایگاه PubMed در تاریخ 30/1/1394، در بازه زمانی سال های 2005 تا 2014 استخراج شد. داده ها در نرم افزارهای Excel و SPSS مورد تجزیه و تحلیل قرار گرفت.یافته هارشد تولیدات علمی در حوزه درمان افسردگی طی سال های مختلف، به صورت متوازن اتفاق افتاده بود. با تفکیک بازه زمانی پژوهش به دو دوره پنج ساله، 12خوشه با 34 توصیفگر مشترک یکسان به دست آمد و مشخص گردید که موضوعات «روان شناسی، دارو درمانی و پایبندی به درمان»، زمینه اصلی (رانت) موضوعات می باشند.نتیجه گیرینتایج بر اساس شاخص دربردارندگی نشان داد که تنها 20 درصد از زمینه های موضوعی دوره دوم جدید هستند. از این امر می توان نتیجه گرفت که زمینه هایی که در سال های قبل با هم در نظر گرفته می شدند، ممکن است در ادامه پژوهش ها در سال های بعدی در کنار دیگر حوزه های متفاوت قرار بگیرند و یا حذف شوند.کلید واژگان: تحلیل هم رخدادی واژگان, خوشه بندی, PubMed, تحلیل موضوعی, افسردگیIntroductionDue to the high prevalence of depression and the considerable pressure it puts on individuals, society and healthcare system, it is essential to conduct sufficient research to help with decision making in prevention, treatment and control of this condition. To assist with research planning and setting priorities, this paper aimed to identify the thematic structure of papers related to depression treatment.MethodsThis was an applied research study which used Scientometrics approach. To obtain data, the keyword Depression was searched as a mesh descriptor with the subdivision Therapy in PubMed database for the period of 2005 to 2014. The data were analyzed using co-word and clustering methods with the help of Excel and SPSS software packages.ResultsThe growth of scientific production in this field appeared to have been balanced throughout the ten-year period examined in the study. The most active research areas for the two five year periods (2005-2009 and 2010-2014) were drug therapy, psychology, and medication adherence. Two hierarchical graphs of descriptors for each five-year period were prepared both of which were composed of 12 clusters with 34 common descriptors.ConclusionThe findings based on the inclusion index showed that only 20 percent of topics in the second five-year period of the study were novel. Therefore, it could be concluded that research areas that were related with each other in previous years will probably co-occur with other topics in the future might disappear. In every discipline, some topics are considered to be fundamental and research works are being carried out on them almost every year.Keywords: Co, words, Clustering, PubMed, Thematic Structure, Depression
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.