میترا میرزارضایی
-
شیوه معماری اندیشی، روش ها، سنت ها و دانش آن به مانند هر رشته هنری دیگری امروزه در دوره ایی دوره ای بسیار حیاتی و تاریخی قرار دارد. همان گونه که در هفتادسال اخیر راه حل های مبتنی بر هوش مصنوعی، معماری را به طور قابل توجهی متحول کرده است. این پژوهش به جای پرداختن به عواملی که مانع از تسریع این تحول شده اند، نگاهی بر تداوم برهمکنش تحولات معماری و هوش مصنوعی دارد. یکی از روش هایی که می توان این مساله را مورد بررسی قرار داد، نگاهی فرهنگی و فنی و تاریخی به مساله هوش مصنوعی و نحوه ورود و تاثیر آن بر معماری است. هدف از این پژوهش چگونگی برهمکنش یافته های جدید هوش مصنوعی و معماری با تمرکز بر تحولات تاریخی 1920 تا 2023، همچنین نقش متصور آن در آینده فناوری این حوزه است. این پژوهش از نظر رویکرد کیفی است و از نظر روش یک پژوهش تاریخی مبتنی تحلیل مقایسه ای رویدادهای معماری و هوش مصنوعی در دوره های ده ساله است. یافته های حاکی از آن است این برهمکنش را می توان در 4 دوره، معماری به کمک استانداردسازی، معماری به کمک رایانه، معماری به کمک پارامتر ها و در نهایت معماری به کمک هوش مصنوعی (شبکه های عصبی و مدل های مولد) سازمان دهی کرد. رابطه معماری با فناوری به موازات تحولات هوش مصنوعی بالغ شده و آخرین پیشرفت های هوش مصنوعی نه تنها بر فرآیند طراحی تاثیرگذار بوده است، بلکه بر حوزه عمل و اندیشه آن نیز موثر بوده و حتی موجب پیدایش و توسعه سبک های معماری شده است.
کلید واژگان: معماری, هوش مصنوعی, طراحی به کمک رایانه, شبکه های عصبی, مدل های مولد تصویر.The process of architectural thinking, traditions, methods, and the vast body of architectural knowledge, similar to other artistic fields, currently stands at a critical juncture in its history. The emergence of Artificial Intelligence (AI) in architecture over the past seventy years signifies a paradigm shift, resulting in significant transformations within the field. Despite addressing factors that have hindered the acceleration of such remarkable change, the present study evaluates the progression and interaction of architectural developments with AI. One approach to investigating AI's impact on the world of architecture involves exploring the cultural, technical, and historical realms. The primary objective of this study was to demonstrate the adaptation of new AI-related findings within architecture while considering their historical developments from 1920 to 2023. The study employed a qualitative method, conducting a historical research based on a comparative analysis of architectural and AI achievements in ten-year periods. The findings suggest that the relationship between architecture and technology has grown substantially in parallel with the evolution of AI. The latest advancements in AI have not only influenced the design process but have also significantly affected the broader field of practice and thought. This adaptation can be categorized into four periods: architecture aided by standardization, architecture utilizing computers, architecture with the assistance of parameters, and architecture through the application of AI.
Keywords: Architecture, Artificial Intelligence, Computer-Aided Design, Neural¬ Networks, Image Generation Models -
بیش از 60 سال مطالعه در حوزه تولید چیدمان های خودکار فضایی نشان است که چیدمان های معماری می تواند نقش مهمی در ایجاد ساختمان هایی صرفه جوتر ایفا کنند. این پژوهش در تلاش است بر خلاف اکثر مطالعات انجام شده که به بررسی مقالات از منظر روش محاسباتی پرداخته اند، ضمن ارائه دسته بندی جدیدی برای مطالعات در حوزه تولید چیدمان های معماری، به بررسی کاربرد ها و مقایسه روش ها و رویکرد های موجود بپردازد علاوه بر آن، الگویی برای تولید خودکار چیدمان های فضایی معرفی کند این مقاله به بررسی 34 مطالعه متخب از میان 105 مطالعه مرتبط تولید چیدمان های فضایی به روش تحلیل محتوا می پردازد. برای این منظور از پایگاه های معتبر بین المللی و داخلی استفاده شده است. یافته های حاصل از بررسی نشان می دهد مطالعات در حوزه تولید خودکار چیدمان های خودکار فضایی از منظر رویکرد های بازنمایی مساله می توانند در 6 رویکرد سازمان دهی شوند. از سوی دیگر مزایای و کاربرد هر یک از این رویکرد ها بر اساس معیارهای کیفی مورد بررسی قرار گرفته اند. در این پژوهش ضمن ارائه الگوی عام، تولید چیدمان های خودکار فضا از منظر معماری، 3 روش تولید، جز به کل، کل به جز و مبتنی بر اصل خبرگی و کاربرد های آن را معرفی شده است
کلید واژگان: یادگیری ماشین, چیدمان های فضایی, مولد پلان, اتوماسیون طراحی, طراحی مولدAimsThis study presents an approach for the automatic spatial arrangements in creating more economical buildings. More than 60 years of studies in the field of production of automatic spatial layouts have proved that architectural layouts are strongly affecting the course of such benefits; nevertheless, they mainly examined the subject mathematically. The purpose of this research was to provide a new category in the production of architectural layouts while it investigated the related applications. In addition, it compared the existing approaches and methods. Finally, the study introduced a model for automatic generation of spatial arrangements.
MethodsFrom out of 105 reliable national and international databases, 34 studies on the production of spatial arrangements were selected and analyzed using the content analysis method.
FindingsThe results indicated that the production of automatic spatial layouts could be organized in six approaches from the perspective of problem representation approaches. Additionally, the benefits and applications of each approach examined based on qualitative criteria.
ConclusionAt the same time that a general model was provided by the study, the automatic spatial architectural layout design was also established in three different methods of part to whole and whole to part relationships along with the principle of expertise and its applications.
Keywords: Automatic Space Layouts, Floor Plan Generator, Generative Design, Machine Learning -
نشریه سیستم های پردازشی و ارتباطی چند رسانه ای هوشمند، سال چهارم شماره 1 (پیاپی 11، بهار 1402)، صص 27 -37تطبیق دامنه می تواند دانش را از یک مجموعه آموزشی (دامنه منبع) به یک مجموعه آزمایشی (دامنه هدف) انتقال دهد تا بازدهی مدل یادگرفته شده از داده های آموزش، افزایش یابد. در حیطه تطبیق دامنه مسایل به دو بخش با نظارت و بدون نظارت تقسیم بندی می شود. در این پژوهش دامنه های بدون نظارت مورد بررسی قرارمی گیرد. یکی از چالش ها در تطبیق دامنه که به آن کمتر توجه شده است، عدم توجه به زیرفضا دامنه (فشردگی درون کلاسی) و همچنین تاثیر مخرب داده های نویزی و خارج از محدوه است، که موجب انتقال منفی و در نهایت موجب کاهش دقت طبقه بندی می شود. در این مقاله با استفاده از شبکه تخاصمی مولد جهت استخراج ویژگی ها با درنظرگرفتن فشردگی درون-کلاسی دامنه ها بر مبنای تخمین اولیه برچسب ها با کمک الگوریتم خوشه بندی فازی c-means در گام اول و در گام دوم با کمک شبکه های عصبی پیچشی و متریک WMMD جهت طبقه بندی تصاویر با خطای کمتر ارایه شده است. ارزیابی و نتایج به دست آمده در 5 مجموعه داده محک استاندارد و مقایسه آن با روش های پیشین نشان دهنده عملکرد بهتر نسبت به رهیافت های مشابه می باشد.کلید واژگان: تطبیق دامنه, خوشه بندی فازی, شبکه عصبی پیچشی, شبکه های تخاصمی مولد, WMMDJournal of Intelligent Multimedia Processing and Communication Systems, Volume:4 Issue: 1, 2023, PP 27 -37IntroductionDomain adaptation has become an important issue today. A high percentage of data processing domain adaptation is done with a significant percentage of studies related to deep learning. Traditional methods often ignore the distance between the intra-class in source domain and target domain. As a result, models can be sensitive to outliers and noisy data, additionally increasing the negative transfer in the model. This method applied GAN to extract appropriate features and then used Fuzzy c-means to cluster train datasets in the target domain. Finally, based on the WMMD metric and CNN, the model estimates the final label data. Five real datasets are selected to generate eight transfer tasks. The results show that the superiority of the proposed model lies in transferring more knowledge from the source domain to the target domain.MethodIn this approach, firstly based on GAN extracting features from source domains and the target domain (without labels), then label estimation by Fuzzy c-means clustering, finding the center of Fuzzy c-means on target domain data, new data points with labels in target domain as a new input to feature extraction module and regenerate features by GAN based on new pseudo labels. Afterward, we apply WMMD metrics based on CNN to ultimately assign labels for the target domain. Consequently, classification tasks have been done.ResultsEmpirical results on various benchmark datasets showcase the exceptional performance of the proposed method compared to state-of-the-art DA approaches, validating the proposed Deep-Learning Unsupervised Domain Adaptation approach efficacy. Overall, the approach shows potential for advancing domain adaptation research by offering an efficient and resilient approach for addressing domain shifts in real-world applications. Experimental results on visual object recognition and a digit dataset reveal that the proposed algorithm is robust, flexible, and significantly superior regarding accuracy compared to the baseline DA approaches. Based on the three and combined digit datasets, 1.7% and 2.4% accuracy improvement are achieved, respectively, compared to the best baseline DA approach results.DiscussionIn this research, we addressed the challenging issues of outlier and negative transfer in the context of domain adaptation. Despite significant progress in domain adaptation techniques, outliers and negative transfer instances continue to hinder models' generalization performance across different domains. Based on DNNs and the WMMD metric, our proposed method was designed to mitigate these issues and effectively enhance knowledge transfer between domains.Keywords: Domain adaptation, fuzzy clustering, CNN, GaN, WMMD
-
سامانه های پیشنهادگر سامانه هایی هستند که در گذر زمان یاد می گیرند که هر فرد یا مشتری احتمالا چه کالا یا قلمی را می پسندد و آن را به او پیشنهاد می دهند. این سامانه ها اغلب بر اساس رفتارهای مشابه از دیگر افراد (احتمالا مشابه) عمل می کنند. به طور کلی یافتن افراد مشابه، به علت زیاد بودن کاربران، فرایندی بسیار زمان بر و به علت کمبود اطلاعات، نادقیق است. به همین دلیل برخی از روش ها، رو به افزایش سرعت آورده اند. از طرفی، برخی از روش های دیگر، رو به افزودن اطلاعات اضافه آورده تا در گذر این اطلاعات بتوانند دقت یافتن کاربران مشابه یا همسایه را افزایش دهند. برخی دیگر نیز، به روش های ترکیبی رو آورده اند. اخیرا محققان با به کارگیری روش های خوشه بندی پایه که بر اساس یافتن شبیه ترین کاربران همسایه با کمک خوشه بندی کاربران می باشد، و همچنین استفاده از روش های محتوا پایه و بعضا اضافه نمودن هستان شناسی به روش های محتوا پایه توانسته اند با بهره گیری از مزایای این روش ها، برخی از چالش های فوق را تا حد قابل قبولی حل نمایند. در سامانه پیشنهادگر ترکیبی پیشنهادی، از یک سامانه دو مرحله ای استفاده کرده ایم که در مرحله اول، دو مدل پیش بینی های خود را انجام داده، سپس در مرحله دوم به وسیله یک مولفه ترکیب گر، نتایج دو بخش مرحله اول با یکدیگر ترکیب شده و نتایج به دست آمده را به عنوان نتایج نهایی سامانه به ما ارایه می دهد. در بخش اول، یک سامانه مبتنی بر پر کردن مقادیر گم شده، مقادیر خالی در ماتریس امتیازدهی را پر می کند. برای این مهم، از بین روش های پرکردن داده های گم شده، یک روش که با پرکردن مجموعه داده در شرایط بسیار تنک سازگار بود را طراحی کرده و سپس آن را به روش خودمان تعمیم داده ایم. در این راستا یک روش مبتنی بر خوشه بندی فاصله گری ارایه کرده ایم. در بخش دوم که خود یک سامانه پیشنهادگر ترکیبی هستان شناسی پایه می باشد، ابتدا به کمک یک خزنده وب، اطلاعات هر قلم را استخراج کرده، سپس در یک هستان شناسی پایه به کمک یک روش پیشنهادی، اقدام به بهبود ساختار هستان شناسی به وسیله حذف یال های همسان می نماییم. بدین ترتیب دقت اندازه گیری شباهت معنایی بین اقلام و کاربران در مراحل بعدی افزایش یافته و میزان اثربخشی پیشنهادات ارایه شده به طور با معنایی بهبود می یابد. شایان ذکر است این هستان شناسی یک هستان شناسی جامع نیست. درنهایت به کمک یک روش اندازه گیری شباهت ابتکاری هستان شناسی پایه، مشابهت قلم-قلم ها، کاربر-کاربرها، و کاربر-قلم ها را اندازه گیری می کنیم. به کمک این ماتریس مشابهت، کاربرها و قلم ها را خوشه بندی کرده و سپس برای هر کاربر، کاربرها و قلم های شبیه به آن را به عنوان یک ویژگی جدید در پروفایل کاربر ذخیره می نماییم. این کار به ما کمک می کند که در آینده، سرعت یافتن کاربرهای مشابه و قلم های مشابه را بالا ببریم. در حقیقت بر اساس این ویژگی، سرعت کل کار را افزایش داده ایم. از آنجایی که ما هدف خود را ساختن سامانه ای که یک موازنه بین دو معیار دقت و سرعت را برقرار کند قرار داده ایم، با استفاده از یک مجموعه داده واقعی، از این دو معیار جهت ارزیابی سامانه پیشنهادی استفاده می کنیم. نتایج مقایسه ی روش پیشنهادی ما با برخی روش های مشابه به روز ارایه شده در این حوزه (با استفاده از یک مجموعه داده یکسان) حاکی از آن است که روش ما از روش های سریع، کندتر است، اما از آنها دقیق تر می باشد. همچنین این نتایج بیانگر این موضوع است که روش پیشنهادی از روش های دقیق، سریع تر و کیفیت آن نیز قابل رقابت و یا حتی بهتر است.
کلید واژگان: سامانه پیشنهادگر, هستان شناسی, پالایش حافظه پایه, پالایش مدل پایه, خوشه بندی, k-NNRecommender systems are systems that, over time, learn what product(s) or item(s) each person or customer is (are) likely to like and recommend it (them) to him/her. These systems often operate based on similar behaviors from other (possibly similar) people. Finding similar people is generally a highly time-consuming process due to the large number of users and inaccurate due to the lack of information. For this reason, some methods have resorted to increasing speed. On the other hand, some other methods have added additional information so that they can increase the accuracy of finding similar or neighboring users. Some others have resorted to hybrid methods. Recently, by the use of basic clustering methods, which is based on finding the most similar neighbors with the help of users’ clustering, as well as by using basic content analysis methods and sometimes adding ontology to these methods, researchers have been able to take the advantage of these methods in order to solve some of the above challenges acceptably. In the proposed hybrid recommender system, we have used a two-stage system in which, in the first stage, two models of predictions are made, then in the second stage, by a combining component, the results of the first two parts are combined and the obtained results are given to us as the final results of the system. In the first part, a system based on imputation of missing values fills in the blanks in the scoring matrix. For this end, among the methods of the missing data imputation, we designed a method that was compatible with filling the data set in very sparse conditions, and then generalized it to our own method. In this regard, we have proposed a method based on the grey distance clustering. In the second part, which itself is a hybrid ontology-based recommender system, we first extract the information of each item with the help of a web crawler, then based on a basic article, we produce our own limited ontology, and after that we apply our proposed method. Then, with the help of a proposed method, we improve the ontology structure, thus increasing the accuracy of measuring semantic similarity between the items and users in later stages, and significantly improving the effectiveness of the created recommendations. It should be noted that this ontology is not comprehensive. Finally, we measure the similarity of item-items, user-users, and user-items using an innovative basic ontology similarity measurement method. By the use of this similarity matrix, we cluster users and items, and then store similar users and items as a new feature in the user/item profile for each user/item. This will help us speed up the process of looking for similar users and similar items in the future. In fact, based on this feature, we have increased the speed of the whole work. Since we have set our goal to build a system that makes a balance between the two criteria of accuracy and speed, we use these two criteria to evaluate the proposed system using a real data set. The results of comparing our proposed method with some up-to-date similar methods presented in this field (using the same data set) implies that our method is slower than fast methods, although it is more accurate than them. These results also suggest that the proposed method is faster than accurate methods and its quality is more competitive or even better than them.
Keywords: Recommender System, Ontology, Memory-based Filtering, Model-based Filtering, Clustering, k-NN -
با اختصاص بخش قابل توجهی از بودجه مربوط به حقوق و دستمزد بانک ها به شیوه پرداخت مبتنی بر عملکرد توجه به پتانسیل های کسب و کاری شعب اهمیت یافته است. از این رو مسیله تعیین ضرایب اهمیت شاخص های ارزیابی عملکرد مبتنی بر فضای کسب و کاری به یک چالش برای مدیران بانکی تبدیل شده است. در این مقاله مسیله بهینه سازی ضرایب اهمیت شاخص های ارزیابی عملکرد شعب در یکی از بانک های دولتی ایران با در نظرگرفتن فضای کسب و کاری شعب مورد بررسی قرار گرفته است. برای این منظور یک رویکرد دو مرحله ای ارایه شده در گام اول از یک روش خوشه بندی رایج برای تعیین فضای کسب و کاری هر شعبه استفاده شده و در گام دوم یک الگوریتم ژنتیک دوهدفه نوین به منظور بهینه سازی ضرایب اهمیت هر خوشه پیشنهاد شده است. روش پیشنهادی با چهار روش شناخته شده مقایسه شده و نتایج در مواردی عملکرد موثر روش پیشنهادی را نشان می دهد.
کلید واژگان: فضای کسب و کاری شعب, ضرایب اهمیت شاخص های ارزیابی عملکرد, خوشه بندی, بهینه سازی, الگوریتم ژنتیک چندهدفهNowadays, we are witnessing financial markets becoming more competitive, and banks are facing many challenges to attract more deposits from depositors and increase their fee income. Meanwhile, many banks use performance-based incentive plans to encourage their employees to achieve their short-term goals. In the meantime, fairness in the payment of bonuses is one of the important challenges of banks, because not paying attention to this issue can become a factor that destroys the motivation among employees and prevents the bank from achieving its short-term and mid-term goals. This article is trying to tackle the problem of optimizing the coefficients of branch performance evaluation indicators based on their business environment in one of the state banks of Iran. In this article, a two-objective genetic algorithm is proposed to solve the problem. This article is comprised of four main sections. The first section is dedicated to the problem definition which is what is our meaning of optimizing the importance coefficients of branches based on the business environment. The second section is about our proposed solution for the defined problem. In the third section, we are comparing the performance of the proposed two-objective genetic algorithm on the defined problem with the performance of four well-known multi-objective algorithms including NSGAII, SPEAII, PESAII, and MOEA/D. And finally, the set of ZDT problems which is a standard set of multi-objective problems is taken into account for evaluating the general performance of the proposed algorithm comparing four well-known multi-objective algorithms. Our proposed solution for solving the problem of optimizing branch performance coefficients includes two main steps. First, identifying the business environment of the branches and second, optimizing the coefficients with the proposed two-objective genetic algorithm. In the first step, the k-means clustering algorithm is applied to cluster branches with similar business environments. In the second step, to optimize the coefficients, it is necessary to specify the fitness functions. The defined problem is a two-objective problem, the first objective is to minimize the deviation of the real performance of the branches from the expected performance of them, and the second objective is to minimize the deviation of the coefficients from the coefficients determined by the experts. To solve this two-objective problem, a two-objective genetic algorithm is proposed. In this article, two approaches are adopted to compare the proposed solution performance. In the first stage, the results of applying the proposed two-objective genetic algorithm have been compared with the results of applying four well-known multi-objective genetic algorithms on the problem of optimizing the coefficients. The results of this comparison show that the proposed algorithm has outperformed the other compared methods based on the S indicator and run time, and it is also ranked second after the NSGAII algorithm in terms of the HV indicator. Finally, for evaluating the performance of the proposed algorithm with other well-known methods, the set of ZDT problems including ZDT1, ZDT2, ZDT3, ZDT4, and ZDT6 has also been taken into consideration. At this stage, the performance of the proposed algorithm has been compared with the four mentioned algorithms based on four key indicators, including GD, S, H, and run time. The results show, the proposed algorithm has outperformed significantly in terms of run time in all five ZDT problems. In terms of GD indicator, the performance of our proposed algorithm is located in the first or second rank among all considered algorithms. In addition, in terms of S and H indicators in many cases, the proposed algorithm outperformed the other well-known algorithms.
Keywords: Branch business space, coefficients of performance evaluation indicators, clustering, optimization, two-objective genetic algorithm -
سرطان پستان در حال حاضر شایع ترین سرطان تشخیص داده شده و علت اصلی مرگ و میر ناشی از سرطان در زنان در سراسر جهان است. در سال های اخیر در حوزه مطالعات سرطان پستان و روند درمان این بیماری، تحلیل زمان بقای بیماران مبتلا، بسیار مورد توجه بوده است. انتخاب مدل مناسب برای تحلیل زمان بقا چالش اصلی در تحلیل بقا این بیماران است. در این پژوهش کاربردی به کمک روش های یادگیری ماشین نیمه نظارتی مبتنی بر گراف، مدلی برای تحلیل بقا بیماران مبتلا به سرطان پستان پیشنهاد شده است. اطلاعات بالینی و فارماکوژنومیکی، به همراه نتایج مصرف داروی تاموکسی فن در فرایند درمان سرطان تهاجمی مربوط به 3833 بیمار مبتلا به سرطان پستان که در بازه 5 سال تحت پیگیری بوده اند، مورد استفاده قرار گرفته است. همچنین با شبیه سازی مدل ها در نرم افزار متلب، عملکرد مدل پیشنهادی در تخمین زمان بقای عاری از بیماری تهاجمی و سایر پارامترهای بقا با مدل های رایج تحلیل بقا، مورد ارزیابی قرار گرفته است. نتایج نشان می دهد که با به کارگیری مدل پیشنهادی تحلیل بقا در پیش بینی زمان بقا عاری از سرطان پستان تهاجمی و همچنین استفاده ترکیبی از ویژگی های بالینی و فارماکوژنومیکی، دقت پیش بینی 14 درصد بیشتر از زمانی بود که فقط از ویژگی های بالینی استفاده شد و 15 درصد بیشتر از زمانی بود که فقط ویژگی های فارماکوژنومیکی به کار گرفته شد. علاوه بر این، مدل پیشنهادی تحلیل بقا در پیش بینی زمان بقا عاری از بیماری تهاجمی و پارامتر نسبت خطر در مقایسه با مدل های رایج تحلیل بقا دقت بالاتری داشته است.کلید واژگان: تاموکسی فن, تحلیل بقا, زمان بقا عاری از بیماری تهاجمی, سرطان پستان, مدل شتاب دار زمان شکست, مدل خطرهای متناسب کاکس, یادگیری ماشین, یادگیری نیمه نظارتی مبتنی بر گرافBreast cancer is currently the most frequently diagnosed cancer and leading cause of cancer death in women worldwide. Researchers have been researching the best treatment for breast cancer. Their focus has been on preventing recurrence after the initial treatment of patients. Choosing the appropriate model for survival time analysis is the main challenge in the survival analysis of these patients. In this applied research, using graph-based semi-supervised learning method a new survival analysis model is proposed for analyzing the survival of breast cancer patients. Also, a dataset of 3833 patients with breast cancer who were followed up for 5 years was used. The clinical and pharmacogenomics information, including the results of Tamoxifen use and effect on the treatment of invasive cancer, was also available and used. To validate the proposed model, by introducing the evaluation parameters and simulation of the models in MATLAB software, the model performance is compared with previous models of survival analysis. The results demonstrate that by applying the proposed model in predicting invasive disease-free survival time and when a combination of the clinical and the pharmacogenomics features were used the estimation accuracy was 14% higher than when only the clinical features were used. Moreover, the estimated accuracy was 15% higher than when only the pharmacogenomics features were used. The proposed survival analysis model has a high capability for identifying survival risk and high accuracy in predicting patients' survival time.Keywords: AFT Model, breast cancer, Cox-PH model, Invasive Disease-free Survival Time, Graph-based Semi-supervised learning, Machine Learning, Survival analysis, Tamoxifen
-
مقدمه
فارماکوژنومیکس و استفاده از ابزارهای هوش مصنوعی در آن یکی از جدیدترین زمینه های تحقیقاتی بیوانفورماتیک است. یکی از داروهای بسیار مهم که تعیین دوز اولیه درمانی آن کار مشکلی است، داروی ضدانعقادی وارفارین می باشد. وارفارین یک داروی ضد انعقاد خوراکی است که انتخاب دوز بهینه آن به دلیل پنجره درمانی باریک و روابط پیچیده فاکتورهای فردی، چالش برانگیز است. هدف این پژوهش تعیین دوز اولیه بهینه می باشد.
روشدر میان روش های مبتنی بر کرنل، مقایسه و شناسایی کرنل مناسب مورد بحث قرار نگرفته است. در این پژوهش ضمن بررسی دقیق این رویکرد، الگوریتم های مختلف انتخاب ویژگی را مورد آنالیز قرار داده و با تکیه به نظر خبرگان، زیرمجموعه مناسب از متغیرهای پیش بین موثر جهت تخمین دوز شناسایی خواهد شد.
نتایجدر این مطالعه از مجموعه داده ای جمع آوری شده توسط کنسرسیوم بین المللی وارفارین استفاده شده است. نتایج نشان می دهد که ماشین بردار پشتیبان با کرنل مناسب و زیرمجموعه ویژگی های پیشنهادی قادر است به طور موفقیت آمیزی دوز ایده آل وارفارین را برای درصد قابل توجهی از بیماران با خطایی حدود 0/7 میلی گرم در هفته پیش بینی کند.
نتیجه گیریتخمین با نسخه حداقل مربعات رگرسیون بردار پشتیبان مبتنی بر کرنل مناسب و با یک استراتژی مناسب انتخاب ویژگی صورت گرفت. در این روش، رویکرد بهتری برای پیش بینی دوز بهینه درمانی وارفارین ارایه شده است که قادر است خطای دوزهای اشتباه و عواقب ناشی از آن را به طور قابل ملاحظه ای کاهش دهد.
کلید واژگان: فارماکوژنومیکس, تخمین دوز اولیه وارفارین, انتخاب ویژگی, رگرسیون بردار پشتیبان حداقل مربعاتIntroductionUsing artificial intelligence tools in pharmacogenomics is one of the latest bioinformatics research fields. One of the most important drugs that determining its initial therapeutic dose is difficult is the anticoagulant warfarin. Warfarin is an oral anticoagulant that, due to its narrow therapeutic window and complex interrelationships of individual factors, the selection of its optimal dose is challenging.
MethodAmong the relatively successful methods of kernel-based estimation, comparison and identification of suitable kernels have not been researched. In the present research, while carefully examining this approach, different features of selection algorithms were analyzed based on expert opinions, and an appropriate subset of efficient predictor variables was identified for dose estimation.
ResultsIn the current study, a dataset collected by the International Warfarin Consortium was used. The results showed that the support vector machine with a suitable kernel and a subset of the proposed features can successfully predict the ideal dose of warfarin for a significant percentage of patients with an error of approximately 0.7 mg per week.
ConclusionThe estimation was conducted using the least squares version of the support vector regression based on a suitable kernel and feature selection strategy. In this method, a better approach for predicting the optimal therapeutic dose of warfarin was presented, which can significantly reduce the wrong dose error and its consequences.
Keywords: Pharmacogenomics, Initial Warfarin Dose Estimation, Feature Selection, Least Squares Support Vector Regression -
تحلیل احساسات یا نظرکاوی شاخه ای از علوم کامپیوتر و پردازش زبان طبیعی است که سعی دارد ماشین و هوش مصنوعی را با احساس و عواطف انسانی آشنا سازد.طعنه کاوی نیز از زیرشاخه های تحلیل احساسات است و هر دو بدنبال تشخیص صحیح احساسات مثبت و منفی نهفته در متن هستند. استفاده از طعنه در شبکه های اجتماعی بسیار مرسوم است، زیرا به این طریق می-توان انتقاد را با زبان طنز انجام داد. آشکارسازی طعنه در تشخیص درستی قطبش یک نظر، تاثیر به خصوصی دارد و می تواند به فهم متن توسط ماشین کمک کند و منظور نویسنده متن، شفاف تر فهمیده شود. به این هدف، 8000 توییت فارسی که بر چسب احساس دارند و از لحاظ وجود یا عدم وجود طعنه بررسی شدهاند، مورد استفاده قرار گرفته است. نوآوری این پژوهش در استخراج کلمات کلیدی از جملات طعنه دار است که باعث ایجاد طعنه و کنایه شده اند. در این پژوهش دستهبند مجزایی برای شناسایی طعنه در متن طراحی و اموزش داده شده است و سپس خروجی های این ردهبند به عنوان ویژگی افزوده در اختیار دستهبند شناسایی احساس متن قرار می گیرد. همچنین علاوه بر بقیه کلمات کلیدی استخراج شده از متن از شکلک ها و هشتگ های موجود در متن نیز به عنوان ویژگی استفاده شده است. دستهبندهای بیز، ماشین بردار پشتیبان و شبکه عصبی به عنوان دستهبندهای پایه استفاده شدهاند و در نهایت از ترکیب دستهبندها در شناسایی احساس متن استفاده شد. نتایج این پژوهش نشان میدهد که شناسایی طعنه موجود در متن و استفاده از آن در شناسایی احساس دقت نتایج را افزایش میدهد.
کلید واژگان: تحلیل احساس, نظرکاوی, طعنهکاوی, توییتر, ترکیب دسته بندهاSentiment analysis is a branch of computer science and natural language processing that seeks to familiarize machines with human emotions and make them recognizable. Both sentiment analysis and sarcasm which is a sub-field of the former, seek to correctly identify the hidden positive and negative emotions of the text. The use of sarcasm on social media, where criticism can be exercised within the context of humor, is quite common. Detection of sarcasm has a special effect on correctly recognizing the polarization of an opinion, and thus not only it can help the machine to understand the text better, but also makes it possible for the respective author to get his message across more clearly. For this purpose, 8000 Persian tweets that have emotional labels and examined for the presence or absence of sarcasm have been used. The innovation of this research is in extracting keywords from sarcastic sentences. In this research, a separate classifier has been trained to identify irony of the text. The output of this classifier is provided as an added feature to the text recognition classifier. In addition to other keywords extracted from the text, emoticons and hashtags have also been used as features. Naive Bayes, support vector machines, and neural networks were used as baseline classifiers, and finally the combination of classifiers was used to identify the feeling of the text. The results of this study show that identifying the irony in the text and using it to identify emotions increases the accuracy of the results.
Keywords: Sentiment analysis, opinion mining, sarcasm detection, twitter, ensemble learning -
مدل نزدیک ترین همسایگی (KNN) و سامانه های توصیه گر مبتنی بر این مدل (KRS) از موفق ترین سامانه های توصیه گر در حال حاضر در دسترس هستند. این روش ها شامل پیش بینی رتبه بندی یک آیتم بر اساس میانگین رتبه بندی آیتم های مشابه است. میانگین رتبه بندی آیتم های مشابه، با در نظر گرفتن تشابه تعریف شده، میانگین امتیازی را به هر آیتم، به عنوان ویژگی به آن خواهد داد. در این مقاله KRS ایجاد شده با ترکیب رویکردهای زیر ارایه شده است: (الف) استفاده از میانگین و واریانس رتبه بندی اقلام به عنوان ویژگی های آیتم، برای یافتن موارد مشابه در (IKRS)؛ (ب) استفاده از میانگین و واریانس رتبه بندی کاربر به عنوان ویژگی های کاربر برای یافتن کاربران مشابه با KRS کاربرپسند (UKRS)؛ (ج) استفاده از میانگین وزنی برای تلفیق رتبه بندی کاربران/آیتم های همسایه. (د) استفاده از یادگیری جمعی. سه روش پیشنهادی EVMBR، EWVMBR و EWVMBR-G در این مقاله پیشنهاد داده شده است. هر سه روش مبتنی بر کاربر بوده، که در آن ها از فاصله VM به عنوان معیار تفاوت بین کاربران/آیتم ها، برای یافتن کاربران/آیتم های همسایه استفاده و سپس به ترتیب از میانگین غیروزنی، وزنی و وزنی بر اساس مدل ترکیبی کوواریانس کامل گوسین، برای پیش بینی رتبه بندی کاربر ناشناخته استفاده می شوند. هر سه روش مبتنی بر کاربر بوده، که در آن ها از فاصله VM به عنوان معیار تفاوت بین کاربران/آیتم ها، برای یافتن کاربران/آیتم های همسایه استفاده و سپس میانگین به ترتیب از میانگین غیروزنی، وزنی، وزنی بر اساس مدل ترکیبی کوواریانس کامل گوسین رتبه بندی، برای پیش بینی رتبه بندی کاربر ناشناخته استفاده می شوند. ارزیابی های تجربی نشان می دهد که سه روش پیشنهادی EVMBR، EWVMBR و EWVMBR-G، که از یادگیری جمعی استفاده می کند، دقیق ترین روش در بین روش های ارزیابی شده است. بسته به مجموعه داده، روش پیشنهادی EWVMBR-G موفق به دست یابی به بیست تا سی درصد خطای مطلق کمتر از MBR اصلی شده است. از نظر زمان اجرا، روش های پیشنهادی قابل مقایسه با MBR و بسیار سریع تر از روش slope-one و روش های توصیه گر KNN مبتنی بر کسینوس یا پیرسون هستند.
کلید واژگان: K-نزدیک ترین همسایه, رتبه بندی, واریانس, سیستم پیشنهاددهندهK-nearest neighbors (KNN) based recommender systems (KRS) are among the most successful recent available recommender systems. These methods involve in predicting the rating of an item based on the mean of ratings given to similar items, with the similarity defined by considering the mean rating given to each item as its feature. This paper presents a KRS developed by combining the following approaches: (a) Using the mean and variance of item ratings as item features to find similar items in an item-wise KRS (IKRS); (b) Using the mean and variance of user ratings as user features to find similar users with a user-wise KRS (UKRS); (c) Using the weighted mean to integrate the ratings of neighboring users/items; (d) Using ensemble learning. Three proposed methods EVMBR, EWVMBR and EWVMBR-G are presented in this paper. All three methods are user-based, in which VM distance is used as a measure of the difference between users / items, to find neighboring users / items, and then the weighted average is weighted, respectively. Also, weights based on the Gaussian combined covariance model are used to predict unknown user ratings. Our empirical evaluations show that the proposed method EVMBR, EWVMBR and EWVMBR-G, which utilizes ensemble learning, are the most accurate among the methods evaluated. Depending on the dataset, the proposed method EWVMBR-G managed to achieve 20 to 30 percent lower mean absolute error than the original MBR. In terms of runtime, the proposed methods are comparable to the MBR and much faster than the slope-one method and the cosine- or Pearson-based KNN recommenders.
Keywords: K-Nearest Neighbor, Rating, Variance, Recommender System -
انتظار می رود سامانه های پیشنهاد گر (RS) قلم های دقیق را به مصرف کنندگان پیشنهاد دهند. شروع سرد مهم ترین چالش در RSها است. RSهای ترکیبی اخیر، دو مدل پالایش محتوا پایه (ConF)و پالایش مشارکتی (ColF) را با هم ترکیب می کنند. در این پژوهش، یک RS ترکیبی مبتنی بر هستان شناسی معرفی می شود که در آن هستان شناسی در بخش ConF به کار رفته است، این در حالی است که ساختار هستان شناسی توسط بخش ColF بهبود داده می شود. در این مقاله، رویکرد ترکیبی جدیدی مبتنی بر ترکیب شباهت جمعیت شناختی و شباهت کسینوسی بین کاربران به منظور حل مشکل شروع سرد از نوع کاربر جدید، ارایه شده است. همچنین، رویکرد جدیدی مبتنی بر ترکیب شباهت هستان شناسی و شباهت کسینوسی بین اقلام به منظور حل مساله شروع سرد از نوع قلم جدید، ارایه شده است. ایده اصلی روش پیشنهادی، گسترش پروفایل های کاربر/ قلم بر اساس سازوکارهای مختلف برای ایجاد پروفایل با عملکرد بالاتر برای کاربران/قلم ها است. روش پیشنهادی در یک مجموعه داده واقعی ارزیابی شده است و آزمایش ها نشان می دهند که روش پیشنهادی در مقایسه با روش های پیشرفتهRS ، به خصوص در مواجهه با مساله شروع سرد، عملکرد بهتری دارد.
کلید واژگان: سامانه پیشنهاد گر, هستان شناسی, توسعه پروفایل, سامانه پیشنهاد گر ترکیبیRecommender systems that predict user ratings for a set of items are known as subset of information filtration systems. They help users find their favorite items from thousands of available items. One of the most important and challenging problems that recommendation systems suffer from is the problem of dispersion. This means that due to the scatter of data in the system, they are not able to find popular items with the desired reliability and accuracy. This is especially true when there are a large number of items and users in the system and the filled ratings are low. Another challenging problem that these systems suffer from is their scalability. One of the major problems with these systems is the cold start. This problem occurs due to the small number of items rated by the user, i.e. the scatter of users. This problem is divided into two categories: new user and new item. The main focus of this article is on the problem of the new user type. This problem occurs when a new user has just logged in and has not rated any item yet, or when the user has already logged in but has been less active in rating. The goal is to address these three challenges. In this study, an ontology-based hybrid recommender system is introduced in which ontology is used in the content-based filtering section, while the ontology structure is improved by the collaborative filtering section. In this paper, a new hybrid approach based on combining demographic similarity and cosine similarity between users is presented in order to solve the cold start problem of the new user type. Also, a new approach based on combining ontological similarity and cosine similarity between items is proposed to solve the cold start problem of the new item type. The main idea of the proposed method is to extend users’/items’ profiles based on different mechanisms to create higher-performance profiles for users/items. The proposed method is evaluated in a real data set, and experiments show that the proposed method performs better than the advanced recommender system methods, especially in the case of cold start.
Keywords: Recommender System, Ontology, Profile Expansion, Hybrid Recommender System -
سامانه های پیشنهادگر در زمینه تجارت الکترونیک شناخته شده هستند. از این گونه سیستم ها انتظار می رود که کالاها و اقلام مهمی (از جمله موسیقی و فیلم) را به مشتریان پیشنهاد دهند. در سامانه های پیشنهادگر سنتی از جمله روش های پالایش محتوا پایه و پالایش مشارکتی، چالش ها و مشکلات مهمی از جمله شروع سرد، مقیاس پذیری و پراکندگی داده ها وجود دارد. اخیرا به کارگیری روش های ترکیبی توانسته با بهره گیری از مزایای این روش ها با هم، برخی از این چالش ها را تا حد قابل قبولی حل نمایند. در این مقاله سعی می شود روشی برای پیشنهاد ارایه شود که ترکیبی از دو روش پالایش محتوا پایه و پالایش مشارکتی (شامل دو رویکرد حافظه پایه و مدل پایه) باشد. روش پالایش مشارکتی حافظه پایه، دقت بالایی دارد، اما از مقیاس پذیری کمی برخوردار است. در مقابل، رویکرد مدل پایه دارای دقت کمی در ارایه پیشنهاد به کاربران بوده اما مقیاس پذیری بالایی از خود نشان می دهد. در این مقاله سامانه پیشنهادگر ترکیبی مبتنی بر هستان شناسی ارایه شده که از مزایای هر دو روش بهره برده و براساس رتبه بندی های واقعی، مورد ارزیابی قرار می گیرد. هستان شناسی، توصیفی واضح و رسمی برای تعریف یک پایگاه دانش شامل مفاهیم (کلاس ها) در حوزه موضوعی، نقش ها (رابط ها) بین نمونه های مفاهیم، محدودیت های مربوط به رابطه ها، همراه با یک مجموعه از عناصر و اعضا (یا نمونه ها) است که یک پایگاه دانش را تعریف می کند. هستان شناسی در بخش پالایش محتوا پایه مورد استفاده قرار می گیرد و ساختار هستان شناسی توسط تکنیک های پالایش مشارکتی بهبود می یابد. در روش ارایه شده در این پژوهش، عملکرد سیستم پیشنهادی بهتر از عملکرد پالایش محتوا پایه و مشارکتی است. روش پیشنهادی با استفاده از یک مجموعه داده واقعی ارزیابی شده است و نتایج آزمایش ها نشان می دهد روش مذکور کارایی بهتری دارد. همچنین با توجه به راه کارهای ارایه شده در مقاله حاضر، مشخص شد، روش پیشنهادی دقت و مقیاس پذیری مناسبی نسبت به سامانه های پیشنهادگری دارد که صرفا حافظه پایه (KNN) و یا مدل پایه هستند.
کلید واژگان: سامانه پیشنهادگر, هستان شناسی, پالایش حافظه پایه, پالایش مدل پایه, خوشه بندی, KNNThe recommender systems are models that are to predict the potential interests of users among a number of items. These systems are widespread and they have many applications in real-world. These systems are generally based on one of two structural types: collaborative filtering and content filtering. There are some systems which are based on both of them. These systems are named hybrid recommender systems. Recently, many researchers have proved that using content models along with these systems can improve the efficacy of hybrid recommender systems. In this paper, we propose to use a new hybrid recommender system where we use a WordNet to improve its performance. This WordNet is also automatically generated and improved during its generation. Our ontology creates a knowledge base of concepts and their relations. This WordNet is used in the content collaborator section in our hybrid recommender system. We improve our ontological structure via a content filtering technique. Our method also benefits from a clustering task in its collaborative section. Indeed, we use a passive clustering task to improve the time complexity of our hybrid recommender system. Although this is a hybrid method, it consists of two separate sections. These two sections work together during learning. Our hybrid recommender system incorporates a basic memory-based approach and a basic model-based approach in such a way that it is as accurate as a memory-based approach and as scalable as a model-based approach. Our hybrid recommender system is assessed by a well-known data set. The empirical results indicate that our hybrid recommender system is superior to the state of the art methods. Also, our hybrid recommender system is more accurate and scalable compared to the recommender systems, which are simply memory-based (KNN) or basic model-based. The empirical results also confirm that our hybrid recommender system is superior to the state of the art methods in terms of the consumed time. While this method is more accurate than model-based methods, it is also faster than memory-based methods. However, this method is not much weaker in terms of accuracy than memory-based methods, and not much weaker in terms of speed than model-based methods.
Keywords: Recommender System, Ontology, Memory-based Filtering, Model-based Filtering, Clustering, KNN -
توییتر یکی از محبوب ترین و مشهورترین شبکه های اجتماعی برخط برای گسترش اطلاعات است که در عین قابل اعتماد بودن، می تواند به عنوان منبعی برای گسترش شایعات باشد. شایعاتی غیرواقعی و فریبنده که می تواند تاثیرات جبران ناپذیری برروی افراد و جامعه به وجود بیاورد. در این پژوهش مجموعه کاملی از ویژگی های جدید ساختاری مربوط به درخت پاسخ و گراف کاربران در تشخیص مکالمه های شایعه توییتر استخراج شدند. این ویژگی ها با توجه به معیارهای سنتی گراف ها و معیارهای مخصوص انتشار شایعه، در بازه های زمانی مختلف به مدت 24 ساعت از زمان شروع مکالمه ها در خصوص رویدادهای بحرانی در توییتر استخراج شده اند. نتایج حاصل از بررسی ویژگی های جدید، دیدگاه عمیقی از ساختار انتشار اطلاعات در مکالمه ها را فراهم می کند. بر اساس نتایج به دست آمده، ویژگی های جدید ساختاری در تشخیص مکالمه های شایعه در رویدادهای توییتر موثر هستند؛ ازاین رو، الگوریتم دسته بند شایعه مبتنی بر ویژگی های جدید ساختاری، زبانی و کاربران در تشخیص مکالمه های شایعه زبان انگلیسی توییتر ، پیشنهاد داده شد. روش پیشنهادی در مقایسه با روش های پایه، عملکرد بهتری دارد. همچنین، با توجه به اهمیت کاربر توییت منبع در مکالمه ها، این کاربر از جنبه های مختلفی موردبررسی و آنالیز قرار گرفت.
کلید واژگان: مکالمه, تشخیص شایعه, توییتر, درخت پاسخ, گراف کاربرانToday, online social media with numerous users from ordinary citizens to top government officials, organizations, artists and celebrities, etc. is one of the most important platforms for sharing information and communication. These media provide users with quick and easy access to information so that the content of shared posts has the potential to reach millions of users in a matter of seconds. Twitter is one of the most popular and practical/used online social networks for spreading information, which, while being reliable, can also, be a source for spreading unrealistic and deceptive rumors as a result can have irreversible effects on individuals and society. Recently, several studies have been conducted in the field of rumor detection and verify using models based on deep learning and machine learning methods. Previous research into rumor detection has focused more on linguistic, user, and structural features. Concerning structural features, they examined the retweet propagation graph. However, in this study, unlike the previous studies, new structural features of the reply tree and user graph in extracting rumored conversations were extracted and analyzed from different aspects. In this study, the effectiveness of new structural features related to reply tree and user graph in detecting rumored conversations in Twitter events were evaluated from different aspects. First, the structural features of the reply tree and user graph were extracted at different time intervals, and important features in these intervals were identified using the Sequential Forward Selection approach. To evaluate the usefulness of valuable new structural features, these features have been compared with consideration of linguistic and user-specific features. Experiments have shown that combining new structural features with linguistic and user-specific features increases the accuracy of the rumor detection classification. Therefore, a rumor classification algorithm based on new structural, linguistic, and user-specific features in rumor conversation detection was proposed. This algorithm performs better than the basic methods and detects rumored conversations with greater accuracy. In addition, due to the importance of the source tweet user in conversations, this user was examined and analyzed from different aspects. The results showed that most rumored conversations were started by a small number of users. Rumors can be prevented by early identification of these users on Twitter events.
Keywords: Conversion, Rumor detection, Twitter, Reply tree, User graph -
دستهبندی، یکی از وظایف مهم دادهکاوی و یادگیری ماشین است و درخت تصمیم به عنوان یکی از الگوریتمهای پرکاربرد دستهبندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با دادههای حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیتهای حافظه و زمان اجرا مواجه است. الگوریتمهای ساخت درخت باید همه مجموعه داده آموزش و یا بخش زیادی از آن را درون حافظه نگه دارند. الگوریتمهایی که به علت انتخاب زیرمجموعهای از داده با محدودیت حافظه مواجه نیستند، زمان اضافی جهت انتخاب داده صرف میکنند. جهت انتخاب بهترین ویژگی برای ایجاد انشعاب در درخت هم باید محاسبات زیادی بر روی این مجموعه داده انجام شود. در این مقاله، یک رویکرد مقیاسپذیر افزایشی بر مبنای تقسیم سریع و هرس، جهت ساخت درخت تصمیم بر روی مجموعه دادههای حجیم ارایه شده است. الگوریتم ارایهشده درخت تصمیم را با استفاده از کل مجموعه داده آموزش اما بدون نیاز به ذخیرهسازی داده در حافظه اصلی میسازد. همچنین جهت کاهش پیچیدگی درخت از روش پیشهرس استفاده شده است. نتایج حاصل از اجرای الگوریتم بر روی مجموعه دادههای UCI نشان میدهد الگوریتم ارایهشده با وجود دقت و زمان ساخت قابل رقابت با سایر الگوریتمها، بر مشکلات حاصل از پیچیدگی درخت غلبه کرده است.
کلید واژگان: پیش هرس, داده کاوی, درخت تصمیم, مقیاس پذیرClassification is one of the most important tasks in data mining and machine learning; and the decision tree, as one of the most widely used classification algorithms, has the advantage of simplicity and the ability to interpret results more easily. But when dealing with huge amounts of data, the obtained decision tree would grow in size and complexity, and therefore require excessive running time. Almost all of the tree-construction algorithms need to store all or part of the training data set; but those algorithms which do not face memory shortages because of selecting a subset of data, can save the extra time for data selection. In order to select the best feature to create a branch in the tree, a lot of calculations are required. In this paper we presents an incremental scalable approach based on fast partitioning and pruning; The proposed algorithm builds the decision tree via using the entire training data set but it doesn't require to store the whole data in the main memory. The pre-pruning method has also been used to reduce the complexity of the tree. The experimental results on the UCI data set show that the proposed algorithm, in addition to preserving the competitive accuracy and construction time, could conquer the mentioned disadvantages of former methods.
Keywords: Pre-pruning, data mining, decision tree, scalable -
Many of the real-world issues have multiple conflicting objectives that the optimization between contradictory objectives is very difficult. In recent years, the Multi-objective Evolutionary Algorithms (MOEAs) have shown great performance to optimize such problems. So, the development of MOEAs will always lead to the advancement of science. The Non-dominated Sorting Genetic Algorithm II (NSGAII) is considered as one of the most used evolutionary algorithms, and many MOEAs have emerged to resolve NSGAII problems, such as the Sequential Multi-Objective Algorithm (SEQ-MOGA). SEQ-MOGA presents a new survival selection that arranges individuals systematically, and the chromosomes can cover the entire Pareto Front region. In this study, the Archive Sequential Multi-Objective Algorithm (ASMOGA) is proposed to develop and improve SEQ-MOGA. ASMOGA uses the archive technique to save the history of the search procedure, so that the maintenance of the diversity in the decision space is satisfied adequately. To demonstrate the performance of ASMOGA, it is used and compared with several state-of-the-art MOEAs for optimizing benchmark functions and designing the I-Beam problem. The optimization results are evaluated by Performance Metrics such as hypervolume, Generational Distance, Spacing, and the t-test (a statistical test); based on the results, the superiority of the proposed algorithm is identified clearly.
Keywords: Multi-Objective Evolutionary Algorithms (MOEAs), Non-dominated Sorting Genetic Algorithm II (NSGAII), Sequential Multi-Objective Algorithm (SEQ-MOGA), Benchmark functions, t-test -
در این مقاله روشی مبتنی بر گراف به عنوان استخراج ویژگی برای دنباله های با طول متغیر پیشنهاد می شود. روش پیشنهادی بدون ثابت کردن طول دنباله ها، با تعیین پر تکرارترین دستورها و گذاشتن باقی دستورها در مجموعه ‘other’ از لحاظ سرعت و حافظه صرفه جویی می کند. با توجه به میزان شباهت ویژگی ها، هر نمونه امتیازی می گیرد و از امتیازات جهت دسته بندی استفاده می شود. برای بهبود نتایج، دو رویکرد پیشنهاد می شود. در رویکرد نخست، ویژگی های استخراج شده از روش های امتیازدهی بر روی آپکد، هگزادسیمال و فراخوانی سیستمی در ورودی دسته بندها ترکیب می شوند. در رویکرد دوم، خروجی دسته بندهای مختلف ترکیب شده و از رای اکثریت استفاده می شود. رویکرد پیشنهادی با دقت 97 % بدافزارهای دگرگون شده رایانه ای از مجموعه vxheaven را نه تنها شناسایی، بلکه دسته بدافزارها را نیز تعیین می کند؛ در حالی که روش هایSSD و HMM تحت شرایط یکسان با دقت 84 % و 80 % توانستند بدافزارها را شناسایی کنند.
کلید واژگان: آشکارسازی بدافزارها, روش های مبتنی بر گراف, ترکیب دسته بندها, دسته بندی با طول متغیر, ماشین بردار پشتیبانIn this paper, a novel method based on the graph is proposed to classify the sequence of variable length as feature extraction. The proposed method overcomes the problems of the traditional graph with variable length of data, without fixing length of sequences, by determining the most frequent instructions and insertion the rest of instructions on the set of “other”, save speed and memory. According to features and the similarities of them, a score is given to each sample and that is used for classification. To improve the results, the method is not used alone, but in the two approaches, this method is combined with other existing Technique to get better results. In the first approach, which can be considered as a feature extraction, extracted features from scoring techniques (Hidden Markov Model, simple substitution distance and similarity graph) on op-code sequences, hexadecimal sequences and system calls are combined at classifier input. The second approach consists of two steps, in the first step; the scores which obtained from each of the scoring Technique are given to the three support vector machine. The outcomes are combined according to the weight of each Technique and the final decision is taken based on the majority vote. Among the components of the support vector machine, when given a higher weight in the similarity graph method (the proposed method), the result is better, Because the similarity graph method is more accurate than the other two methods. Then, in the second section, considering the strengths and benefits of each classifier, classifier outputs are combined and the majority voting is used. Three methods have been tested for group combinations, including Ensemble Averaging, Bagging, and Boosting. Ensemble Averaging consisting of the combination of four classifiers of random forests, a support vector machine (as obtained in the previous section), K nearest neighbors and naive Bayes, and the final decision is taken based on the majority vote; therefore, it is used as the proposed method. The proposed approach could detect metamorphic malware from Vxheaven set and also determines categories of malware with accuracy of 97%, while the SSD and HMM methods under the same conditions could detect malware with an accuracy of 84% and 80% respectively.
Keywords: Malware Detection, Graph Techniques, Combining Classifiers, Variable Length Classification, Support vector machine -
تراوایی یا نفوذپذیری خاصیتی از سنگ مخزن است که به جریان سیال از سنگ مخزن می پردازد و از فاکتورهای مهم در تولید نفت و گاز از مخزن به حساب می آید. این پارامتر در شرایط آزمایشگاهی از طریق مغزه گیری به دست می آید که روشی پرهزینه و زمان بر است و همچنین برای همه چاه های موجود در یک میدان نفتی امکان پذیر نیست. امروزه این پارامتر را با استفاده از داده های لاگ پتروفیزیکی به روش های آماری و هوشمند محاسبه می کنند. در این مقاله از الگوریتم های هوشمند جهت پیش بینی تراوایی با استفاده از لاگ های پتروفیزیکی استفاده شده است. این پژوهش بر روی داده های چهار چاه کنگان و دالان واقع در میدان پارس جنوبی انجام شده است. از مجموع هشت ویژگی استخراج شده از هر چاه، با استفاده از روش انتخاب ویژگی مبتنی بر همبستگی، چهار ویژگی موثر در هر چاه انتخاب شدند. سپس از روش های رگرسیون، شبکه عصبی چندلایه، شبکه عصبی RBF(Radial Basis Function) ، مدل درخت خطی محلی (LOLIMOT: Local Linear Model Trees)، سیستم فازی نوع یک و سیستم فازی نوع دو برای پیش بینی تراوایی استفاده شد. نتایج نشان داد که با توجه به وجود عدم قطعیت در پارامترهای پتروفیزیکی و تراوایی، سیستم فازی نوع دو عدم قطعیت ها را بهتر پوشش می دهد. این روش در حالت پایه، تراوایی را با دقت 9481/0 و ریشه دوم میانگین مربعات خطای 3060/0 پیش بینی کرد. با استفاده از روش ترکیبی GSA-GA (Gravitational Search Algorithm - Genetic algorithm)، تعداد قواعد فازی و نیز با استفاده از روش خوشه بندی K-means، توابع عضویت فازی بهبود یافت و این بهبودها منجر به افزایش دقت پیش بینی تراوایی با ضریب تعیین 9768/0 و کاهش ریشه دوم میانگین مربعات خطا به مقدار 1602/0 شد.کلید واژگان: پیش بینی خواص سنگ, تراوایی, سیستم فازی نوع دو, الگوریتم جستجوی گرانشی, الگوریتم ژنتیکPermeability is a property of the reservoir rock, which deals with the flow of fluid from the reservoir and is an important factor in oil and gas production. This parameter is measured via coring and core laboratory analysis, which is an expensive and time-consuming process and also is not a feasible approach for every oil and gas field. Nowadays, the permeability can also be calculated using the data of petrophysical logs by means of statistical and intelligent techniques. The present study uses four wells drilled in Kangan and Dalan formations within South Pars gas field to predict permeability using fuzzy logic. Out of totally eight features extracted from each well, four more effective features were selected using correlation-based feature selection tools. Then, regression, multi-layer perceptron, RBF neural network, Local Linear Model Trees (LOLIMOT), type-1 and type -2 fuzzy systems were utilized for permeability prediction. The results indicated that due to the uncertainty in the petrophysical and permeability parameters, type-2 Fuzzy systems cover better the uncertainties. The aforementioned method predicts the best number of rules using the GSA-GA (Gravitational Search Algorithm - Genetic algorithm) combined algorithms. Fuzzy membership functions were also improved using the K-means clustering algorithms. These improvements led to increased accuracy of the predicted permeability with a coefficient of 0.9768, and a decrease in the root mean square error to 0.1602.Keywords: predicting reservoir rock type, Permeability, type -2 fuzzy system, Gravitational Search Algorithm, Genetic Algorithm
- در این صفحه نام مورد نظر در اسامی نویسندگان مقالات جستجو میشود. ممکن است نتایج شامل مطالب نویسندگان هم نام و حتی در رشتههای مختلف باشد.
- همه مقالات ترجمه فارسی یا انگلیسی ندارند پس ممکن است مقالاتی باشند که نام نویسنده مورد نظر شما به صورت معادل فارسی یا انگلیسی آن درج شده باشد. در صفحه جستجوی پیشرفته میتوانید همزمان نام فارسی و انگلیسی نویسنده را درج نمایید.
- در صورتی که میخواهید جستجو را با شرایط متفاوت تکرار کنید به صفحه جستجوی پیشرفته مطالب نشریات مراجعه کنید.