جستجوی مقالات مرتبط با کلیدواژه "support vector machine" در نشریات گروه "فناوری اطلاعات"
تکرار جستجوی کلیدواژه «support vector machine» در نشریات گروه «فنی و مهندسی»-
نشریه نوآوری های فناوری اطلاعات و ارتباطات کاربردی، سال دوم شماره 2 (پیاپی 6، تابستان 1401)، صص 15 -32
بسیاری از شرکت ها با تخلف در صورت های مالی موجب به هم ریختگی نظام اقتصادی می شوند و این امر موجب یک بحران مهم نظام اقتصادی شده است. راهکارهای مختلفی برای تشخیص وجود دارد که اکثرا انسانی می باشند. این راهکارها دارای هزینه های بالایی برای محاسبه و بررسی صورت های مالی تمامی شرکت ها دارند ازاین جهت باید به دنبال راهکاری بود که بتواند با استفاده از داده کاوی و خودکار این فرآیند تشخیص را انجام دهد. البته روش های داده کاوی نیز برای این قضیه ارائه شده اند که هر یک دارای مزایا و معایبی می باشند. روش های داده کاوی که تا به اینجا برای این کار ارائه شدند دارای سربار بالای محاسباتی و یا دقت پایین بودند. حال آنکه در روش پیشنهادشده در این تحقیق از درخت تصمیم گیری ID3 بهبودیافته به همراه شبکه بیزین و ماشین بردار پشتیبان به عنوان یک روش ترکیبی استفاده شده است. در این روش پیشنهادی برای بهبود عملکرد و دقت از الگوریتم مجموعه راف و تحلیل سلسله مراتبی در جهت انتخاب ویژگی های موثر کمک گرفته شده است. درختی که در روش پیشنهادی ایجاد می شود دارای کمترین عمق ممکن است و ازاین رو دارای سرعت بالایی است. سربار محاسباتی روش پیشنهادی به دلیل استفاده از الگوریتمی بهینه پایین می باشد. داده های استفاده شده در ارزیابی داده های مربوط به 3 سال از 60 شرکت است. در ارزیابی روش پیشنهادی نشان داده شده است که روش پیشنهادی دارای دقت 80 درصد می باشد که نسبت به روش های مشابه به خود دقت بالایی به حساب می آید. سربار زمانی در روش پیشنهادی O (m.n) و سربار حافظه O (n) است که m، نشان دهنده اندازه مجموعه آموزش و n نشان دهنده مجموعه ویژگی مورد استفاده در آموزش می باشد.
کلید واژگان: شبکه بیزین, ماشین بردار پشتیبان, درخت تصمیم, فازی راف, تحلیل سلسله مراتبی, تقلبJournal of Innovations of Aplied Information and Communication Technology, Volume:2 Issue: 2, 2024, PP 15 -32Many companies disrupt the economic system by violating their financial statements, which has led to a major economic crisis. There are various diagnostic strategies that are mostly human. These solutions have high costs for calculating and reviewing the financial statements of all companies, so we must look for a solution that can use data mining and automation to perform this diagnostic process. Of course, data mining methods have also been proposed for this case, each of which has advantages and disadvantages. The data mining methods presented so far have high computational overhead or low accuracy. However, in the method proposed in this research, the improved ID3 decision tree with Bayesian network and support vector machine has been used as a combined method. In this proposed method, to improve performance and accuracy, the rough set algorithm and hierarchical analysis are used to select effective features. The tree created in the proposed method has the lowest possible depth and therefore has a high velocity. The computational overhead of the proposed method is low due to the use of an optimal algorithm. The data used in the evaluation of 3-year data from 60 companies. In evaluating the proposed method, it is shown that the proposed method has an accuracy of 80%, which is considered to be high accuracy compared to similar methods. The time overhead in the proposed method is O(m.n) and the memory overhead is O(n) where m represents the size of the training set and n represents the feature set used in the training
Keywords: Bayesian Network, Support Vector Machine, Decision Tree, Fuzzy Rough, Hierarchical Analysis, Fraud -
Facial expressions determine the inner emotional states of people. Different emotional states such as anger, fear, happiness, etc. can be recognized on people's faces. One of the most important emotional states is the state of fear because it is used to diagnose many diseases such as panic syndrome, post-traumatic stress disorder, etc. The face is one of the biometrics that has been proposed to detect fear because it contains small features that increase the recognition rate. In this paper, a biological model inspired an early biological model is proposed to extract effective features for optimal fear detection. This model is inspired by the model of the brain and nervous system involved with the human brain, so it shows a similar function compare to brain. In this model, four computational layers were used. In the first layer, the input images will be pyramidal in six scales from large to small. Then the whole pyramid entered the next layer and Gabor filter was applied for each image and the results entered the next layer. In the third layer, a later reduction in feature extraction is performed. In the last layer, normalization will be done on the images. Finally, the outputs of the model are given to the svm classifier to perform the recognition operation. Experiments will be performed on JAFFE database images. In the experimental results, it can be seen that the proposed model shows better performance compared to other competing models such as BEL and Naive Bayes model with recognition accuracy, precision and recall of 99.33%, 99.71% and 99.5%, respectively.
Keywords: Fear Recognition, Early Biological model, Support Vector Machine, Facial Expressions -
An indispensable aspect of human life is energy. The escalating global population and the subsequent rise in the human need for energy, coupled with the constraints of fossil fuels, have compelled researchers to explore innovative techniques for energy production and the adoption of renewable energy sources. The construction of renewable power plants emerges as a paramount solution for achieving clean energy, a strategy successfully implemented in various countries globally, including India, China, the USA, Central Asian nations, and Africa. Strategically located and blessed with significant solar potential, Iran is a promising candidate for establishing solar power plants. Despite its high potential for constructing solar power plants, Iran faces limitations that require careful consideration. Investing in renewable power plant projects in Iran necessitates addressing various risks and uncertainties. This paper introduces an innovative approach to assessing the risks associated with solar power plants, utilizing an integrated method that combines Data Envelopment Analysis (DEA) and Support Vector Machine (SVM). In the initial phase, DEA cross-efficiency measures risk factors derived from Failure Modes and Effects Analysis (FMEA). This approach not only overcomes certain drawbacks of FMEA but also eliminates several limitations of DEA, enhancing the discrimination capability for decision units. Subsequently, a SVM is developed to monitor the process, concluding with tailored risk treatment and monitoring processes specifically designed for the unique context of Iran's solar energy landscape.Keywords: Cross Efficiency, Power Plant, Failure Modes, Effects Analysis, Risk, Support Vector Machine
-
There are numerous and various methods for solving the Multi-Attribute Decision-Making (MADM) problems in the literature, such as Technique for Order of Preference by Similarity to Ideal Solution (TOPSIS), Elimination and Choice Expressing Reality (ELECTRE), Analytic Hierarchy Process (AHP), etc. We have explored Support Vector Machine (SVM) as an efficient method for solving MADM problems. The SVM technique was proposed for classifying data at first. At the same time, in the current research, this popular method will be used to sort the preference alternatives in a MADM problem with interval data. The accuracy of the proposed technique will be compared with a popular extended method for interval data, say interval TOPSIS. Numerical experiments showed that admissible results can be obtained by the new method.Keywords: Multi-criteria decision making, Multi-attribute decision making, Support Vector Machine, TOPSIS, Interval Data
-
Foreground-background image segmentation has been an important research problem. It is one of the main tasks in the field of computer vision whose purpose is detecting variations in image sequences. It provides candidate objects for further attentional selection, e.g., in video surveillance. In this paper, we introduce an automatic and efficient Foreground-background segmentation. The proposed method starts with the detection of visually salient image regions with a saliency map that uses Fourier transform and a Gaussian filter. Then, each point in the maps classifies as salient or non-salient using a binary threshold. Next, a hole filling operator is applied for filling holes in the achieved image, and the area-opening method is used for removing small objects from the image. For better separation of the foreground and background, dilation and erosion operators are also used. Erosion and dilation operators are applied for shrinking and expanding the achieved region. Afterward, the foreground and background samples are achieved. Because the number of these data is large, K-means clustering is used as a sampling technique to restrict computational efforts in the region of interest. K cluster centers for each region are set for training of Support Vector Machine (SVM). SVM, as a powerful binary classifier, is used to segment the interest area from the background. The proposed method is applied on a benchmark dataset consisting of 1000 images and experimental results demonstrate the supremacy of the proposed method to some other foreground-background segmentation methods in terms of ER, VI, GCE, and PRI.
Keywords: Foreground-Background Segmentation, Support vector machine, k-means clustering, saliency map -
بسیاری از شرکت ها با تخلف در صورت های مالی موجب به هم ریختگی نظام اقتصادی می شوند و این امر موجب یک بحران مهم نظام اقتصادی شده است. راهکارهای مختلفی برای تشخیص وجود دارد که اکثرا انسانی می باشند. این راهکارها دارای هزینه های بالایی برای محاسبه و بررسی صورت های مالی تمامی شرکت ها دارند ازاین جهت باید به دنبال راهکاری بود که بتواند با استفاده از داده کاوی و خودکار این فرآیند تشخیص را انجام دهد. البته روش های داده کاوی نیز برای این قضیه ارایه شده اند که هر یک دارای مزایا و معایبی می باشند. روش های داده کاوی که تا به اینجا برای این کار ارایه شدند دارای سربار بالای محاسباتی و یا دقت پایین بودند. حال آنکه در روش پیشنهادشده در این تحقیق از درخت تصمیم گیری ID3 بهبودیافته به همراه شبکه بیزین و ماشین بردار پشتیبان به عنوان یک روش ترکیبی استفاده شده است. در این روش پیشنهادی برای بهبود عملکرد و دقت از الگوریتم مجموعه راف و تحلیل سلسله مراتبی در جهت انتخاب ویژگی های موثر کمک گرفته شده است. درختی که در روش پیشنهادی ایجاد می شود دارای کمترین عمق ممکن است و ازاین رو دارای سرعت بالایی است. سربار محاسباتی روش پیشنهادی به دلیل استفاده از الگوریتمی بهینه پایین می باشد. داده های استفاده شده در ارزیابی داده های مربوط به 3 سال از 60 شرکت است. در ارزیابی روش پیشنهادی نشان داده شده است که روش پیشنهادی دارای دقت 80 درصد می باشد که نسبت به روش های مشابه به خود دقت بالایی به حساب می آید. سربار زمانی در روش پیشنهادی O(m.n) و سربار حافظه O(n) است که m، نشان دهنده اندازه مجموعه آموزش و n نشان دهنده مجموعه ویژگی مورد استفاده در آموزش می باشد.
کلید واژگان: شبکه بیزین, ماشین بردار پشتیبان, درخت تصمیم, فازی راف, تحلیل سلسله مراتبی, تقلبJournal of Innovations of Aplied Information and Communication Technology, Volume:1 Issue: 4, 2023, PP 15 -32Many companies disrupt the economic system by violating their financial statements, which has led to a major economic crisis. There are various diagnostic strategies that are mostly human. These solutions have high costs for calculating and reviewing the financial statements of all companies, so we must look for a solution that can use data mining and automation to perform this diagnostic process. Of course, data mining methods have also been proposed for this case, each of which has advantages and disadvantages. The data mining methods presented so far have high computational overhead or low accuracy. However, in the method proposed in this research, the improved ID3 decision tree with Bayesian network and support vector machine has been used as a combined method. In this proposed method, to improve performance and accuracy, the rough set algorithm and hierarchical analysis are used to select effective features. The tree created in the proposed method has the lowest possible depth and therefore has a high velocity. The computational overhead of the proposed method is low due to the use of an optimal algorithm. The data used in the evaluation of 3-year data from 60 companies. In evaluating the proposed method, it is shown that the proposed method has an accuracy of 80%, which is considered to be high accuracy compared to similar methods. The time overhead in the proposed method is O(m.n) and the memory overhead is O(n) where m represents the size of the training set and n represents the feature set used in the training
Keywords: Bayesian Network, Support vector machine, Decision Tree, fuzzy rough, Hierarchical Analysis, fraud -
Spams are well-known examples of unsolicited text or messages which are sent by unknown individuals and cause issues for smartphone users. The inconvenience imposed on users, the loss of network traffic, the rise in the calculated cost, occupying more physical space on the mobile phone, and abusing and defrauding recipients are but a few of their downsides. Consequently, the automated identification of suspicious and spam messages is undoubtedly vitally important. Additionally, text messages which are smartly composed might be difficult to recognize. However, the present methodologies in this subject are hindered by the absence of adequate Persian datasets. A huge body of research and experiments has revealed that techniques based on deep and combined learning are superior at identifying unpleasant text messages. This work sought to develop an effective strategy for identifying SMS spam through utilizing combining machine learning classification algorithms together with deep learning models. After applying preprocessing on our gathered dataset, the suggested technique applies two convolutional neural network layers, the first of which being an LSTM layer, and the second one which is a fully connected layer to extract the data characteristics, thereby implementing the suggested deep learning approach. As part of the Machine Learning methodologies, the vector support machine makes use of the data and features at hand to determine the ultimate classification. Results indicate that the suggested model is implemented more effectively than the existing techniques, and an accuracy of 97.7% was achieved as a result.Keywords: SMS Spam, spam detection, Support Vector Machine, convolutional neural network, LSTM
-
According to current development in credit allocation and recent economic crises, planning for identification of credit risk has found special importance for investors, banks, shareholders and financial analysts, so that they are able to make proper decisions. Although credit loss is a common cost in banking industry, however, increase in this loss might affect the bank performance. Therefore, there is a strong need to reassess current approaches in risk evaluation of each loan and default rate of loan portfolios. Banks usually have their own internal validation models for loan risk measurement but these approaches are inappropriate and utilize simple mathematical approaches based on incomplete premises. In this paper, we have tried to estimate the possibility of default for legal customers using 20 financial ratios for 200 healthy and 200 unhealthy companies receiving civil participation facilities from Eghtesad Novin (EN) Bank in 2009 and 2010 and 4 approaches for choosing financial ratios including remarks from credit experts of Raah Eghtesad Novin Co., Altman, comparison between averages and choosing correlation attribute. Results show that Support Vector Machine approach can differentiate between healthy and unhealthy companies with average accuracy of 84.63% using all chosen ratios.
Keywords: Default risk, Banking, Support Vector Machine, Legal customer -
آب نقش مهمی بر رشد و سلامت گیاهان دارد. تامین این ماده حیاتی نه تنها بر عملکرد محصول کشاورزی، بلکه بر کیفیت و کنترل فرآیندهای فیزیولوژیکی آن ها تاثیر می گذارد. بنابراین کمبود آب سبب اثرات منفی در رشد و نمو گیاهان می شود. در این پژوهش با هدف تشخیص نیاز آبی گیاه، مجموعه ای از تصاویر گیاه لیلیوم تحت شرایط تنش خشکی جهت استخراج ویژگی های رنگی و مورفولوژی بررسی و بر اساس این ویژگی سامانه هوشمندی به منظور تشخیص نیاز آبی گیاه طراحی و ساخته شد. پس از بررسی پارامترهای استخراج شده از تصاویر با توجه به نتایج آنالیز آماری در سطح احتمال 5% و روش انتخاب ویژگی پی درپی پیشرو مناسب ترین ویژگی ها به منظور پیش بینی محتوای رطوبت گیاه انتخاب و عمل طبقه بندی با ماشین بردار پشتیبان (SVM) با کرنل های مختلف صورت پذیرفت.در نهایت نشان داده شد که دقت طبقه بند برای سه کرنل خطی، سیگمویید و RBF به ترتیب با 6، 9 و 9 ویژگی برابر با 19.81، 04.81 و 12.83 درصد بود. بدین ترتیب نتایج نشان داد که سامانه پیشنهاد شده از توانایی مناسبی جهت تشخیص سطوح تنش و کنترل میزان آب مورد نیاز برخوردار است.
کلید واژگان: پردازش تصاویر دیجیتال, سامانه هوشمند آبیاری, طبقه بند بردار پشتیبانWater plays an important role in the growth and health of plants. The supply of this vital material affects not only agricultural yields, but also the quality and control of their physiological processes. Therefore, water scarcity has a negative effect on the growth of plants. In this research, in order to detect the plant's water requirement, a series of images of lilium plant under drought stress conditions were investigated to extract the color and morphological features and based on them, an intelligent system was designed to recognize the plant's water status. After analyzing the parameters extracted from the imagesusing statistical analysis at 5% probability level and the sequential forward feature ranking method, the most suitable features were selected to predict the moisture content of the plant; Furthermore, the classification was carried out using the support vector machine (SVM) with different kernels. Finally, it was shown that the classification accuracy for the linear kernels, sigmoeid, and RBF was with 6, 9, and 9 features, respectively, were 81.19, 81.04 and 83.12%, respectively. The results showed that the proposed system had the ability to determine the levels of stress and control the amount of water needed
Keywords: Digital Image Processing, intelligent irrigation system, Support Vector Machine -
بیماری اسکلروز جانبی آمیوتروفیک (Amyotrophic lateral sclerosis; ALS) یک بیماری عصبی عضلانی و شایع ترین بیماری نورون های حرکتی است. از آنجا که یکی از مهم ترین علایم اولیه بیماری، وجود اختلالات حرکتی است، بررسی اختلالات راه رفتن در کانون توجه بسیاری از محققان قرار گرفته است. هدف مطالعه حاضر، ارایه الگوریتمی مناسب برای تشخیص بیماری ALS می باشد. از داده های موجود در پایگاه فیزیونت استفاده شده است. این داده ها از 13 بیمار ALS و 16 فرد سالم جمع آوری شده است. در این تحقیق از دو روش ادغام برای ترکیب اطلاعات سیگنال های پای راست و چپ قبل از استخراج ویژگی (ادغام در سطح سیگنال) و پس از استخراج ویژگی (ادغام در سطح ویژگی) استفاده شده است. از ویژگی های غیرخطی کمی سازی سیگنال حرکتی راه رفتن افراد سالم و بیمار استفاده کردیم، که عبارتند از: لگاریتم انرژی، آنتروپی شانون، هیگوچی فراکتال، فراکتال کتز. سپس، با انجام آزمون آماری ویلکاکسون بر ویژگی های استخراجی، اقدام به یافتن تفاوت معنادار میان گروه ها نمودیم. برای تفکیک افراد ALS از گروه نرمال از طبقه بند ماشین بردار پشتیبان استفاده شد. الگوریتم پیشنهادی توانایی تشخیص بیماری ALS را با میانگین درصد صحت % 87 دارا می باشد. بیش ترین درصد صحت طبقه بندی با استفاده از ویژگی کتز بدست آمد که % 100می باشد. سیستم پیشنهادی مبتنی بر الگوریتم های ادغام نه تنها حجم محاسبات را کاهش می دهد، بلکه در ارایه نرخ های تفکیک نیز عملکرد بسیار خوبی دارد. این چارچوب می تواند راه را برای توسعه سیستم های تشخیصی ساده با عملکرد بالا در آینده بگشاید.
کلید واژگان: سیگنال راه رفتن, بیماری اسکلروز جانبی آمیوتروفیک, الگوریتم ادغام, تحلیل غیرخطی, ماشین بردارپشتیبانAmyotrophic lateral sclerosis (ALS) is a neuromuscular disease, the most common disease of motor neurons. Since one of the most important early symptoms of the disease is the presence of movement disorders, the study of gait disorders has been the focus of many researchers. The aim of this study was to provide a suitable algorithm for the diagnosis of ALS. The data available in the Physionet database were used. They were recorded from 13 ALS patients and 16 healthy individuals. In this study, two methods of fusion have been employed to combine the information of the right and left foot signals, before feature extraction (signal-level fusion) and after feature extraction (feature-level fusion). We utilized the nonlinear features to characterize the gait signals of patients and healthy individuals, which includes: Energy-logarithm entropy, Shannon entropy, Higuchi fractal, and Katz fractal. Then, by performing the Wilcoxon statistical test on the extracted features, we tried to find significant differences between the groups. A support vector machine was used to separate ALS subjects from the normal group. The suggested algorithm has the ability to diagnose ALS with an average accuracy of 87%. The highest classification accuracy was obtained using the Katz feature, which is 100%. The proposed system based on fusion algorithms not only reduces the computational cost but also performs very well in providing separation rates. This framework could pave the way for the development of simple high-performance diagnostic systems in the future.
Keywords: Gait signal, ALS disease, Fusion, Nonlinear analysis, Classification, Support Vector Machine -
AbstractFacial expression recognition is one of the most important computer vision issues that has many applications. One of them is the Human computer interaction. In this paper, a method for facial expression recognition using texture and edge descriptors is proposed. Facial expression recognition generally consists of three steps: preprocessing, feature extraction and classification. In this paper, histogram Equalization has been used in the proposed method for pre-process the input images in which the face is present. In this paper, the focus is on the feature extraction and a combination of LDP1 and HOG2 descriptors has been used to improve the existing methods. After feature extraction, the support vector machine was used to classification the facial expression recognition. This article uses the JAFFE database. The database contains 213 images of seven facial expressions (happy, sad, angry, fear, disgust, surprised and natural) taken from 10 Japanese female models. The results showed that the proposed method with 99.04% accuracy in the facial recognition test had a better performance than the methods of previous researchers.Keywords: Facial Expression Recognition, histogram equalization, texture, edge descriptors, LDP, HOG, Support vector machine
-
This paper represents advantages of using Centroid distance function for shape detection in real time traffic sign recognition compared with extracting histogram of oriented gradients (HOG) features and using support vector machine (SVM) classifier. Simulation results of using centroid distance show similar accuracy in compare with HOG SVM while have very low complexity and cost and running with higher speed.
Keywords: Traffic Sign Recognition, Advanced Driver Assistance Systems, Centroid Distance, Histogram of Oriented Gradients, HOG, Support Vector Machine, SVM, Shape Recognition, Low-Complexity -
سیستم پرسش و پاسخ شکل خاصی از بازیابی اطلاعات است. با در نظر گرفتن مجموعه ای از اسناد (مانند شبکه جهانی وب یا یک مجموعه محلی) سیستم باید بتواند پاسخ پرسش های مطرح شده به زبان طبیعی را بازیابی نماید. سیستم های پرسش و پاسخ به صورت متداول از بخش های پردازش و تجزیه پرسش، تولید عبارت جست وجو، بازیابی اطلاعات، استخراج پاسخ و رتبه بندی پاسخ تشکیل شده است. یکی از علل کاهش کارایی سیستم های پرسش و پاسخ، پایین بودن دقت انتخاب پاسخ های مناسب به پرسش کاربران است. به وسیله ی اعتبارسنجی مناسب پاسخ ها می توان این مشکل را حل نموده و کارایی سیستم پرسش و پاسخ را ارتقا داد. در این پژوهش از رگرسیون ماشین بردار پشتیبان (SVR) برای اعتبار سنجی و رتبه بندی پاسخ ها استفاده شده است. الگوریتم رگرسیون ماشین بردار پشتیبان با کمینه نمودن ریسک عملیاتی، خطر افتادن در کمینه های محلی را بر طرف می کند. برای ارزیابی کارایی سیستم پیشنهادی از مجموعه پرسش های TREC و پرسش های ویکی پدیا استفاده گردیده است. در این پژوهش از معیارهای میانگین رتبه بندی معکوس و معیار F برای ارزیابی سیستم پیشنهادی استفاده گردیده است. بر اساس نتایج حاصل از آزمایش ها، مقادیر به دست آمده برای این معیارها توسط سیستم پیشنهادی به ترتیب 81% و 49.7% بوده است. سیستم پیشنهادی در مقایسه با سیستم بدون رتبه بندی پاسخ و سیستم مبتنی بر رتبه بندی پاسخ با شبکه عصبی از کارایی مناسب تری برخوردار است. همچنین سیستم پیشنهادی در مقایسه با پژوهش های پیشین دارای میانگین رتبه بندی معکوس بهتری می باشد.
کلید واژگان: سیستم پرسش و پاسخ, بازیابی اطلاعات, اعتبار سنجی پاسخ, رگرسیون ماشین بردار پشتیبان (SVR)Question-answering system is a special type of information retrieval system. Considering a set of documents (such as Web or local set of documents), the system should answer the questions asked in the natural language form. Question-answering systems generally consist of question processing and analysis, keyword generation, information retrieval, answer extraction, and answer validation. In such systems, selecting proper answers for user question is an important task which influences performance of the whole system. An appropriate answer validation technique can increase the performance of the question-answering system. In this study, Support Vector Regression (SVR) is employed in order to perform answer validation. SVR eliminates the risk of getting stuck in local minima by reducing the operational risk. The proposed system is applied on some of the TREC and Wikipedia questions repositories. In order to evaluate performance of the proposed system, following measures are calculated: Mean Reciprocal Ranking (MRR) and F-measure. Based on experimental results, the proposed system achieved 81% MRR and 49.7% F-measure which shows higher performance than systems with no answer validation and also systems using neural network-based answer validation.
Keywords: Question-answering system, Information Retrieval, answers validation, Support Vector Machine -
در این مقاله، یک روش جدید خودیادگیرنده برای افزایش تفکیک پذیری تک تصویر ارایه شده است. در این روش، از تصویر ورودی، دو هرم وضوح پایین و وضوح بالا ساخته می شود. رابطه بین وصله های هرم وضوح پایین و روشنایی متناظر وصله ها در تصویر هم سطح از هرم وضوح بالا توسط رگرسیون بردار پشتیبان یادگیری می شود. برای ایجاد تخمین بهتری از روشنایی وضوح بالا، تصاویر دو هرم را براساس رنگ ناحیه بندی می کنیم و مدل های رگرسیونی را برای هر ناحیه بطور مجزا آموزش می دهیم. از طرفی برای کاهش اثر تاری در لبه های تصویر فراتفکیک شده، مدل های جداگانه ای برای یادگیری روشنایی لبه ها ارایه شده است. ویژگی های بکار رفته در یادگیری رگرسیون بردار پشتیبان، ضرایب تنک وصله ها در بازنمایی تنک و گرادیان وصله ها می باشد. برای هر یک از ویژگی های اشاره شده مدل های رگرسیون مجزایی آموزش داده می شود و خطای این مدل ها نیز به کمک رگرسیون بردار پشتیبان مدل می گردد. در هنگام بازسازی تصویر فراتفکیک شده، هر وصله ی تصویر در بالاترین سطح هرم وضوح پایین به مدل های رگرسیونی داده شده و مدلی که کمترین خطا را در تخمین مقدار روشنایی ایجاد کند مشخص می گردد. روشنایی مرکز هر وصله را مدل برنده شده تعیین می کند. نتایج آزمایشات نشان می دهد که روش پیشنهادی نسبت به سایر روش ها با توجه به معیار PSNR و SSIM تخمین بهتری از تصویر فراتفکیک شده ایجاد می کند. مشاهده بصری نتایج نیز این ادعا را تایید می نماید.کلید واژگان: فراتفکیک پذیری تک تصویر, ناحیه بندی تصویر, بازنمایی تنک, رگرسیون بردار پشتیبانSelf-learning super-resolution is an approach for enhancing single-image resolution. In this approach, instead of using the external database for learning the relation between low and high resolution image patches, only relation between patches in the input image pyramid are used for learning. In this paper, a novel self-learning single image super-resolution method by focusing on the organization of the low and the corresponding high-resolution information has been presented. In order to provide training data the low-resolution and the corresponding highresolution images are created by down-sampling and up-sampling of the input image in two image pyramids. In this paper, unlike most prior super-resolution methods, the images in the low-resolution pyramid are segmented and then used for the process of super-resolution. Another remarkable point in this paper is dividing all the images of different levels of the pyramid into the same numbers and similar regions. This is done by segmenting the image at the lowest level of the pyramid and generalizing its regions to the higher-level of the pyramid images. Due to the different number of regions in each input image, the number of training models of the proposed method is different for each image and depends on the content of the input image. The result of the experiments shows that the proposed method is quantitatively and qualitatively improved the previous methods.Keywords: Single image super-resolution, statistical region merging, LLE, Sparse representation, Support Vector Machine
-
سرطان پستان شایع ترین سرطان در میان زنان است و وجود یک سیستم دقیق و مطمین برای تشخیص خوش خیم و یا بدخیم بودن توده سرطان ضروری است. امروزه با استفاده از نتایج سیتولوژی آسپیراسیون سوزنی، تکنیک های داده کاوی و یادگیری ماشین می توان شناسایی و تشخیص زود هنگام سرطان پستان را با دقت بالاتری انجام داد. در این مقاله روشی پیشنهاد شده است که شامل دو مرحله است: در مرحله اول برای حذف ویژگی های کم اهمیت تر، از رگرسیون لجستیک استفاده شده است تا ویژگی های مهم تر انتخاب شوند. در مرحله دوم، از الگوریتم طبقه بندی ماشین بردار پشتیبان (SVM) با سه هسته ی متفاوت برای تشخیص خوش خیم و بدخیم بودن نمونه ها استفاده شده است. برای ارزیابی کارایی روش پیشنهادی از دو مجموعه داده WBCD و WDBC و معیارهای دقت، ناحیه زیر نمودار ROC (AUC)، نرخ مثبت حقیقی، نرخ مثبت کاذب، صحت و معیار F بررسی شده اند. نتایج نشان می دهد که با استفاده از روش رگرسیون لجستیک می توان انتخاب ویژگی موثرتری انجام داد، به گونه ای که روش پیشنهادی از نظر دقت طبقه-بندی به دقت 69/98% می رسد.
کلید واژگان: سرطان پستان, یادگیری ماشین, انتخاب ویژگی, رگرسیون لجستیک, ماشین بردار پشتیبانBreast cancer is the most common cancer among women and the existence of a precise and reliable system for the diagnosis of benign or malignant of this cancer is essential. Nowadays, using the results of needle aspiration cytology, data mining and machine learning techniques, early diagnosis of breast cancer can be done with greater accuracy. In this study, we propose a method consisting of two steps: in the first step, to eliminate the less important features, logistic regression has been used to select more important features. In the second step, the Support Vector Machine (SVM) classification algorithm has been used with three different kernel functions for the diagnosis of benign and malignant samples. To evaluate the performance of the proposed method, two data sets, WBCD and WDBC have been used with investigation of several metrics such as precision, the Area Under the ROC (AUC), true positive rate, false positive rate, accuracy and the F-measure. The results show that using the logistic regression method, it is possible to select the more efficient features, such that the proposed method reaches 98.69% in terms of classification accuracy.
Keywords: breast cancer, Machine Learning, Feature selection, logistic regression, Support Vector Machine -
یکی از مسایل مهم در سیستم های قدرت، تشخیص صحیح اغتشاشات کیفیت توان است. در این مقاله یک روش هوشمند به منظور شناسایی اغتشاشات کیفیت توان ارایه شده است. در روش پیشنهادی که بر مبنای ویژگی بردار هویت است، برای هرسیگنال اغتشاش یک بردار با طول ثابت استخراج می شود. به این صورت که در مرحله اول، تبدیل موجک به منظور استخراج ویژگی از سیگنال اغتشاش ورودی به کارگرفته شده است و سپس با استفاده از دنباله ضرایب موجک استخراج شده، بردار هویت تولید می-شود. در ادامه بعد از انجام نرمال سازی های لازم، بردار هویت نرمال شده استخراج شده توسط ماشین بردار پشتیبان طبقه بندی می-شود. به منظور ارزیابی عملکرد روش پیشنهادی دوازده نوع اغتشاش اعم از تکی و ترکیبی ایجاد و کارایی سیستم در شرایط تمیز و نویزی بررسی شده است. نویز اعمال شده به هر سیگنال نویز سفید گاوسی با مقادیر سیگنال به نویز 30، 40 و 50 دسی بل است. نتایج آزمایش ها میانگین دقت روش پیشنهادی را 2/99 درصد نشان می دهد.کلید واژگان: طبقه بندی اغتشاشات کیفیت توان, ضرایب موجک, بردار هویت, نرمال سازی ویژگی, ماشین بردار پشتیبانCorrect detection and classification of power quality disturbances is an essential issue in power systems. In this paper, an intelligent method is proposed to detect the power quality disturbances. This method is based on an identity vector framework that produces a fixed-length vector for each perturbation. In the first step of the proposed pipeline, the discrete wavelet transform is used to analyze power quality events and extract the features of each input signal, and then the identity vector is built using the approximation coefficients. After applying some normalization on the obtained identity, it is classified using a support vector machine classifier. In order to evaluate the proposed method, twelve types of disturbances have been synthesized and the efficiency of the proposed system is investigated using them. In addition, to verify the robustness of the proposed approach towards the noise, the synthesized signals are contaminated with white gaussian noise with different SNR values, 30 dB, 40 dB and 50 dB. The results of the experiments demonstrate the efficiency of the proposed method for the classification of power quality signals with an accuracy of 99.2%.Keywords: Power quality disturbances classification, Discrete Wavelet transform, Identity vector, Feature normalization, Support Vector Machine
-
ماشین بردار پشتیبان یکی از ابزارهای توانمند در زمینه یادگیری ماشین با ناظر در طبقه بندی داده ها می باشد. در مواجهه با داده-هایی که ساختار ماشین بردار پشتیبان خطی در طبقه بندی آنها از کارایی لازم برخوردار نیست، استفاده از ساختار ماشین بردار پشتیبان مبتنی بر هسته ها مدنظر می باشد. در رویکرد مبتنی بر هسته ها به دلیل استفاده از فضای ویژگی داده ها به جای خود داده های اصلی امکان طبقه بندی غیرخطی فراهم می آید. یکی از چالش های موجود در این رویکرد افزایش پیچیدگی های محاسباتی و در نهایت افزایش زمان لازم برای طبقه بندی است. عمدتا این افزایش زمان محاسباتی به دلیل ظاهر شدن هسته در حل مسئله بهینه-سازی درجه دوم است که با استفاده از تقریب رتبه پایین ارائه شده در این مقاله قادر خواهیم بود بر این مشکل غلبه کنیم. در این تکنیک با به کارگیری سری تقریبی قطع شده از هسته موجود، مسئله بهینه سازی درجه دوم در ساختار ماشین بردار پشتیبان مبتنی بر هسته ها با یک مسئله بهینه سازی با ساختار ساده تر جایگزین می گردد. در این رویکرد ، حاصلضرب های بردار-ماتریس و تجزیه های ماتریسی مورد نیاز بسیار سریع تر انجام خواهد شد. این تغییرات منجر به حل سریعتر مسئله بهینه سازی درجه دوم موجود و افزایش کارایی در طبقه بندی می گردد. نهایتا نتایج عددی ارائه شده در طبقه بندی برخی داده های کاربردی با استفاده از تقریب رتبه پایین ماشین بردار پشتیبان مبتنی بر هسته ها نشان می دهد که ضمن حفظ عملکرد طبقه بندی در حد قابل قبول، زمان محاسباتی به طور قابل توجهی کاهش یافته است.کلید واژگان: طبقه بندی نظارت شده, ماشین بردار پشتیبان, بسط مرکر, تقریب رتبه پایینSupport vector machine is one of the most powerful tools in the field of supervised machine learning to classify the existed data. In the data that the linear support vector machine does not have the required efficiency in their classification, using the kernel-based support vector machine which is based on the use of feature space instead of the original data is considered. As a result of this structure, nonlinear classification can be provided. One of the challenges in this approach is to increase the computational complexity and ultimately increase in the required time for classification. As such, it is not particularly useful for large datasets. This increase in computational time is mainly due to the appearance of the kernel in solving the quadratic optimization problem, which we will be able to overcome this problem using the presented low-rank approximation in this paper. In this technique, using a truncated Mercer series of the kernel, the quadratic optimization problem in the kernel-based support vector machine is replaced with a much simpler optimization problem. In the new presented approach, the required vector computations and matrix decompositions will be much faster such that these changes lead to faster resolution of the quadratic optimization problem and increase efficiency. Finally, the results of experiments show that using a low-rank kernel-based approximation of support vector machine, while keeping the classification performance in an acceptable range, the computational time has been significantly reduced.Keywords: Support Vector Machine, Kernel-based SVM, Mercer series, Low-rank approximation
-
پیش بینی بازارها از جمله سهام به دلیل حجم بالای معاملات و نقدینگی برای محققان و سرمایه گذاران دارای جذابیت بوده است. توانایی پیش بینی جهت قیمت ما را قادر می سازد با کاهش ریسک و اجتناب از ضرر و زیان مالی، به بازده بالاتری دست یابیم. اخبار نقش مهمی در فرایند ارزیابی قیمت فعلی سهام دارد. توسعه روش های داده کاوی، هوش محاسباتی و الگوریتم های یادگیری ماشین سبب ایجاد مدل های جدیدی در پیش بینی شده اند. خبرها منتشر شده در 17 خبرگزاری با استفاده از یک خزگشر موضوعی به زبان پی اچ پی ذخیره و دسته بندی شده است. سپس با استفاده از روش های متن کاوی و الگوریتم ماشین بردار پشتیبان و کرنل های مختلف به پیش بینی جهت قیمت سهام گروه محصولات شیمیایی در بورس اوراق بهادار پرداخته می شود. دراین مطالعه از 300 هزار خبر در دسته های سیاسی و اقتصادی و قیمت های سهام 63 شرکت در بازه زمانی آبان تا اسفند 97 در 122 روز معاملاتی استفاده شده است. نتایج نشان می دهد با مدل ماشین بردار پشتیبان با کرنل خطی می توان به صورت میانگین 83 درصد جهت قیمت ها را پیش بینی کرد. با استفاده از کرنل های غیرخطی و معادله درجه 2 ماشین بردار پشتیبان صحت پیش بینی به صورت میانگین تا 85 درصد افزایش می یابد و سایر کرنل ها نتایج ضعیف تری از خود نشان می دهند.
کلید واژگان: متن کاوی, کاوش محتوای وب, خزشگر وب, پیش بینی بورس اوراق بهادار, ماشین بردار پشتیبانMarket forecasting, like stock's market, with high volume of transactions have an effect on researchers and investors and get their attention. Important issue factors in any investment decision are risk and turnover. Understanding market momentum gives the ability to predict future movements. The ability to predict in a market economy, enables to achieve a higher turnover by reducing risk and avoiding financial losses. News plays an important role in the process of evaluating the current stock price. The development of data mining methods, computational intelligence and machine learning algorithms have led to new models of prediction. phpCrawler is a php base content crawler that use of DomCralwer and Guzzle packages for storing web data. With this tool, the news releases are stored and categorized from 17 News Agency. Then, by using text mining and Support Vector Machine with different kernel, predict stock price direction. In this research use 948990, news has been stored from 17 news agencies. More than 300,000 news regarding political and economic categories were used and stock prices of chemicals between November 2017 till March 2018 (123 trading days) were studied. The results show that by using the linear kernel Support Vector Machine algorithm, the prediction accuracy of average price movement reached to 83%. Using nonlinear kernel Support Vector Machine with poly kernel increased two percent prediction accuracy to 85% on average and other kernel had poorer prediction.
Keywords: Text mining, Web mining, Crawling, Stock market prediction, Support Vector Machine -
پیشینه و اهداف
دسترسی به اینترنت و کامپیوتر فرصت هایی را برای آموزش الکترونیکی ایجاد کرده اند. دسترسی راحت تر به منابع و آزادی عمل کاربران از مزایای آموزش الکترونیکی است. با این حال آموزش الکترونیکی جذابیت و پویایی آموزش های سنتی یا چهره به چهره را ندارد و در این سیستم ها وضعیت کاربر مانند نرخ یادگیری و وضعیت انگیزشی آن ها در نظر گرفته نمی شود. از این رو، توسعه دهندگان سیستم های آموزش الکترونیکی می توانند با در نظر گرفتن سبک یادگیری و طراحی رابط های کاربری تعاملی به حل کردن مشکلات مذکور در این سیستم ها کمک نمایند. همچنین تشخیص خودکار سبک یادگیری نه تنها جذابیت آموزش الکترونیکی را افزایش می دهد، بلکه موجب افزایش کارایی و انگیزه یادگیرندگان در محیط های الکترونیکی نیز می شود.مطالعات روانشناسی نشان می دهد که افراد در تصمیم گیری، حل مسئله و یادگیری با یکدیگر متفاوت هستند. سبک یادگیری باعث می شود که افراد به گونه متفاوتی یک مطلب را درک کنند. برای مثال افرادی که حافظه بصری خوبی دارند، ارایه مباحث به صورت بصری را نسبت به صورت شفاهی ترجیج می دهند. لحاظ کردن یک شیوه مناسب آموزش باعث بهبود عملکرد یادگیرنده در محیط آموزشی می شود. عدم توجه به سبک یادگیری دانشجویان باعث کاهش انگیزه و علاقه ی آن ها به مطالعه و شرکت در دوره های آموزشی می شود.موفقیت تحصیلی دانشجویان از اهداف مهم در محیط های آموزشی است. یکی از عوامل مهم در تحقق این هدف، توجه به سبک یادگیری دانشجویان است. آگاهی از سبک یادگیری دانشجویان به طراحی یک روش مناسب آموزش کمک می کند. لحاظ کردن یک شیوه مناسب آموزش باعث بهبود عملکرد دانشجویان در محیط آموزشی می شود. در این مقاله، هدف ساخت یک مدل برای تشخیص خودکار سبک های یادگیری است.
روش هابدین منظور از یک محیط آموزش الکترونیکی متشکل از 202 دانشجو رشته مهندسی برق و کامپیوتر، دو مجموعه داده برای ایجاد مدل جمع آوری شده است. ویژگی های رفتاری از نحوه تعامل دانشجویان با سامانه آموزش الکترونیکی استخراج شده و سپس سبک های یادگیری با روش ماشین بردار پشتیبان دو قلو دسته بندی می شوند. ماشین بردار پشتیبان دو قلو گونه جدیدی از دسته بند های مبتنی بر مرز مانند SVM است که هدف آن بدست آوردن حاشیه ناموازی است. این دسته بند به دادگان نامتوزان حساس نمی باشد و سرعت آموزش آن بسیار سریع است.
یافته هادر این پژوهش، ضمن تاکید بر افزایش جذابیت آموزش الکترونیکی، مسئله تشخیص خودکار سبک یادگیری دانشجویان بررسی شده است و مدل MBTI برای تعیین سبک های یادگیری استفاده شده است. دو مجموعه داده از تعامل 202 دانشجو مهندسی برق و کامپیوتر با سامانه آموزش الکترونیکی مودل جمع آوری شده است. مجموعه داده جمع آوری شده بسیار نامتوزان است که تاثیر منفی روی دقت دسته بند ها دارد. با در نظر گرفتن این نکته، ماشین بردار پشتیبان دو قلو کمترین مربعات به عنوان دسته بند استفاده شده است. ویژگی بارز این دسته بند حساسیت کم به توازن داده ها و سرعت بسیار زیاد است. نتایج نشان می دهد که روش پیشنهادی با وجود نامتوزان بودن داده ها، در دسته بندی سبک یادگیری دانشجویان بسیار خوب عمل کرده است و با دقت 95 درصد سبک های یادگیری را تشخیص می دهد.
کلید واژگان: آموزش الکترونیکی, سبک یادگیری, ماشین بردار پشتیبان, MBTI, دسته بندیBackground and ObjectiveInternet and computer access have created opportunities for e-learning. Easier access to resources and freedom of action for users is one of the benefits of e-learning. However, e-learning is not as attractive and dynamic as traditional or face-to-face instruction, and in these systems the user's condition, such as learning rate and motivation, is not taken into account. Therefore, the developers of e-learning systems can help to solve the problems mentioned in these systems by considering the learning style and design of interactive user relationships. Automated identification of learning style not only increases the attractiveness of e-learning, but also increases the efficiency and motivation of learners in e-learning environments. Research shows that people differ in decision making, problem solving, and learning. Learning style makes people understand a story differently. For example, people with good visual memory prefer to present topics visually rather than orally. Applying a proper teaching method improves the learner's performance in the learning environment. Lack of attention to students' learning style reduces their motivation and interest in studying and engagement in educational courses. Students’ success is one of the prominent goals in the learning environments. In order to achieve this goal, paying attention to students’ learning style is essential. Being aware of students’ learning style helps to design an appropriate education method which improves student’s performance in the learning environments. In this paper, the aim is to create a model for automatic prediction of learning styles.
MethodsTherefore, two real datasets collected from an e-learning environment which consists of 202 electrical and computer engineering students. Behavioral features were extracted from users’ interaction with e-learning system and then learning styles were classified using twin support vector machine. Twin support vector machine is an extension of SVM which aims at generating two non-parallel hyperplanes. This classifier is not sensitive to imbalanced datasets and its training speed is fast.
FindingsIn this study, increasing the attractiveness of e-learning is emphasized and the issue of automatic recognition of students' learning style has been investigated by MBTI model. Two data sets from the interaction of 202 electrical and computer engineering students with the Moodle e-learning system have been collected. The collected data set is very unbalanced, which has a negative effect on the accuracy of the categories. With this in mind, the twin support vector machine uses the least squares as a binder. The distinctive feature of this category is the low sensitivity to data balance and very high speed. The results show that the proposed method, despite the inconsistency of the data, has performed very well in the classification of students' learning style and accurately recognizes 95% of learning styles.
ConclusionDue to the excellent performance of the proposed method, a new component can be added to e-learning systems such as Moodle by identifying the learning style, content and appropriate teaching method for the learner. Future research could also gather more data from an e-learning environment and categorize learning styles with cognitive characteristics from the learner.
Keywords: e-Learning, Learning style, Support vector machine, MBTI, Classification -
The intelligence of a mobile robot is highly dependent on its vision. The main objective of an intelligent mobile robot is in its ability to the online image processing, object detection, and especially visual tracking which is a complex task in stochastic environments. Tracking algorithms suffer from sequence challenges such as illumination variation, occlusion, and background clutter, so an accurate tracker should employ the appropriate visual features to identify target. In this paper, we propose using the histogram of oriented gradient (HOG), as an important descriptor. The descriptor simulates the performance of the complex cells in the primary visual cortex (V1) and it has low sensitivity to the illumination changes. In the proposed method, firstly, an object model is generated by training the HOG of multi first frames via an SVM classifier. Then, in order to track a new frame, the HOG descriptors are extracted from the surrounding areas of the target in the previous frame and convolved with the object model. Finally, the location with the highest score is defined as the target. The experimental results demonstrate the proposed method has significant performance compare to the state-of-the-art methods. Furthermore, we apply our algorithm to the mobile robot built by the robotics team to ensure its performance in a real environment.
Keywords: Histogram of oriented gradient, Support vector machine, object model, mobile robot, target tracking, visual tracking
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.