به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

classification

در نشریات گروه برق
تکرار جستجوی کلیدواژه classification در نشریات گروه فنی و مهندسی
  • هادی جهانی راد*
    با پیشرفت تراشه های مجتمع دیجیتال و پیاده سازی سیستم های پیچیده برروی آن ها، مخاطراتی در رابطه با عملکرد آن ها ایجاد شده است. تروجان های سخت افزاری (HT) از مهمترین نوع مخاطرات هستند که سبب ایجاد خطا در عملکرد تراشه، افزایش توان مصرفی و نشت کردن اطلاعات ذخیره شده برروی تراشه ها می شوند. در نتیجه، ارزیابی میزان آسیب پذیری تراشه ها در برابر انواع مختلف تروجان های سخت-افزاری دارای اهمیت بسیار زیادی است. در این مقاله روشی دقیق در سطح چیدمان (layout)، برمبنای استفاده از شبکه های عصبی کانولوشن (CNN)، برای محاسبه میزان آسیب پذیری تراشه های دیجیتال در برابر HT ارائه شده است. عوامل اصلی موثر بر میزان خطرپذیری تراشه های دیجیتال شامل میزان فضاهای خالی در چیدمان، منابع مسیردهی استفاده نشده، فعالیت سیگنال های داخلی، و قابلیت آزمون پذیری گیت های مدار می باشند. برای تولید دیتاست مناسب، چیدمان فیزیکی هر پیاده سازی از یک مدار دیجیتال با استخراج این عوامل، به یک تصویر دیجیتال تبدیل شده است. پس از تولید دیتاست مناسب که شامل 10000 تصویر است، فرآیند یادگیری CNN تکمیل می شود و شبکه ی آموزش یافته برای تعیین میزان آسیب پذیری در برابر HT مورد استفاده قرار می گیرد. با مشخص شدن میزان آسیب پذیری مدار پیاده سازی شده، طراح می تواند تغییرات لازم را برای مقاوم کردن تراشه در برابر HT اعمال نماید. نتایج شبیه سازی برروی چیدمان مدارهای معیار (ISCAS 85, 89) نشان می دهد، میزان دقت رهیافت پیشنهادی 92% می باشد. همچنین روش پیشنهادی، مشکل ناشی از عدم مدلسازی دقیق عوامل موثر در تعیین خطرپذیری در روش های پیشین را مرتفع کرده و دقت محاسبه آسیب پذیری را 17% افزایش می دهد.
    کلید واژگان: مدارهای مجتمع دیجیتال، تروجان های سخت افزاری، شبکه های عصبی کانولوشن، کلاس بندی، یادگیری ماشین
    Hadi Jahanirad *
    The vulnerability of digital integrated circuits against the Hardware Trojans (HT) has increased in recent decades due to the implementation of more complex systems on them. HTs could become a source of errors or apply to steel important information embedded in the implemented circuits. So, analyzing the vulnerability of digital integrated circuits in the early stages of production is of great merit. In this paper, a novel vulnerability classification method is introduced based on the deep convolutional neural networks (CNN) wherein five major effective features of vulnerability assessment are utilized (white space distribution, unutilized routing resources, signal activity of circuit nodes, delay of the circuit paths and, controllability of circuit nodes). In the proposed framework, first of all, a dataset containing 10000 images is generated using various digital circuit implementations. Then, a deep CNN is trained using the generated dataset meanwhile the most appropriate CNN’s hyperparameters are achieved using a greedy optimization method. The simulation results reveal 92% accuracy of vulnerability classification which shows a 17% improvement in comparison with the best linear classifier and analytical methods.
    Keywords: Digital Integrated Circuits, Hardware Trojans, Convolutional Neural Networks, Classification, Machine Learning
  • Mohsen Eftekharian, Ali Nodehi *

    Nowadays, medical intelligence detection systems have evolved significantly due to advancements in artificial intelligence, however, they face some challenges. Breast cancer diagnosis and classification is one of the medical intelligence systems. There are a variety of screening techniques available to detect breast cancer such as mammography, magnetic resonance imaging, and ultrasound. This research uses the MIAS mammography image dataset and tries to diagnose and classify benign and malignant masses based on image processing and machine learning techniques. Initially, we apply pre-processing for noise reduction and image enhancement using Quantum Inverse MFT, and then image segmentation with the Social Spider Algorithm. The type of mass is then diagnosed by the Convolutional neural network. The results show that the proposed approach has better performance in comparison to others based on some evaluation criteria such as accuracy of 99.57%, sensitivity of 91%, and specificity of 86%.

    Keywords: Breast Cancer, Diagnosis, Classification, Quantum Inverse MFT Algorithm, Social Spider Algorithm, Convolutional Neural Network
  • صابر ارمغانی، زهرا مروج*
    در این مقاله، روش جدید برای طبقه بندی انواع خطا با مقاومت کوچک در ریزشبکه های متناوب دوتایی متصل بهم از طریق خط ارتباطی و در وضعیت جزیره ای پیشنهاد شده است. روش پیشنهادی، انواع خطا را بر اساس تحلیل مدال جریان و تحلیل جریان خطای تزریقی به ریزشبکه طبقه بندی می کند. به منظور تحلیل مدال، از تبدیل کلارک استفاده می شود تا جریان توالی صفر قابل پایش باشد؛ و برای یافتن مقدار جریان خطا تزریق شده، از روش ریخت شناسی ریاضی بکار گرفته شده است. در این مقاله، تئوری ریخت شناسی ریاضی با استفاده از فیلتر استخراج کننده پوش سیگنال، برای شناسایی تغییرات دامنه و اعوجاج در جریان از طریق تحلیل حوزه زمان، پیشنهاد شده است؛ تا شناسایی و طبقه بندی انواع خطا به صورت بهنگام انجام شود؛ و نسبت به انواع روش های پردازش سیگنال مبتنی بر تحلیل حوزه فرکانس ویا حوزه فرکانس-زمان دارای مزیت نیازمندی به سیستم مخابرات با پهنای باند و هزینه کمتر است. روش پیشنهادی برای طبقه بندی انواع خطای تکفاز به زمین، دو فاز بهم و به زمین، و سه فاز در ریزشبکه متصل بهم از طریق خط ارتباطی متناوب به عنوان نمونه موردی پیاده سازی شده است؛ و نتایج عددی، کارایی و موثر بودن روش پیشنهادی در طبقه بندی انواع خطا با مقاومت کوچک در ریرشبکه متناوب متصل بهم از طریق خط ارتباطی را به اثبات می رساند.
    کلید واژگان: ریزشبکه های متناوب متصل بهم در وضعیت جزیره ای، طرح حفاظت مبتنی بر جریان، طبقه بندی انواع خطا، تحلیل مدال و جریان تزریقی، روش ریخت شناسی ریاضی
    Saber Armaghani, Zahra Moravej *
    In this paper, a new method is proposed for low fault resistance fault detection and classification in two interconnected microgrid with tie line connection in island situation (Islanded two interconnected AC microgrid). The proposed method classifies the types of faults based on modal and superimposed fault current analysis. In order to analyze the modal, the Clarke transform is used so that the zero-sequence current can be monitored. Also, mathematical morphology method is used to find the amount of injected fault current in signal processing context. In this article, the theory of mathematical morphology is proposed using signal closing filter to identify amplitude changes and distortion in the measured current through time domain analysis. This theory is implemented in this paper to identify and classify all types of faults in a timely manner. Additionally, comparing to another signal processing methods based on frequency domain analysis or frequency-time domain, it has the advantage of requiring a telecommunication system with lower bandwidth and cost. The proposed method for classifying single-phase to ground, two-phase to ground, and three-phase faults in two microgrids connected through a tie line has been simulated as a case study. The numerical results illustrate the efficiency and effectiveness of the proposed method in classifying the types of faults with small resistance.
    Keywords: Islanded Two Interconnected AC Microgrid, Current Based Protection Scheme, Internal, External Fault Detection, Classification, Modal, Superimposed Analysis, Mathematical Morphology
  • قابلیت انتقال توان افزایش یافته با سیستم انتقال شش فاز امکان پذیر است اما به دلیل عدم وجود یک طرح حفاظتی مناسب برای ایمن سازی خط از 120 نوع خطای مختلف اتصال کوتاه احتمالی محبوبیت پیدا نکرد. این کار یک طرح حفاظتی با تبدیل موجک گسسته (موجک مادر db4) و یک شبکه عصبی مصنوعی (ANN) ارایه می کند. الگوریتم Levenberg-Marquardt برای آموزش شبکه های عصبی مصنوعی استفاده می شود. این طرح حفاظتی فقط به اطلاعات فعلی از پیش پردازش شده گذرگاه پایانی ارسال کننده نیاز دارد. برای تشخیص و طبقه بندی خطای تمامی 120 نوع خطا، یک ماژول ANN منفرد با شش ورودی و شش خروجی پیاده سازی شده است. برای تخمین مکان خطا در هر فاز، 11 ماژول ANN با شش خروجی، یکی برای هر یک از 11 نوع ترکیبی از خطاها، پیاده سازی شده است. نتایج شبیه سازی MATLAB/SIMULINK تکنیک حفاظتی پیشنهادی پیاده سازی شده بر روی سیستم انتقال قدرت شش فاز آلگنی نشان می دهد که در تشخیص و طبقه بندی تمامی خطاها با پارامترهای خطای متغیر با دقت 99.76 درصد موثر و کارآمد است. مشخص شد که عملکرد ماژول های تخمین مکان خطا با داده های آموزشی بهتر و با داده های تست متوسط است.
    کلید واژگان: شبکه عصبی مصنوعی، تبدیل موجک گسسته، تشخیص، طبقه بندی خطا، تخمین مکان خطا، انتقال شش فاز
    G. Vikram Raju *, N. Venkata Srikanth
    The enhanced power transfer capability is possible with the six-phase transmission system but it did not gain popularity due to the lack of a proper protection scheme to secure the line from 120 types of different possible short circuit faults. This work presents a protection scheme with discrete wavelet transform (db4 mother wavelet) and an artificial neural network (ANN). The Levenberg-Marquardt algorithm is used for training the ANNs. This protection scheme requires only the pre-processed current information of the sending end bus. For fault detection and classification of all 120 fault types, a single ANN module is implemented with six inputs and six outputs. For fault location estimation in each phase, 11 ANN modules with six outputs are implemented, one for each of the 11 types of combination of faults. The MATLAB/ SIMULINK simulation results of the proposed protection technique implemented on the six-phase Allegheny power transmission system show that it is effective and efficient in detecting and classifying all the faults with varying fault parameters with an accuracy of 99.76%. It is found that the performance of the fault location estimation modules is better with the training data and moderate with the testing data.
    Keywords: Artificial Neural Network, Discrete wavelet transform, Fault detection, classification, Fault location estimation, Six-phase transmission
  • Mohammadhassan Nataj Solhdar, Nasser Erfani Majd*

    Due to the large scale of the IoT, cloud computing capabilities such as data storage, management, and analysis are close to the edge of fog network. As the internet becomes more widely used in our business operations through the IoT, the desire for secure and efficient communication also increases. Fog and cloud security is an issue associated with any pattern of data storage, management or processing of data. If a network attack occurs, it has irreversible and destructive effects on the development of the IoT, fog, and cloud computing. Therefore, many security systems or models have been proposed or implemented for fog security reasons. Intrusion detection systems are one of the best options designed using artificial intelligence. In this paper, we present an intrusion detection system for fog security against cyber-attacks. The proposed model uses several machine learning methods designed for the security of fog computing and IoT devices. We used the comprehensive NSLKDD standard dataset for our proposed model. The performance of our model is measured using a variety of common metrics and compared with other methods.

    Keywords: Iot, Intrusion Detection, Classification
  • بهاره جاوید، هدی مشایخی*
    روش های تولید متن برای تولید خودکار متون زبان طبیعی از هوش مصنوعی استفاده می کنند. یکی از کاربردهای تولید متن در دسته بندی متن است. بسیاری از مسائل دنیای واقعی با داده های متنی نامتعادل در ارتباط هستند که می تواند کارایی دسته بندی را کاهش دهد. یک رویکرد حل مشکل داده های نامتعادل، بیش-نمونه برداری از کلاس اقلیت است. با توجه به پیشرفت شبکه های مولد تخاصمی (GAN) در تولید داده، می توان از این شبکه ها برای تولید نمونه های متنی در بیش نمونه برداری استفاده کرد. تولید متن به کمک شبکه های مولد تخاصمی به دلیل ماهیت گسسته متن مسئله ای پیچیده است. علیرغم پتانسیل آن ها، استفاده این شبکه ها در حل مشکل داده های متنی نامتعادل به ندرت مورد بررسی قرار گرفته است. این مقاله به بررسی تاثیر استفاده از شبکه ی SentiGAN بر حل مشکل عدم تعادل نظرات کاربران با هدف بهبود کارایی دسته بندی می پردازد. بعد از ارائه روش پیشنهادی و چارچوب ارزیابی، چهار الگوریتم دسته بندی بر روی داده ها اجرا شده و معیارهای ارزیابی مختلف پیش و پس از بیش نمونه برداری محاسبه و تحلیل شده اند. هم چنین نتایج با روش های بیش نمونه برداری سنتی و اخیر مقایسه شده است. بیش نمونه برداری با روش پیشنهادی باعث افزایش معیار های صحت، دقت و تشخیص پذیری، و امتیاز اف دسته بندی داده های اقلیت نسبت به داده های نامتعادل و همچنین در مقایسه با روش های دیگر بیش نمونه برداری می شود.
    کلید واژگان: شبکه های مولد تخاصمی (GAN)، دسته بندی متون نامتعادل، بیش نمونه برداری، متن نامتعادل، دسته بندی
    B. Javid, H. Mashayekhi *
    Text generation methods use artificial intelligence to automatically generate natural language texts. One of the uses of text generation is in text classification. Many real-world problems are related to imbalanced textual data, which can reduce classification efficiency. One approach to solving the imbalanced data problem is the minority class oversampling. Due to the progress of generative adversarial networks (GAN) in data generation, these networks can be used to generate text samples in oversampling. Generating text using GANs is a complex problem due to the discrete nature of text. Despite their potential, the use of these networks in solving the problem of imbalanced textual data has rarely been investigated. This article examines the effect of using the SentiGAN network to solve the problem of imbalanced user reviews with the aim of improving the classification efficiency. To evaluate the proposed method, before and after oversampling with traditional, recent and SentiGAN methods, four classification algorithms were implemented on the data and evaluation criteria were calculated. It was observed that oversampling with the help of SentiGAN has increased the accuracy, precision, specificity and f_score of zero class compared to the situation where the data is imbalanced or even is oversampled by the other methods.
    Keywords: Generative Adversarial Networks (GAN), Imbalanced Text Classification, Oversampling, Imbalanced Text, Classification
  • Farnaz Hoseini *, Hamed Sepehrzadeh
    Breast cancer is the most common type of cancer among women. Early diagnosis of this disease and its treatment can significantly reduce the death rate from this cancer. The separation of benign and malignant masses in mammography images is one of the important things in the timely detection of breast cancer, which in some cases, due to the density and natural structure of the breast, deep and hidden disorders, make the diagnosis difficult for radiologists. In this study, frequency transformations and Naive Bayes classification have been used with the aim of extracting effective features in mammography images. The aim of the presented method is to increase the accuracy of diagnosis between malignant and benign tumors in mammography images. The results obtained from the implementation of the proposed method on the MIAS database show that the proposed method has been able to improve the accuracy of diagnosing this disease on normal and abnormal images by 91%, Precision by 98%, Recall by 987%, and F-measure by 90%.
    Keywords: Breast Cancer, Frequency Converters, Mammography Images, Feature Extraction, Classification
  • Hoda Yazdanparast*, Seyyed Reza Mousavi, Ladan Ebadi, Salar Mirzapour

    A land cover map stands as a cornerstone of urban planning endeavors, furnishing indispensable insights into the landscape's composition and distribution. However, traditional methodologies for map creation and maintenance often entail significant temporal and financial investments. Embracing deep-learning-based approaches presents a promising avenue for revolutionizing aerial map generation, offering efficiencies hitherto unattainable. This research endeavors to harness the power of neural networks rooted in deep learning to craft a comprehensive land cover map. Focusing on Shiraz city, this study endeavors to delineate urban land uses into four distinct categories: Almond, Pistachio, Bare soil, and Shadow of trees. Leveraging imagery captured by a Phantom DJI 4 drone, the research scrutinizes ground features to facilitate accurate classification. The adoption of convolutional neural networks (CNN) emerges as a pivotal component of the methodology, serving as the bedrock for the automated classification process. Preliminary findings underscore the efficacy of the CNN approach, yielding an impressive overall accuracy rate of approximately 86.56%. Such results not only underscore the viability of deep-learning-based methodologies in land cover mapping but also underscore the potential for scalability and applicability across diverse urban landscapes. By mitigating the resource-intensive nature of traditional mapping techniques, this study paves the way for more agile and cost-effective urban planning endeavors, poised to accommodate the dynamic nature of modern cities.

    Keywords: Deep Learning, Land Cover, CNN, UAV Image, Classification
  • Parisa Allahverdizadeh*, Saeid Taghavi Afshord

    Trust is the main concern of the Bank's customers regarding electronic and Internet services. The trust of both customers is logically and experimentally important to each other, and banks need to take more steps as service providers to maintain their customers. It is necessary to increase the factors affecting the satisfaction and reliability of customers in banks using data mining. In this paper, we examine the factors affecting the increase of customers' confidence in banking and Internet banking services and the impact of any perceived credit factor by public and private banks, service providers, and infrastructure providers in electronic banking. The presented method is based on scientific data mining algorithms such as clustering and classification of the decision tree J48 and the neural network, as well as a quick and practical application of the miner. Data are analyzed using a questionnaire with the bank customers of 25 Tejart bank branches in Tehran. The experimental results demonstrate that the accuracy of the decision tree classification algorithm is 84.04 and the neural network is 72.3%.

    Keywords: Trust, Bank, Data Mining, Classification, Customers
  • Mostafa Monemizadeh *, Seyed Rouhollah Samareh Hashemi, Mohsen Sheikh-Hosseini, Hamed Fehri
    Concepts and laws of physics have been a valuable source of inspiration for engineers to overcome human challenges and problems. Classification is an important example of such problems that plays a major role in various fields of engineering sciences. It is shown that discriminative classifiers tend to outperform their generative counterparts, especially in the presence of sufficient labeled training data. In this paper, we present a new physics-inspired discriminative classification method using minimum potential line. To do this, we first consider two groups of fixed point charges (as two classes of data) and a movable classifier line between them. Then, we find a stable position for the classifier line by minimizing the total potential integral on the classifier line due to the two groups of point charges. Surprisingly, it will be shown that the obtained classifier is actually an uncertainty-based classifier that minimizes the total uncertainty of the classifier line. The effectiveness of the proposed method is validated by some experiments on both synthetic and real datasets. First, two synthetic datasets are constructed to visually demonstrate the efficiency of the proposed method. Then, some real-world benchmark datasets are selected (from the well-known UCI machine learning repository) to compare the classification performance of the proposed method with three well-known classification methods.
    Keywords: Classification, Discriminative, Generative, Potential, Uncertainty
  • احسان اکبری*

    بروز خطاهای مختلف در سیستم انتقال به دلیل پیچیدگی ساختار و طولانی بودن خطوط انتقال نیرو، امری اجتناب ناپذیر است. تشخیص، دسته بندی و تعیین مکان خطا در این سیستم ها می تواند از بروز خسارت های بیشتر به شبکه قدرت جلوگیری کند. الگوریتم های مبتنی بر تئوری امواج سیار غالبا بر اساس روش های پردازش سیگنال پیاده سازی شده و قادرند تنها مکان بروز خطا را مشخص کنند. در حالی که تعیین نوع خطا به دلیل تنوع بالای خطاهای احتمالی در خطوط انتقال، به عملکرد بهتر و سریع تر سیستم حفاظتی کمک می کند. به همین منظور در این مقاله، یک الگوی تشخیص، دسته بندی و مکان یابی خطا به صورت یکپارچه پیشنهاد می شود که تنها از سیگنال های ولتاژ اندازه گیری شده روی یک ترمینال خط انتقال استفاده می کند. به منظور استخراج ویژگی از سیگنال اولیه از تبدیل موجک گابور استفاده شده و نتایج آن برای تشخیص و دسته بندی خطا استفاده خواهد شد. در ادامه نیز تئوری امواج سیار به منظور تعیین سکشن خطا و مکان یابی آن اعمال می گردد. علاوه بر این، به دلیل نصب جبران ساز توان راکتیو در خط انتقال، عملکرد سیستم حفاظتی می بایست به روزرسانی شود. نتایج شبیه سازی عددی در محیط MATLAB نشان دهنده عملکرد دقیق الگوی پیشنهادی در تشخیص، دسته بندی و مکان یابی خطا است. به کمک استراتژی پیشنهادی، میانگین دقت دسته بندی خطا و مکان یابی خطا به ترتیب برابر 100% و 99.573% به دست می آید. بروز خطاهای مختلف در سیستم انتقال به دلیل پیچیدگی ساختار و طولانی بودن خطوط انتقال نیرو، امری اجتناب ناپذیر است. تشخیص، دسته بندی و تعیین مکان خطا در این سیستم ها می تواند از بروز خسارت های بیشتر به شبکه قدرت جلوگیری کند. الگوریتم های مبتنی بر تئوری امواج سیار غالبا بر اساس روش های پردازش سیگنال پیاده سازی شده و قادرند تنها مکان بروز خطا را مشخص کنند. در حالی که تعیین نوع خطا به دلیل تنوع بالای خطاهای احتمالی در خطوط انتقال، به عملکرد بهتر و سریع تر سیستم حفاظتی کمک می کند. به همین منظور در این مقاله، یک الگوی تشخیص، دسته بندی و مکان یابی خطا به صورت یکپارچه پیشنهاد می شود که تنها از سیگنال های ولتاژ اندازه گیری شده روی یک ترمینال خط انتقال استفاده می کند. به منظور استخراج ویژگی از سیگنال اولیه از تبدیل موجک گابور استفاده شده و نتایج آن برای تشخیص و دسته بندی خطا استفاده خواهد شد. در ادامه نیز تئوری امواج سیار به منظور تعیین سکشن خطا و مکان یابی آن اعمال می گردد. علاوه بر این، به دلیل نصب جبران ساز توان راکتیو در خط انتقال، عملکرد سیستم حفاظتی می بایست به روزرسانی شود. نتایج شبیه سازی عددی در محیط MATLAB نشان دهنده عملکرد دقیق الگوی پیشنهادی در تشخیص، دسته بندی و مکان یابی خطا است. به کمک استراتژی پیشنهادی، میانگین دقت دسته بندی خطا و مکان یابی خطا به ترتیب برابر 100% و 99.573% به دست می آید.

    کلید واژگان: تشخیص، دسته بندی و مکان یابی خطا، سیستم انتقال جبران سازی شده، تبدیل موجک گابور، تئوری امواج سیار
    Ehsan Akbari*

    The occurrence of various faults in the transmission lines is inevitable due to the power transmission lines' complexity and length. Detecting, classifying, and locating faults in these systems can prevent further damage to the power grid. Algorithms based on the traveling wave theory are often implemented based on signal processing methods and can determine only the location of the faults. Determining the type of fault due to the wide variety of possible faults in the transmission lines can help the protection system operate more reliably and faster. Accordingly, in this paper, an integrated fault detection, classification, and location model is proposed, which uses only the voltage signals measured on one terminal of the transmission line. In order to extract features from the primary signal, Gabor wavelet transformation is used and its results will be utilized for fault detection and classification. Next, the traveling wave concept is applied to determine the fault section and estimate its location. In addition, due to the installation of the reactive power compensator in the transmission line, the performance of the protection system must be updated. Simulation results in MATLAB demonstrate the accurate performance of the proposed model in fault detection, classification, and location. By employing the proposed strategy, the average accuracy of fault classification and location is 100% and 99.573%, respectively.

    Keywords: Fault Detection, Classification, Location, Compensated Transmission System, Gabor Wavelet Transform, Traveling Wave Theory
  • سیده فاطمه نوراللهی*، راضیه برادران، حسین امیرخانی

    امروزه با رشد فعالیت در شبکه های اجتماعی شاهد افزایش کلام نفرت انگیز به صورت برخط هستیم و به همین منظور مسئله تشخیص نفرت در فضای مجازی دارای اهمیت است. همچنین تطبیق دامنه نیز در این مسئله و به طورکلی در حوزه پردازش زبان طبیعی، یکی از چالش های مهم است. در بسیاری از مسائل، ضمن تغییر دامنه با افت عملکرد مواجهیم که این موضوع در مسئله نفرت نیز صادق است. در این پژوهش با استفاده از روش های تطبیق دامنه سعی در افزایش قدرت تعمیم پذیری مدل های تشخیص نفرت خواهیم داشت. برای این منظور روش های مبتنی بر ترنسفورمر شامل آموزش خصمانه دامنه و ترکیب متخصصان را به کار می گیریم و همچنین از آموزش چند منبعی استفاده می کنیم. آزمایش ها با استفاده از چهار مجموعه داده در حوزه نفرت انجام می شوند. در ابتدا مد ل ها را به صورت درون دامنه ای و تک منبعی ارزیابی می کنیم. در مرحله بعد با اضافه کردن دامنه های دیگر به بخش آموزش، شاهد افت نتایج و انتقال منفی هستیم. سپس آزمایش های برون دامنه ای را ابتدا به صورت تک منبعی با مدل DistilBERT انجام می دهیم که با تغییر دامنه نتایج به طور قابل توجهی کاهش می یابند. به منظور افزایش قدرت تطبیق دامنه مدل در بخش برون دامنه ای، روی چند منبع آموزش را انجام می دهیم که حدودا در نیمی از موارد سبب بهبود نتایج می شود که نتیجه معناداری نیست. در ادامه با استفاده از روش های مبتنی بر ترنسفورمر شامل آموزش خصمانه دامنه و ترکیب متخصصان سعی در افزایش قدرت تطبیق دامنه مدل ها خواهیم داشت که در 87% از آزمایش های برون دامنه ای چند منبعی شاهد افزایش عملکرد هستیم. البته این روش ها در عملکرد آزمایش های درون دامنه ای هم موثر هستند. مسئله مهمی که گاهی موجب افت وخیز چشمگیر نتایج می شود، مجموعه داده ها هستند. شباهت داده ها و تشابه توزیع بعضی دامنه ها باعث افزایش قدرت تطبیق دامنه مدل می شوند.

    کلید واژگان: کلام نفرت انگیز، تطبیق دامنه، تعمیم، طبقه بندی، ترنسفورمر
    Seyedeh Fatemeh Nourollahi*, Razieh Baradaran, Hossein Amirkhani

    Today, with the growth of activity in social media, we see an increase in hate speech online and for this reason, the issue of recognizing hate in cyberspace is important. Also, domain adaptation is one of the important challenges in this task and in general in the field of natural language processing. In many issues, while changing the domain, we face a drop in performance, which is also true in the task hate speech. In this research, we try to increase the generalizability of hate detection models by using domain adaptation methods. For this purpose, we use Transformer-based methods, including domain adversarial training and mixture of experts, and we also use multi-source training. Experiments are conducted using four datasets in the domain of hate. At first, we evaluate the models in an in-domain and single-source manner. In the next step, by adding other domains to the education section, we see a drop in results and a negative transfer. Then we perform the out-of-domain tests first as a single source with the DistilBERT model, which significantly reduces the results by changing the domain. In order to increase the power of domain adaptation of the model in the out-of-domain part, we perform the training on several sources, leads to improve the results in about half of the cases, which is not significant. In the following, we try to increase the domain adaptation power of the models, using transformer-based methods including domain adversarial training and the mixture of experts, which leads to increase in performance in 87% of multi-source out-of-domain tests. Of course, these methods are also effective in the performance of in-domain tests. An important issue that sometimes causes a significant drop in results is datasets. The similarity of the data and the similarity of the distribution of some domains increase the power of domain adaptation of the model and on the contrary.

    Keywords: Hate Speech, Classification, Transformer, Domain Adaptation, Generalization
  • سهیل رنجبر*

    در این مقاله، روشی برخط جدید به منظور آشکارسازی مکان خطا در شبکه توزیع با حضور منابع تولید پراکنده براساس تئوری ماشین‫های بردار پشتیبان ارائه می‫شود. برای این منظور،  با استفاده از مدل سازی خط متوسط، ولتاژ و جریان توسط واحدهای اندازه گیری فازوری جمع آوری و ثبت می شوند و به صورت شاخص های مختلف پیشنهادی برای آموزش SVM مورد استفاده قرار می گیرند. در ادامه، طرح SVM پیشنهادی در محیط زمان واقعی پیاده سازی و باتوجه به سناریوی خطای، مکان خطا به صورت برخط تخمین زده می شود. طرح پیشنهادی، روشی برخط و غیرمبتنی بر ماتریس امپدانس شبکه بوده به نحوی که در هر پنجره زمانی، با اندازه گیری سیگنال های فازوری و در ادامه محاسبه شاخص های پیشنهادی، مکان های خطا تخمین زده می شوند.به منظور آموزش و تسن الگوریتم پیشنهادی، از یک شبکه آزمایشی استاندارد 33 باسه IEEE حاوی منابع تولید پراکنده مورد استفاده قرار می‫گیرد و نمونه های آموزشی در پنجره های زمان پس از رفع خطا به صورت جفت داده ورودی-خروجی نمونه برداری و به منظور آموزش ماشین‫بردار پشتیبان استفاده می شوند. شاخص های پیشنهادی برمبنای مقادیر برخط ولتاژ، جریان و فرکانس بوده و توسط شاخص های متنوع، عملکرد الگوریتم مورد تست قرار می گیرد. نتایج بدست آمده توانایی روش معرفی شده را در آشکارسازی مکان خطا بلافاصله پس از وقوع خطا نشان می‫دهد.

    کلید واژگان: مکان یابی خطا، آشکارسازی، داده کاوی، ماشین های بردار پشتیبان
    SOHEIL RANJBAR*

    This paper presents a new method for predicting fault location on distribution networks based on the support vector machine (SVM) technique. The proposed in an online non model based scheme which works based on the real data provided by wide area signals, performs as an intelligent indicator for online estimation of fault locations in distribution systems. In this case, for training intelligent SVM based indicator, a feature selection technique is used to find the best combination of the system phasor variables as input signal to the relay. For this purpose, several stable/unstable scenarios with the potential of oscillating dynamic behaviors are created by time domain transient stability simulation. The main merit of the proposed protection scheme is its ability for predicting instead of detection which can reasonably increase relay speed. The proposed approach is applied on IEEE 33-bus test system and the simulation results show promising performance for the SVM based relay.

    Keywords: Distribution Network, Prediction, Classification, Support Vector Machine, Phasor Measurement Unit
  • Ashwaq Hassan, Mahmood Mohassel Feghhi *, Vida Esmaeili
    Automatic modulation classification is used in various applications, including satellite communication systems, military communication, and submarine communications. In this paper, the automatic classification of modulation types is done using a two-stage method that combines a short-time Fourier transform (STFT) and a hybrid deep neural network (HDNN). At the first stage, using the STFT as a data source, the time-frequency information is retrieved from the modulated signals. A hybrid deep neural network feed two-dimensional (2D) images as inputs. In the second stage, the HDNN feeds the 2D time-frequency data to classify the various modulation types. Six various types of modulation schemes, including amplitude-shift keying, frequency-shift keying, phase-shift keying, quadrature amplitude-shift keying, quadrature frequency-shift keying, and quadrature phase-shift keying, are recognized automatically in the SNR range of 0 to 25 dB. An exhaustive computer simulation has been performed to evaluate the performance of the proposed digital modulation classification method. The simulation results show that, in comparison with the existing methods, our proposed method performs well and significantly reduces the processing time.
    Keywords: classification, hybrid deep neural network, modulation, short-time Fourier transform
  • فهیمه فلاح، فاطمه زمانی*
    تشخیص نوع بیماری سرطان که به ان زیرگروه گفته می شود در تعیین روند درمان حایز اهمیت فراوانی است. در این مقاله، هدف تشخیص چهار زیرگروه سرطان مغز می باشد. تشخیص زیرگروه بیماری را می توان در قالب یک مسئله طبقه بندی مدل کرد. با توجه به پیشرفت های چشمگیر صورت گرفته در علم بیوانفورماتیک در استخراج اطلاعات ژنتیکی از بدن انسان، اخیرا از این اطلاعات در توصیف بیماران در یادگیری ماشین استفاده زیادی می شود. در این مقاله از سه نوع داده ژنی شامل mRNA، miRNA و متیلاسیون DNA استفاده شده است. ترکیب منابع مختلف اطالاعاتی در قالب داده های چندوجهی به جای استفاده از یک منبع اطلاعاتی واحد، به افزایش دقت طبقه بندی اطلاعات منجر می شود. برای استخراج ویژگیهای مطلوب تر از داده های ژنی، از خودرمزگذار استفاده شده است بطوریکه ویژگی های استخراج شده از خودرمزگذار، به عنوان تقویت کننده در کنار داده های ژنی اولیه قرار می گیرند. همچنین جنگل تصادفی به عنوان یک طبقه بندی کننده در طبقه بندی بیماران بر مبنای داده های ژنی عملکرد مطلوبی داشته است. با گسترش روش های عمیق در شبکه های عصبی و عملکرد مطلوب آنها، نسخه ای از جنگل تصادفی عمیق با ساختار لایه ای ارائه شده است. جنگل تصادفی عمیق دارای این مزیت است که در کنار عملکرد مطلوب در طبقه بندی اطلاعات، تعداد پارامتر محدودی داشته و پیچیدگی محاسباتی آن پایین تر است. در این مقاله از جنگل تصادفی عمیق برای تعیین زیرگروه نوعی از سرطان مغز استفاده شده است. نتایج آزمایش ها نشان دهنده عملکرد مطلوب روش پیشنهادی است.
    کلید واژگان: بیوانفورماتیک، طبقه بندی اطلاعات، خودرمزگذار، جنگل تصادفی عمیق، استخراج ویژگی، داده های ژنی، GBM، TCGA
    F. Fallah, F. Zamani *
    Diagnosing the type of cancer, which is called the subtype, is very important in determining the treatment process. This paper focuses on the diagnose of the four subtypes of the brain cancer. Disease subtype diagnosis can be modeled as a classification problem. Due to the significant progress made in bioinformatics in extracting genetic information from the human body, recently this information is widely used in the representing of patients in machine learning. In this paper, three types of genetic information including mRNA, miRNA and DNA methylation are used.It should be noted that combining different information sources in the form of multimodal data instead of using a single information source increases the accuracy of information classification. To extract more desirable features from the original genetic data, auto-encoder has been used so that the features extracted from auto-encoder are concatenated to the original genetic data.Random forest has performed well as a classifier in classifying patients based on genetic information. By extending deep methods in neural networks and their good performance, a version of deep random forest with layered structure has been proposed. The deep random forest has the advantage that has a limited number of parameters and lower computational complexity in addition to the optimal performance in information classification. In this paper, deep random forest is used to determine the subtype of a special type of brain cancer. The experiment results show the desired performance of the proposed method.
    Keywords: Bioinformatics, Classification, Autoencoder, Deep Forest, Feature Extraction, TCGA
  • پرستو محقق، سمیرا نوفرستی *، مهری رجائی

    در عصر کلان داده ها، تکنیک های تجزیه و تحلیل خودکار مانند داده کاوی به طور گسترده ای برای تصمیم گیری به کار گرفته شده و بسیار موثر واقع شده اند. از جمله تکنیک های داده کاوی می توان به طبقه بندی اشاره کرد که یک روش رایج برای تصمیم گیری و پیش بینی است. الگوریتم های طبقه بندی به طور معمول بر روی مجموعه داده های متوازن به خوبی عمل می کنند. با وجود این، یکی از مشکلاتی که الگوریتم های طبقه بندی با آن مواجه هستند، پیش بینی صحیح برچسب نمونه های جدید بر اساس یادگیری بر روی مجموعه داده های نامتوازن است. در این نوع از مجموعه داده ها، توزیع ناهمگونی که داده ها در کلاس های مختلف دارند باعث نادیده گرفته شدن نمونه های کلاس با تعداد نمونه کمتر در یادگیری طبقه بند می شوند؛ در حالی که این کلاس در برخی مسائل پیش بینی دارای اهمیت بیشتری است. به منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل سازی مجموعه داده های نامتوازن ارائه می شود که با متعادل نمودن تعداد نمونه های کلاس های مختلف در مجموعه داده ای نامتوازن، پیش بینی صحیح برچسب کلاس نمونه های جدید توسط الگوریتم یادگیری ماشین را بهبود می بخشد. بر اساس ارزیابی های صورت گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه بندی مجموعه داده های نامتوازن به نام های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش های دیگر دارد.

    کلید واژگان: انتخاب نمونه، داده افزایی، طبقه بندی، مجموعه داده نامتوازن، داده کاوی، یادگیری ماشین
    Parastoo Mohaghegh, Samira Noferesti *, Mehri Rajaei

     In the era of big data, automatic data analysis techniques such as data mining have been widely used for decision-making and have become very effective. Among data mining techniques, classification is a common method for decision making and prediction. Classification algorithms usually work well on balanced datasets. However, one of the challenges of the classification algorithms is how to correctly predicting the label of new samples based on learning on imbalanced datasets. In this type of dataset, the heterogeneous distribution of the data in different classes causes examples of the minority class to be ignored in the learning process, while this class is more important in some prediction problems. To deal with this issue, in this paper, an efficient method for balancing the imbalanced dataset is presented, which improves the accuracy of the machine learning algorithms to correct prediction of the class label of new samples. According to the evaluations, the proposed method has a better performance compared to other methods based on two common criteria in evaluating the classification of imbalanced datasets, namely "Balanced Accuracy" and "Specificity".

    Keywords: Instance selection, data augmentation, classification, imbalanced data, data mining, machine learning
  • Damianus Owusu *, Christiana Nyarko, Joseph Acquah, Joel Yarney

    Head and neck cancer (HNC) recurrence is ever increasing among Ghanaian men and women. Because not all machine learning classifiers are equally created, even if multiple of them suite very well for a given task, it may be very difficult to find one which performs optimally given different distributions. The stacking learns how to best combine weak classifier models to form a strong model. As a prognostic model for classifying HNSCC recurrence patterns, this study tried to identify the best stacked ensemble classifier model when the same ML classifiers for feature selection and stacked ensemble learning are used. Four stacked ensemble models; in which first one used two base classifiers: gradient boosting machine (GBM) and distributed random forest (DRF); second one used three base classifiers: GBM, DRF, and deep neural network (DNN); third one used four base classifiers: GBM, DRF, DNN, and generalized linear model (GLM); and fourth one used five base classifiers: GBM, DRF, DNN, GLM, and Naïve bayes (NB) were developed, using GBM meta-classifier in each case. The results showed that implementing stacked ensemble technique consisting of five base classifiers on gradient boosted features achieved better performance than achieved on other feature subsets, and implementing this stacked ensemble technique on gradient boosted features achieved better performance compared to other stacked ensemble techniques implemented on gradient boosted features and other feature subsets used. Learning stacked ensemble technique having five base classifiers on GBM features is clinically appropriate as a prognostic model for classifying and predicting HNSCC patients’ recurrence data.

    Keywords: HNSCC recurrence, Machine learning, Stacking, Feature Selection, Classification
  • Negin Ebrahim Ghajari, Abdolhossein Fathi *
    In recent years, artificial intelligence has been used to diagnose and classify cancers using different deep learning-based models. Although they have good overall accuracy, they need high computation resources and execution time, and also have low accuracy, precision, and sensitivity. To this end, we try to employ a new model named the "EfficientNetB0" model with appropriate preprocessing to obtain high precision and sensitivity at a relatively low computation time for diagnosing lung cancer. The EfficientNetB0 model consists of 7 blocks, and each block includes one layer of mobile convolution (MB-Conv) and squeeze-excitation (SE) blocks. EfficientNetB0 has a higher accuracy compared to other common deep learning models due to incorporating a compound coefficient approach. The proposed model is evaluated on the histopathology images dataset and the obtained accuracy of the model is 0.9258. Also, its precision and sensitivity are 0.942 and 0.967, respectively, and these show the superiority of this model compared to existing methods.
    Keywords: Histopathology Images, Efficienetnetb0 Model, Deep Leaning, Lung Cancer Diagnosis, Classification, Digital Pathology
  • Ali Tavakoli Kashani *, Zahra Sartibi, Seyed Ali Ziaee, Mahdi B. Khorasani
    The transportation sector accounts for a significant portion of global energy consumption and, gasoline is a major fuel consumed in road transport. On the other hand, the excessive consumption of gasoline can lead to an increase in unnecessary trips and road accidents. This study aims to determine the impact of macroscale factors on gasoline consumption. In this regard, we investigated the effect of gasoline price, oil reserves, and income level on gasoline consumption per capita in about 90 countries, including Iran, over a period of 17 years. Also, Rail and Air travel per capita and membership in the Organization for Economic Co-operation and Development (OECD) were considered as control variables. For this purpose, one of the classification techniques utilized in the area of data mining, Classification, and Regression Tree (CART), was employed. The variable importance measure (VIM) was calculated to quantify the association of each independent variable with the target variable. The results indicated that oil reserves, gasoline prices, and average income have a normalized significance of 100, 58.5, and 30.3 % respectively. Other variables do not have significant importance. So, higher per-capita gasoline consumption is exclusively involved in oil-rich countries such as Iran. Therefore, considering national oil reserves should be prioritized when comparing fuel consumption across world countries. Also, more expensive gasoline would relatively diminish its use. However, this effect of the gasoline price is mostly confirmed for countries with lower national oil reserves which often have higher prices than their counterparts.
    Keywords: Gasoline Consumption, Gasoline Price, Oil Reserves, Classification, Regression Tree (CART), Variable Importance Measure (VIM)
  • فرزانه ابراهیمی*، محمدعلی زارع چاهوکی، علی هاشمی

    پیام رسان تلگرام بستری مناسب برای کاربرانی است که به دنبال خرید محصول یا دریافت خدمات به صورت آنلاین هستند. در این پیام رسان، برای درخواست محصول،امکان دسترسی مستقیم به ارایه دهندگان کالا و خدمات وجود ندارد و باید ابتدا در گروه های تلگرامی مرتبط عضو شد و درخواست خود را در تک تک گروه ها ثبت کرد و منتظر پاسخ ماند. این امر ضمن زمان بر بودن، با مشکلاتی همراه است. هدف از این پژوهش تشخیص کاربران ارایه دهنده خدمات به منظور ارتباط مستقیم و موثر با مشتریان است. بدین منظور از ایده دسته بندی پیام های فارسی منتشر شده در تلگرام استفاده شد. یکی از مشکلات دسته بندی این پیام ها، ابعاد بزرگ فضای ویژگی است که سبب کاهش دقت و افزایش زمان دسته بندی می شود. برای حل این مسیله از روش های انتخاب ویژگی استفاده شد. روش پیشنهادی این پژوهش، بر مبنای ترکیب روش های انتخاب ویژگی مبتنی بر فیلتر محلی و سراسری است. نوآوری این پژوهش در استفاده از روش های ترکیبی انتخاب ویژگی جهت دسته بندی خودکار پیام های فارسی تلگرام، به منظور شناسایی کاربران ارایه دهنده خدمات است. روش پیشنهادی، ضمن کاهش تعداد ویژگی ها و انتخاب ویژگی های مرتبط، سبب بهبود عملکرد دسته بندی و تشخیص کاربران ارایه دهنده خدمات می شود.

    کلید واژگان: دسته بندی، کاربران ارائه دهنده خدمات، انتخاب ویژگی، کاهش ویژگی، یادگیری ماشین
    Farzaneh Ebrahimi, MohammadAli Zare Chahooki, Ali Hashemi

    Telegram Messenger is a suitable platform for users who are looking to buy a product or receive services online. In these messengers, it is not possible to have direct access to the providers of goods and services, and in order to request the product, one must first become a member of the related groups and channels telegram. The purpose of this study is to directly identify users of service providers using the classification of Persian messages published in Telegram. One of the problems with categorizing these messages is the large size of the feature space, which reduces accuracy and increases classification time. Feature selection methods were used to solve this problem. The proposed method of this research is based on a combination of feature selection methods based on local and global filters. In this regard, in the first step, using the most widely used methods for selecting local and global filter feature, related features are selected. In the second step, a combination of local and global filtering methods is used to identify better features and increase classification accuracy. The innovation of this research is in using the combined methods of feature selection for automatic classification of Telegram Persian messages, in order to identify the users of the service provider. The proposed method, while reducing the number of features and selecting related features, improves the performance of classification and Identification of service providers.

    Keywords: : classification, Service Provider Users, Feature selection, Feature Reduction, machine learning
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال