به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت

جستجوی مقالات مرتبط با کلیدواژه « active learning » در نشریات گروه « برق »

تکرار جستجوی کلیدواژه «active learning» در نشریات گروه «فنی و مهندسی»
  • سیدفخرالدین نوربهبهانی*
    نظرکاوی امروزه به عنوان یکی از کاربردهای پراهمیت پردازش زبان طبیعی مطرح است که به دلیل بالابودن حجم و نرخ نظرات تولیدشده نیاز به روش های ویژه ای برای پردازش دارد. امروزه با توجه به ماهیت جریان داده ای نظرات کاربران در شبکه های اجتماعی و سایت های تجارت الکترونیکی، استفاده از الگوریتم های دسته بندی غیر افزایشی باعث می گردد به مرور زمان کارایی مدل یادگرفته شده برای کاوش نظرات کاهش یافته و عملا غیر قابل استفاده شود. علاوه بر این به دلیل نامحدودبودن تعداد نظرات، امکان برچسب گذاری تمام نظرات برای ایجاد نمونه های آموزشی جدید و به روزرسانی مدل یادگرفته شده وجود ندارد. از آنجا که ممکن است نظرات جدید دارای واژگان جدید بوده و یا توزیع دسته های قطبیت تغییر کند، رانش مفهوم نیز می بایست در نظرکاوی افزایشی پشتیبانی گردد.
    در این مقاله یک روش جدید برای یادگیری قطبیت متون به صورت افزایشی ارائه می گردد که با استفاده از یادگیری فعال جریان داده ای، متون ارزشمند برای به روز رسانی مدل دسته بندی را انتخاب می کند و پس از تعیین برچسب آنها توسط متخصص انسانی، از آنها برای بهبود مدل دسته بندی بهره می گیرد. روش پیشنهادی به صورت برخط و بدون نیاز به ذخیره متون، با استفاده از تعداد محدودی متون برچسب خورده آموزش می بیند و قادر به تشخیص و پشتیبانی از رانش مفهوم می باشد. روش پیشنهادی با روش های شاخص افزایشی و غیر افزایشی، با استفاده از مجموعه داده های معتبر و معیارهای ارزیابی استاندارد مقایسه و ارزیابی می شود.
    کلید واژگان: جریان داده ها, رانش مفهوم, نظرکاوی, یادگیری افزایشی, یادگیری فعال}
    F. Noorbehbahani *
    Today, opinion mining is one the most important applications of natural language processing which requires special methods to process documents due to the high volume of comments produced. Since the users’ opinions on social networks and e-commerce websites constitute an evolving stream, the application of traditional non-incremental classification algorithm for opinion mining leads to the degradation of the classification model as time passes.
    Moreover, because the users’ comments are massive, it is not possible to label enough comments to build training data for updating the learned model. Another issue in incremental opinion mining is the concept drift that should be supported to handle changing class distributions and evolving vocabulary.
    In this paper, a new incremental method for polarity detection is proposed which with the application of stream-based active learning selects the best documents to be labeled by experts and updates the classifier. The proposed method is capable of detecting and handling concept drift using a limited labeled data without storing the documents. We compare our method with the state of the art incremental and non-incremental classification methods using credible datasets and standard evaluation measures. The evaluation results show the effectiveness of the proposed method for polarity detection of opinions.
    Keywords: Active learning, concept drift, incremental learning, opinion mining, stream data}
  • هادی صدوقی یزدی *، علی محی الدینی شاهم آبادی پور، مرتضی خادمی
    طبقه بند یکی از سه بلوک تشکیل دهنده یک نهان کاو ویدئو است که برای آموزش نیازمند برچسب می باشد. در نهان کاوی کور به دلیل عدم دسترسی به الگوریتم های نهان نگاری تهیه برچسب مشکل است. در این مقاله از طبقه بند خودسازمانده پویای شبه ناظر برای رسیدن به حداقل برچسب استفاده شده و بدین منظور مفهومی به نام افزونگی هندسی گره های لایه زیرین شبکه خودسازمانده پویای شبه ناظر به کار گرفته شده است. نشان داده شده که این افزونگی منجر به ایجاد الگوهای تکراری برای شبکه خواهد شد، پس حذف چنین گره هایی بلامانع است. اثبات شده به دلیل وجود تناظر یک به یک بین گره ها و برچسب ها کاهش گره ها منجر به کاهش تعداد برچسب لازم می شود. نکته اساسی این که لازمه وجود افزونگی هندسی در میان تعدادی گره که مفهومی انتزاعی است، تشکیل دسته توسط آنهاست و بنابراین مبنای الگوریتم پیشنهادی شناسایی دسته ها و ادغام اعضای آنهاست. طبقه بند به دست آمده بر این مبنا طبقه بند خودسازمانده هندسی نام نهاده شده و اثبات می شود که این طبقه بند می تواند به مقدار بهینه حداقل برچسب دست یابد. نتایج شبیه سازی نشان دهنده برتری چشم گیر طبقه بند نسبت به الگوریتم های پیشین است.
    کلید واژگان: طبقه بند خودسازمانده پویای شبه ناظر, نهان کاوی کور ویدئو, یادگیری شبه ناظر, یادگیری فعال}
    H. Sadoghi Yazdi *, A. Mohiaddini, M. Khademi
    Classifier is one of the three blocks of a video steganalysis that needs labeled for training. In the blind video steganalysis, due to the lack of access to steganography algorithms, it is difficult to label. In this paper, the semi supervised growing self-organizing map classifier has been used to reach the minimum label. For this purpose, a concept called the geometric redundancy of the lower-layer nodes of the semi supervised self-organizing network has been used. It has been shown that this redundancy will create repetitive patterns of the network, so deleting such nodes is possible. Proven due to the existence of one-to-one correspondence between nodes and labels. Reducing nodes leads to a reduction in the number of labels required. The basic point is the need for a geometric redundancy among a number of nodes, which is a conception of abstraction, is the formation of a group by them. Therefore, the proposed algorithm is based on identifying categories and integrating their members. The classifier obtained on this basis has been named a geometric self-organizing map classifier .It is proven that this classifier can achieve the minimum amount of optimal label. The simulation results show a remarkable superiority over the previous algorithms.
    Keywords: Video blind steganalysis, semi-supervised growing self-organizing map classifier, semi-supervised learning, active learning}
  • Keihan Kazemi, Ali Fanian
    Network traffic identification is an essential component for effective network analysis and management. Signature-based and machine learning techniques are the two most important methods in network traffic analysis. Due to the strengths and weaknesses of these two approaches, their combination can strengthen them and remove the weaknesses of each in detection process. In this article, a hybrid method is introduced, to identify major network tunneling protocols. This method can detect the well-known tunneling protocols by combining signature-based methods and statistical analysis techniques through a clustering algorithm. In this proposed method, the clustering process is refined by the feedback of signature-base method. Since, in semi-supervised clustering, it is important to gain most informative data to improve the clustering performance, in the proposed clustering method, a new active learning approach is introduced for selecting informative constraints. In this hybrid method, four tunneling protocols (L2TP, PPTP, IPsec and OpenVPN) are applied. The obtained results indicate that this proposed hybrid method significantly increases accuracy and cluster purity, and these protocols are identified with high accuracy and low processing cost.
    Keywords: Traffic Detection, Tunneling Protocols, Packet Payload Analysis, Semi-Supervised Clustering, Active Learning}
  • Somayeh Bakhshaei, Reza Safabakhsh, Shahram Khadivi
    Labeled data are useful resources for different application in different fields like image processing, natural language processing etc. Producing labeled data is a costly process. One efficient solution for alleviating the costly process of annotating data is managing the sampling process. It is better to query for essential samples instead of a group of unnecessary ones. Active learning (AL) attempts to overcome the labeling bottleneck by sending queries for unlabeled instances to be labeled with the help of an annotator. This technique is applied to Natural Language Processing (NLP) especially in Statistical Machine Translation (SMT) tasks that we also focus on in this work. In Statistical Machine Translation, parallel corpora are scarce resources, and AL is a way of solving this problem. It attempts to alleviate the costly process of data annotating by sending queries just for translation of the most informative sentences which are essential for system improvement. The contribution of our work is proposing a new approach in AL for selecting sentences through a soft decision making process. In this algorithm, in addition to scoring sentences according to their information, the distribution of the space of unlabeled data is also considered. Each sentence (either labeled or unlabeled) changes to a vector of feature scores. Then each new coming sentence is observed in the feature space and gets two probabilities: how probable it is to be either labeled or unlabeled. These probabilities are calculated according to the position of new instance related to its labeled and unlabeled neighbors. We have applied the proposed model for improving training corpus of a SMT system. Also Farsi-English language pairs are selected as the base-line SMT system. We have sampled the best sentences that can improve the quality of our SMT system and send query for their translations. In this way the costly approach of making parallel corpus is alleviated. Finally, our experiments show significant improvements for sampling sentences by soft decision making in comparison to the random sentence selection strategy.
    Keywords: component, Active Learning, Statistical Machine Translation, Farsi, English pair Languages, Soft Decision Making, Kernel Based Distance, Density Based KNN}
  • Kavan Fatehi *, Arastoo Bozorgi, Mohammad Sadegh Zahedi, Ehsan Asgarian
    Recently, semi-supervised clustering methods have been considered by many researchers. In this type of clustering, there are some constraints and information about a small portion of data. In constrained k-means method, the user (i.e. an expert) selects the initial seeds. In this paper, a constraint k-means method based on user feedback is proposed. With the help of the user, some initial seeds of boundary data obtained from clustering were selected and then the results of the user feedback were given to the constrained k-means algorithm in order to obtain the most appropriate clustering model for the existing data. The presented method was applied to various standard datasets and the results showed that this method clustered the data with more accuracy than other similar methods.
    Keywords: Clustering, Semi, supervised using user feedback, Active learning, Boundary data}
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال