جستجوی مقالات مرتبط با کلیدواژه « خوشه بندی ترکیبی » در نشریات گروه « برق »

تکرار جستجوی کلیدواژه «خوشه بندی ترکیبی» در نشریات گروه «فنی و مهندسی»
  • فاطمه نجفی، حمید پروین*، کمال میرزایی، صمد نجاتیان، سیده وحیده رضایی

    به علت بدون ناظر بودن مساله خوشه بندی، انتخاب یک الگوریتم خاص جهت خوشه بندی یک مجموعه ناشناس امری پر خطر و به طورمعمول شکست خورده است. به خاطر پیچیدگی مساله و ضعف روش های خوشه بندی پایه، امروزه بیش تر مطالعات به سمت روش های خوشه بندی ترکیبی هدایت شده است. در خوشه بندی ترکیبی ابتدا چندین خوشه بندی پایه تولید و سپس برای تجمیع آن ها، از یک تابع توافقی جهت ایجاد یک خوشه بندی نهایی استفاده می شود که بیشینه شباهت را به خوشه بندی های پایه داشته باشد. خوشه بندی توافقی تولید شده باید با استفاده از بیشترین اجماع و توافق به دست آمده باشد. ورودی تابع یادشده همه خوشه بندی های پایه و خروجی آن یک خوشه بندی به نام خوشه بندی توافقی است. در حقیقت روش های خوشه بندی ترکیبی با این شعار که ترکیب چندین مدل ضعیف بهتر از یک مدل قوی است، به میدان آمده اند. با این وجود، این ادعا درصورتی درست است که برخی شرایط  همانند تنوع بین اعضای موجود در اجماع و کیفیت آن ها رعایت شده باشند. این مقاله یک روش خوشه بندی ترکیبی را ارایه داده که از روش خوشه بندی پایه ضعیف cmeans فازی به عنوان خوشه بند پایه استفاده کرده است. همچنین با اتخاذ برخی تمهیدات، تنوع اجماع را بالا برده است. روش خوشه بندی ترکیبی پیشنهادی مزیت الگوریتم خوشه بندی cmeans فازی را که سرعت آن است، دارد و همچنین ضعف های عمده آن را که عدم قابلیت کشف خوشه های غیر کروی و غیر یکنواخت است، ندارد. در بخش مطالعات تجربی الگوریتم خوشه بندی ترکیبی پیشنهادی با سایر الگوریتم های خوشه بندی مختلف به روز و قوی بر روی مجموعه داده های مختلف آزموده و با یکدیگر مقایسه شده است. نتایج تجربی حاکی از برتری کارایی روش پیشنهادی نسبت به سایر الگوریتم های خوشه بندی به روز و قوی است.

    کلید واژگان: یادگیری ترکیبی, خوشه بندی ترکیبی, الگوریتم خوشه بندی cmeans فازی, اعتبار داده ها}
    Fatemeh Najafi, Hamid Parvin*, Kamal Mirzaei, Samad Nejatiyan, Seyede Vahideh Rezaie

    An ensemble clustering has been considered as one of the research approaches in data mining, pattern recognition, machine learning and artificial intelligence over the last decade. In clustering, the combination first produces several bases clustering, and then, for their aggregation, a function is used to create a final cluster that is as similar as possible to all the cluster bundles. The input of this function is all base clusters and its output is a clustering called clustering agreement. This function is called an agreement function. Ensemble clustering has been proposed to increase efficiency, strong, reliability and clustering stability. Because of the lack of cluster monitoring, and the inadequacy of general-purpose base clustering algorithms on the other, a new approach called an ensemble clustering has been proposed in which it has been attempted to find an agreed cluster with the highest Consensus and agreement. In fact, ensemble clustering techniques with this slogan, the combination of several poorer models, is better than a strong model. However, this claim is correct if certain conditions (such as the diversity between the members in the consensus and their quality) are met. This article presents an ensemble clustering method. This paper uses the weak clustering method of fuzzy cmeans as a base cluster. Also, by adopting some measures, the diversity of consensus has increased. The proposed hybrid clustering method has the benefits of the clustering algorithm of fuzzy cmeans that has its speed, as well as the major weaknesses of the inability to detect non-spherical and non-uniform clusters. In the experimental results, we have tested the proposed ensemble clustering algorithm with different, up-to-date and robust clustering algorithms on the different data sets. Experimental results indicate the superiority of the proposed ensemble clustering method compared to other clustering algorithms to up-to-date and strong.

    Keywords: Ensemble Learning, Ensemble Clustering, Fuzzy Cmeans Clustering Algorithm, Data Validity}
  • وحید قاسمی*، محمد جوادیان، سعید باقری شورکی
    V. Ghasemi *, M. Javadian, S. Bagheri Shouraki

    In this work, a hierarchical ensemble of projected clustering algorithm for high-dimensional data is proposed. The basic concept of the algorithm is based on the active learning method (ALM) which is a fuzzy learning scheme, inspired by some behavioral features of human brain functionality. High-dimensional unsupervised active learning method (HUALM) is a clustering algorithm which blurs the data points as one-dimensional ink drop patterns, in order to summarize the effects of all data points, and then applies a threshold on the resulting vectors. It is based on an ensemble clustering method which performs one-dimensional density partitioning to produce ensemble of clustering solutions. Then, it assigns a unique prime number to the data points that exist in each partition as their labels. Consequently, a combination is performed by multiplying the labels of every data point in order to produce the absolute labels. The data points with identical absolute labels are fallen into the same cluster. The hierarchical property of the algorithm is intended to cluster complex data by zooming in each already formed cluster to find further sub-clusters. The algorithm is verified using several synthetic and real-world datasets. The results show that the proposed method has a promising performance, compared to some well-known high-dimensional data clustering algorithms.

    Keywords: Ensemble Clustering, High Dimensional Clustering, Hierarchical Clustering, Unsupervised Active Learning Method}
  • محمد یوسف نژاد، علی ریحانیان، بهروز مینایی بیدگلی*

    در سال های اخیر، پژوهشگران، روش های مکاشفه ای مبتنی بر نظریه خرد جمعی را به منظور ارزیابی و انتخاب نتایج به دست آمده از خوشه بندی های پایه پیشنهاد کردند. در این روش ها، نتایج خوشه بندی با استفاده از معیارهای پراکندگی، استقلال و عدم تمرکز ارزیابی شده و با آستانه گیری از ارزیابی ها، نتایج به دست آمده انتخاب و ترکیب می شوند. هدف این مقاله، ارایه روشی جهت تخمین خودکار مقادیر بهینه آستانه، بر اساس ویژگی های اصلی داده در روش خوشه بندی بخردانه می باشد. علاوه بر آن، در این مقاله، به منظور اندازه گیری پراکندگی، معیاری جدید با عنوان همگونی بر اساس معیار APMM ارایه می شود. همچنین، جهت محاسبه استقلال به عنوان وزنی در ترکیب نتایج اولیه، روش انباشت مدارک وزن دار ارایه می شود. مقایسه نتایج تجربی به دست آمده بر روی چندین مجموعه داده استاندارد با سایر روش های خوشه بندی (ترکیبی)، نشان می دهد که روش پیشنهادی این مقاله از کارایی مناسبی برخوردار است.

    کلید واژگان: خوشه بندی ترکیبی, خوشه بندی مبتنی بر انتخاب, خوشه بندی بخردانه, آستانه گیری خودکار در خوشه بندی, معیار همگونی}
    M. Yousefnezhad, A. Reihanian, B. Minaei-Bidgoli *

    Recently, researchers proposed heuristic frameworks which are based on the Wisdom of Crowds in order to evaluate and select the basic results. In these methods, basic results are evaluated by diversity, independency and decentralization metrics. Then, the evaluated results are selected by thresholding, and combined by a consensus function. This paper aims to propose a method for automatic evaluation of the optimized threshold values based on the basic features of the input data in WOCCE. Also, Uniformity, a metric which is based on APMM, is introduced for calculating the diversity of two basic clustering results. Furthermore, Weighted Evidence Accumulation Clustering (WEAC), a new method for considering independency as a weight in the process of combining the basic results, is introduced in this paper. The experimental results indicate that the proposed method has higher efficiency in comparison with the results of other cluster ensemble methods.

    Keywords: Cluster ensemble, Cluster ensemble selection, Wised clustering, Automatic thresholding in clustering, Uniformity}
  • علیرضا لطیفی پاکدهی، نگین دانشپور*
    خوشه بندی ترکیبی، به ترکیب نتایج حاصل از خوشه بندی های موجود می پردازد. پژوهش های دهه اخیر نشان می دهد، چنان چه به جای ترکیب همه خوشه بندی ها، تنها دست های از آن ها بر اساس کیفیت و تنوع انتخاب شوند، آن چه به عنوان خروجی خوشه بندی ترکیبی حاصل می شود، بسیار دقیق تر خواهد بود. این مقاله به ارائه یک روش جدید برای انتخاب خوشه بندی ها بر اساس دو معیار کیفیت و تنوع می پردازد. برای رسیدن به این منظور ابتدا خوشه بندی های مختلفی با استفاده از الگوریتم k-means ایجاد می شود که در هر بار اجرا، مقدار k یک عدد تصادفی است. در ادامه خوشه بندی هایی که به این نحو تولید شده اند، با استفاده از الگوریتم جدیدیکه براساس میزان شباهت بین خوشه بندی های مختلف عمل می کند، گروه بندی می شوند تا آن دسته از خوشه بندی هایی که به یکدیگر شبیه اند در یک دسته قرار گیرند؛ سپس از هر دسته، با استفاده از یک روش مبتنی بر رای گیری، با کیفیت ترین عضو آن برای ایجاد خوشه بندی ترکیبی انتخاب می شود. در این مقاله از سه تابع HPGA، CSPA و MCLA برای ترکیب خوشه بندی ها استفاده شده است. در انتها برای آزمایش  این روش جدید از  داده های واقعی موجود در پایگاه داده UCI استفاده شده است. نتایج نشان می دهد که روش جدید کارایی بیشتر و دقیق تری نسبت به روش های قبلی دارد.
    کلید واژگان: خوشه بندی ترکیبی, انتخاب اعضا, شاخص های ارزیابی کیفیت}
    Alireza Latifi Pakdehi, Negin Daneshpour*
    Clustering is the process of division of a dataset into subsets that are called clusters, so that objects within a cluster are similar to each other and different from objects of the other clusters. So far, a lot of algorithms in different approaches have been created for the clustering. An effective choice (can combine) two or more of these algorithms for solving the clustering problem. Ensemble clustering combines results of existing clusterings to achieve better performance and higher accuracy. Instead of combining all of existing clusterings, recent decade researchers show, if only a set of clusterings is selected  based on quality and diversity, the result of ensemble clustering would be more accurate. This paper proposes a new method for ensemble clustering based on quality and diversity. For this purpose, firstly first we need a lot of different base clusterings to combine them. Different base clusterings are generated by k-means algorithm with random k in each execution. After the generation of base clusterings, they are put into different groups according to their similarities using a new grouping method. So that clusterings which are similar to each other are put together in one group. In this step, we use normalized mutual information (NMI) or adjusted rand index (ARI) for computing similarities and dissimilarities between the base clustering. Then from each group, a best qualified clustering is selected via a voting based method. In this method, Cluster-validity-indices were used to measure the quality of clustering. So that all members of the group are evaluated by the Cluster-validity-indices. In each group, clustering that optimizes the most number of Cluster-validity-indices is selected.  Finally, consensus functions combine all selected clustering. Consensus function is an algorithm for combining existing clusterings to produce final clusters. In this paper, three consensus functions including CSPA, MCLA, and HGPA have used for combining clustering. To evaluate proposed method, real datasets from UCI repository have used. In experiment section, the proposed method is compared with the well-known and powerful existing methods. Experimental results demonstrate that proposed algorithm has better performance and higher accuracy than previous works.
    Keywords: Ensemble clustering, select member, validity index}
  • علیرضا لطیفی پاکدهی، نگین دانشپور*

    خوشه بندی یکی از شاخه های مهم موجود در داده کاوی است که هدف آن تقسیم داده ها به زیرمجموعه های معناداری است که خوشه نامیده می شوند. این تکنیک شامل فرآیند پیدا کردن گروه بندی طبیعی در مجموعه داده ها، بر اساس شباهت و تفاوت است به نحوی که اطلاعات قبلی کمی در مورد داده ها در دسترس است و یا اصلا اطلاعاتی در دسترس نیست. در طی دهه های متمادی الگوریتم های فراوانی برای خوشه بندی در رویکردهای مختلف و متفاوت و یا ترکیبی از آنها ایجاد شده اند. در این مقاله الگوریتمی بر پایه رویکردهای مبنی بر تراکم و سلسله مراتبی ارائه می شود. DBSCANیکی از الگوریتم های مطرح شده در رویکرد مبتنی بر تراکم است. این الگوریتم نیاز به دو پارامتر دارد که تعیین آن هنوز یک چالش بزرگ است. در روش پیشنهادی پارامترهای الگوریتم DBSCANطوری تنظیم می شود که بدون نیاز به دخالت کاربر، خوشه های احتمالی بصورت خودکار یافت شوند. سپس خوشه های نزدیک به یکدیگر به قدری باهم ادغام می شوند تا کیفیت خوشه های نهایی به نحو مطلوبی ارتقا یابد. بدین ترتیب خوشه های باکیفیت و دقیقی بدست خواهد آمد. در انتها برای آزمایش این الگوریتم ترکیبی جدید از داده های واقعی موجود در پایگاه داده UCIاستفاده شد. نتایج نشان می دهد که الگوریتم ترکیبی جدید کارایی بیشتر و دقیقتر و سرعت مناسبی نسبت به روش های قبلی دارد.

    کلید واژگان: داده کاوی, خوشه بندی ترکیبی, خوشه بندی سلسله مراتبی, خوشه بندی مبتنی بر تراکم}
    Alireza Latifi Pakdehi, Negin Daneshpour*

    Clustering is one of the most important field of data mining that aims to divide data into meaningful subsets which are called clusters. This technique involves the process of finding natural groupings in the data set based on the similarities and di similarities which a little or no information about data are available. Over the decades, many clustering algorithms are created in different approaches or a combination of them. In this paper, an algorithm based on density and hierarchical approaches is presented. DBSCAN is one of the algorithms presented in the density-based approach. This algorithm requires two parameters that its determination is a great challenge. In the proposed method, DBSCAN algorithm parameters can be set without user involvement, so that potential clusters are found automatically. The clusters which are so close to each other are merged together until the quality of the final clusters to be enhanced properly. Thus, clusters could be more accurate and high quality. Finally, in order to test the new proposed algorithm, the real dataset in the UCI machine learning repository was used. The results indicate that the new algorithm is more efficient and accurate, and its speed is better than previous methods.

    Keywords: data mining, combinational clustering, hierarchical clustering, density-based clustering}
  • محمد جواد حسین پور، حمید پروین*
    به علت بدون ناظر بودن مسئله خوشه بندی انتخاب الگوریتمی خاص جهت خوشه بندی یک مجموعه ناشناس امری پر خطر و معمولا شکست خورده می باشد. به خاطر پیچیدگی مسئله و ضعف روش های خوشه بندی پایه، امروزه اکثر مطالعات به سمت روش های خوشه بندی ترکیبی هدایت شده است. پراکندگی در نتایج اولیه یکی از مهم ترین عواملی است که می تواند در کیفیت نتایج نهایی اثرگذار باشد. همچنین، کیفیت نتایج اولیه نیز عامل دیگری است که در کیفیت نتایج حاصل از ترکیب موثر است. هر دو عامل در تحقیقات اخیر خوشه بندی ترکیبی مورد توجه قرار گرفته اند. در اینجا یک چارچوب برای بهبود کارایی خوشه بندی پیشنهاد شده است که مبتنی بر استفاده از زیرمجموعه ای از خوشه های اولیه می باشند. انتخاب این زیرمجموعه نقش حیاتی در کارایی مجمع دارد. این انتخاب به کمک دو روش هوشمند انجام می گیرد. ایده های اصلی در روش های پیشنهادی برای انتخاب زیرمجموعه ای از خوشه ها، استفاده از خوشه های پایدار با الگوریتم های جستجوی هوشمند می باشند. برای ارزیابی خوشه ها، از معیار پایداری مبتنی بر اطلاعات متقابل استفاده شده است. در آخر نیز خوشه های انتخاب شده را به کمک چندین روش ترکیب نهایی با هم جمع می کنیم. نتایج تجربی روی چندین مجموعه داده استاندارد نشان می دهد که روش های پیشنهادی می توانند به طور موثری همچنین روش ترکیب کامل را بهبود دهند.
    کلید واژگان: خوشه بندی ترکیبی, ارزیابی خوشه, اطلاعات متقابل, زیر مجموعه ای از نتایج اولیه, الگوریتم ژنتیک, الگوریتم نورد شبیه سازی شده, خوشه بندی انباشت مدارک, ماتریس همبستگی}
    Mohamadjavad Hosseinpoor, Hamid Parvin*
    Most of the recent studies have tried to create diversity in primary results and then applied a consensus function over all the obtained results to combine the weak partitions. In this paper a clustering ensemble method is proposed which is based on a subset of primary clusters. The main idea behind this method is using more stable clusters in the ensemble. The stability is applied as a goodness measure of the clusters. The clusters which satisfy a threshold of this measure are selected to participate in the ensemble. For combining the chosen clusters¡ a co-association based consensus function is applied. A new EAC based method which is called Extended Evidence Accumulation Clustering¡ EEAC¡ is proposed for constructing the Co-association Matrix from the subset of clusters. The proposed method is evaluated on five different UCI repository data sets. The empirical studies show the significant improvement of the proposed method in comparison with other ones.
    Keywords: Clustering Ensemble, Cluster Stability, Mutual Information, Co, association Matrix}
  • حسین علیزاده*، رسول حسین زاده، اسلام ناظمی
    یکی از چالش های مهم در تحلیل شبکه های اجتماعی، تشخیص اجتماعات است. اجتماع مجموعه افراد یا سازمان هایی هستند که چگالی ارتباط آن ها با هم بیشتر از سایر موجودیت های شبکه است. خوشه بندی یا تشخیص اجتماعات، ساختار گروه ها در شبکه های اجتماعی و ارتباطات پنهان بین مولفه های آنها را آشکار خواهد نمود. اکثر روش های رایج تشخیص اجتماعات موجود قطعی نیستند و نتایج آن ها به مقادیر اولیه ای که در اکثر مواقع به صورت تصادفی انتخاب می شود بستگی دارد. اما خوشه بندی ترکیبی، بدون توجه به مقادیر اولیه تصادفی هر کدام از الگوریتم های پایه اش، با ترکیب آنها، نتایج مستحکم و پایداری تولید می کند.در این مقاله یک روش ترکیبی تشخیص اجتماعات با الهام از خوشه بندی ترکیبی پیشنهاد شده است. از مشخصه های روش پیشنهادی تشخیص اجتماعات ترکیبی، توانایی ترکیب با روش های دیگر است به گونه ای که می توان از الگوریتم های دقیق تر نیز در چهارچوب پیشنهادی استفاده کرد. نتایج تجربی در این مقاله نشان می دهند که روش ترکیبی پیشنهادی نسبت به متوسط روش های تشخیص اجتماعات پایه ای مورد استفاده در آن از کارایی بسیار بالاتری برخوردار بوده و در اکثر موارد حتی از بهترین الگوریتم پایه ای خود نیز بهتر عمل کرده است. نتایج این مقاله می تواند در بسیاری از مسائل از جمله تشخیص دقیق تر اجتماعات، بازاریابی، تبلیغات، درک شبکه و بهبود موتورهای جستجو مورد استفاده قرار گیرد.
    کلید واژگان: خوشه بندی, خوشه بندی ترکیبی, تشخیص اجتماعات, تشخیص اجتماعات ترکیبی, تحلیل شبکه های اجتماعی}
    One of the great challenges in Social Network Analysis (SNA) is community detection. Community is a group of vertices which have high intra connections and sparse inter connections. Community detection or Clustering reveals community structure of social networks and hidden relationships among their constituents. By considering the increase of datasets related to social networks, we need scalable algorithms to analyze these networks. Most of the community detection methods currently available are not deterministic and their results typically depend on specific random seeds or initial conditions. Ensemble clustering is used in data analysis to generate stable results out of a set of partitions delivered by stochastic methods. In this paper we propose an approach which goals in finding robust communities, with using ensemble community detection and we show that the proposed approach can be combined with any existing method in a self-consistent way, enhancing considerably the performance of the resulting partitions. The results of this study can be used for many issues such as more accurately identify community detection, marketing, advertising, networking and search engine optimization.
    Keywords: Clustering, Cluster Ensemble, Community Detection, Community Detection Ensemble, Social Networks Analysis}
  • حسین علیزاده، محسن مشکی، حمید پروین، بهروز مینایی بیدگلی
    اکثر مطالعات اخیر در حوزه خوشه بندی ترکیبی سعی می کنند ابتدا خوشه بندی های اولیه ای تولید کنند که تا حد ممکن دارای پراکندگی باشند، سپس با اعمال یک تابع توافقی همه این نتایج را با هم ترکیب می کنند. در این مقاله یک روش جدید خوشه بندی ترکیبی ارائه شده است که در آن به جای استفاده از تمام نتایج اولیه، تنها از زیرمجموعه ای از خوشه های اولیه استفاده می شود. ایده اصلی در این روش استفاده از خوشه های پایدار در ترکیب نهایی است. برای ترکیب خوشه های انتخابی، از تابع توافقی مبتنی بر ماتریس همبستگی استفاده شده است. از آن جایی که ساخت ماتریس همبستگی با در دسترس بودن تنها تعدادی از خوشه ها، با روش های موجود امکان پذیر نمی باشد، در این مقاله یک روش جدید به نام خوشه بندی انباشت مدارک توسعه یافته، برای ساخت ماتریس همبستگی از زیرمجموعه ای از خوشه ها پیشنهاد شده است. برای ارزیابی خوشه ها، از پایداری مبتنی بر اطلاعات متقابل استفاده شده است. نتایج تجربی روی چندین مجموعه داده استاندارد نشان می دهد که روش پیشنهادی به طور موثری نتایج خوشه بندی های اولیه را بهبود می دهد. همچنین، مقایسه نتایج در مقایسه با سایر روش های خوشه بندی ترکیبی نشان از کارایی بالای روش پیشنهادی دارد.
    کلید واژگان: خوشه بندی ترکیبی, پایداری خوشه, اطلاعات متقابل, ماتریس همبستگی}
    Mohsen Moshki, Hamid Parvin, Behrouz Minaei Bidgoli
    Most of the recent studies have tried to create diversity in primary results and then applied a consensus function over all the obtained results to combine the weak partitions. In this paper a clustering ensemble method is proposed which is based on a subset of primary clusters. The main idea behind this method is using more stable clusters in the ensemble. The stability is applied as a goodness measure of the clusters. The clusters which satisfy a threshold of this measure are selected to participate in the ensemble. For combining the chosen clusters, a co-association based consensus function is applied. A new EAC based method which is called Extended Evidence Accumulation Clustering, EEAC, is proposed for constructing the Co-association Matrix from the subset of clusters. The proposed method is evaluated on five different UCI repository data sets. The empirical studies show the significant improvement of the proposed method in comparison with other ones.
