naghmeh pakgohar
-
نشریه تحقیقات منابع طبیعی تجدید شونده، سال دوازدهم شماره 1 (پیاپی 35، بهار و تابستان 1400)، صص 147 -157امروزه به صورت گسترده از الگوریتم های خوشه بندی استفاده می شود، هرچند که تصمیم گیری برای انتخاب روش مناسب به دلیل روش های مختلف خوشه بندی و عوامل موثر بر آنها دشوار است. هدف این پژوهش مقایسه نتایج روش های خوشه بندی سلسله مراتبی و بررسی روش اندازه گیری فاصله موثر برای خوشه بندی است. برای این پژوهش، داده های جنگل های راش هیرکانی واقع در حوزه استحافظی اداره کل منابع طبیعی نوشهر مورد بررسی قرار گرفت. برای تعیین مراکز قطعات نمونه از روش منظم تصادفی با ابعاد شبکه 200×100 استفاده شد و در هر مرکز قطعه نمونه، قطعات نمونه صد مترمربعی (10×10 متر) برای بررسی گونه های علفی و چهارصد مترمربعی (20×20 متر) برای بررسی گونه های درختی و درختچه ای انتخاب شد. در مجموع 120 قطعه نمونه اندازه گیری شد. برآورد فراوانی و پوشش گونه های درختی، درختچه ای و علفی بر اساس مقیاس براون بلانکه انجام پذیرفت. سه روش اندازه گیری فاصله بری کورتیس، هلینگر و منهتن و الگوریتم های خوشه بندی، روش میانگین، روش وارد، روش بتای انعطاف پذیر با مقدار بتای 0/1-، 0/25-، 0/4- برای پژوهش انتخاب شدند و با استفاده از شش شاخص ارزیابی کننده (شاخص میانگین سیلویت، آنالیز پارتیشن، آنالیز گونه های معرف، آنالیز گونه های معرف خوشه ها برای کمینه کردن ثبات میانی، روش پاسخ چندگانه جایگشت و ضریب فی) مورد بررسی قرار گرفتند. نتایج هر معیار ارزیابی کننده از بهترین به بدترین رتبه دسته بندی شدند. یافته ها نشان داد روش خوشه بندی وارد و روش خوشه بندی بتای انعطاف پذیر با مقدار بتای 0/1- بهترین عملکرد را دارد و روش اندازه گیری فاصله هلینگر در داده های همگن بهتر از سایر روش های اندازه گیری فاصله است.کلید واژگان: جنگل های هیرکانی, خوشه بندی, روش اندازه گیری فاصله, طبقه بندی سلسله مراتبیNowadays, the application of clustering methods is widely increased, although choosing the right method due to the existence of different method and effective factors is difficult. The present study aimed to compare the results of widely used clustering algorithms and to determine the most effective methods according to the different evaluators and evaluate the effective distance measurement method for clustering algorithms. The data of Hyrcanian beech forests were examined in an area protected by the department of natural resources of Nowshahr. Random-systematic sampling method with regular grid of 100×200 m was used for determining the center of sample plots; 100-m2 (10×10 m) sample plots had been used to check the shrub species and 400-m2 (20×20 m) to check the herbaceous species. A total of 120 sample plots were measured. The abundance and coverage of tree, shrub and herbaceous species were estimated based on Braun-Blanquette scale. Three distance methods of measuring distance Bray Curtis, Hellinger and Manhattan were used and five clustering methods (Average method clustering methods, Ward method, flexible beta method with beta values of -0.1, -0.25, -0.4) with six evaluation indicators (silhouette evaluation criterion, PARATNA criterion, Indval criterion, ISAMIC criterion, MRPP criterion and Phi correlation coefficient) were examined. Different clustering algorithms were arranged from best to worst for each dataset. The comparison analysis revealed that Ward’s and flexible-beta with beta value of -0.1 had the best performance. The present findings illustrated that Hellinger distance measurement method is better in homogeneous data than other distance measurement methods.Keywords: Classification, Distance measures, Hierarchical clustering, Hyrcanian Forest
-
طبقه بندی، ابزاری کارآمد برای پژوهش های جوامع گیاهی و بررسی پدید ه های بوم شناختی است. هدف از پژوهش پیش رو، مقایسه روش های مختلف خوشه بندی در تجزیه وتحلیل خوشه ایبود. سه قطعه جنگلی با جهت جنوبی از توده های بلوط در جنگل های چهارزبر استان کرمانشاه با شرایط مشابه ازنظر شیب و ارتفاع از سطح دریا انتخاب شدند. در هر قطعه در فاصله های صفر، 25، 50، 100 و 150 متری با استفاده از سه خط نمونه که در فاصله های 200 متری از هم قرار گرفتند، نمونه برداری انجام شد. در این بررسی از روش تجزیه وتحلیل خوشه ایبرای طبقه بندی پوشش گیاهی استفاده شد. برای محاسبه ماتریس فاصله ها از روش Gower و برای اتصال خوشه ها از چهار روش نزدیک ترین همسایه، دورترین همسایه، اتصال میانگین و اتصال وارد استفاده شد. برای یافتن تعداد بهینه خوشه ها و بررسی کیفیت خوشه بندی در روش های مختلف از معیار سیلوئت استفاده شد. همچنین، انطباق بین ماتریس فاصله محاسبه شده و دندروگرام به دست آمده از روش های مختلف با ضریب همبستگی کوفنتیک ارزیابی شد. نتایج نشان داد که تعداد بهینه خوشه ها در جوامع بلوط منطقه مورد مطالعه، دو خوشه بود. مقدار همبستگی کوفنتیک بین ماتریس فاصله و دندروگرام به دست آمده از روش های میانگین و نزدیک ترین همسایه بیشتر از دو روش وارد و دورترین همسایه به دست آمد. همچنین، کیفیت خوشه بندی روش های نزدیک ترین همسایه و میانگین بهتر از دو روش دیگر بود، اما میانگین شاخص سیلوئت در خوشه دوم روش نزدیک ترین همسایه، بسیار کم بود، بنابراین روش اتصال خوشه میانگین همراه با ضریب فاصله Gower برای داده های ترتیبی مطلوب تر است و تغییری در داده ها ایجاد نمی کند.
کلید واژگان: خوشه بندی, داده های ترتیبی, طبقه بندی, ضریب فاصله GowerVegetation classification is an essential tool to describe, understand, predict and manage ecosystems. The aim of this study was to compare different types of hierarchical clustering. Three forest patches with similar slope and altitude gradients located on the southern slopes of Chahar Zebar forests, Kermanshah province, were selected. Vegetation sampling in each patch was conducted at 0, 25, 50, 100 and 150-meter distances along three transects that were 200 m apart. Cluster analysis was used for the classification of samples. Amongst the applied methods, Gower’s distance (or similarity) initially computes distances between pairs of variables over data sets and then merges those distances with the nearest neighbor, complete neighbor, average neighbor, and Ward’s method. The optimal number and quality of clusters were evaluated with silhouette criteria. In addition, the Cophenetic correlation coefficient was computed for evaluating the correlation between the dendrogram and the distance matrix. Results showed that two was the optimal number of clustering for oak stands. Moreover, the Cophenetic correlation coefficient between the distance matrix and the nearest neighbor and average method was higher than that returned between complete neighbor and Ward’s method. Based on silhouette criteria, the nearest neighbor and average methods were associated with higher cluster quality compared with two other methods. However, the mean value of the silhouette index was low for the second cluster of the nearest neighbor method. Considering the disadvantages of the nearest neighbor, the average method is suggested for clustering categorical data.
Keywords: Classification, Clustering, Gower distance, ordinal number
- در این صفحه نام مورد نظر در اسامی نویسندگان مقالات جستجو میشود. ممکن است نتایج شامل مطالب نویسندگان هم نام و حتی در رشتههای مختلف باشد.
- همه مقالات ترجمه فارسی یا انگلیسی ندارند پس ممکن است مقالاتی باشند که نام نویسنده مورد نظر شما به صورت معادل فارسی یا انگلیسی آن درج شده باشد. در صفحه جستجوی پیشرفته میتوانید همزمان نام فارسی و انگلیسی نویسنده را درج نمایید.
- در صورتی که میخواهید جستجو را با شرایط متفاوت تکرار کنید به صفحه جستجوی پیشرفته مطالب نشریات مراجعه کنید.