دکتر محمدعلی جوادزاده
-
گراف ها، داده هایی هستند که روابط پیچیده بین موارد مختلفی مانند اینترنت، شبکه اجتماعی، شبکه کتابشناختی و مانند آن را در دنیای واقعی توصیف می کنند. یکی از مواردی که امروزه افراد بسیاری با آن سر و کار دارند، شبکه های اجتماعی آنلاین می باشد. نمایش گراف شبکه های اجتماعی آنلاین نظیر توییتر، وی چت و فیس بوک امروزه با کمتر از میلیاردها گره امکان پذیر نمی باشد و من باب همین موضوع، مطالعه داده های شبکه در مقیاس بزرگ برای محققان را به یک امر ضروری تبدیل کرده است. در مورد شبکه های اجتماعی، کاربران آنلاین اغلب اطلاعات محدودی دارند؛ اما برای ارائه دهندگان خدمات رسانه های اجتماعی، اطلاعات گره کاربر مانند علاقه، اعتقادات یا ویژگی های دیگر برای سفارشی کردن خدمات آن ها برای کاربران در بسیاری از برنامه ها مانند توصیه ها و جستجوی شخصی بسیار مهم است و آن را به یک چالش برای ارائه دهندگان خدمات تبدیل کرده است. یک راه موثر برای مقابله با این چالش، استنتاج اطلاعات گمشده کاربر با استفاده از ساختارهای شبکه ای فراگیر در رسانه های اجتماعی است. یکی از مهم ترین استنتاج ها در داده کاوی و تحلیل شبکه، طبقه بندی گره ها است که هدف آن استنتاج برچسب های گمشده گره ها بر اساس گره های برچسب گذاری شده و ساختار شبکه است. در این پژوهش وظیفه طبقه بندی گره ها بر روی مجموعه داده های شبکه استنادی PubMedDiabetes، CiteSeer و Cora با استفاده از شبکه های عصبی گراف GraphSAGE، GCN و GAT مورد بررسی قرار داده شده است و به صورت کلی نتیجه حاصل شده است که شبکه عصبی گراف GraphSAGE بر روی مجموعه داده های شبکه استنادی ذکرشده برای وظیفه طبقه بندی گره ها به خوبی عمل می کند.
کلید واژگان: طبقه بندی گره ها, شبکه های عصبی گراف, مجموعه داده های شبکه استنادیGraphs are data that describe complex relationships between different things in the real world, such as the Internet, social network, bibliographic network, and so on. One of the things that many people deal with today is online social networks. The graph display of online social networks such as Twitter, WeChat and Facebook is not possible today with less than billions of nodes, and for this reason, the study of large-scale network data has become a necessity for researchers. Regarding social networks, online users often have limited information; But for social media service providers, user node information such as interest, beliefs, or other characteristics are very important to customize their services for users in many applications such as recommendations and personalized search, making it a challenge for service providers. An effective way to deal with this challenge is to infer missing user information using pervasive network structures in social media. One of the most important inferences in data mining and network analysis is node classification, which aims to infer the missing labels of nodes based on labeled nodes and network structure. In this research, we have performed the task of node classification on the PubMedDiabetes, CiteSeer and Cora citation network datasets using GraphSAGE, GCN and GAT neural networks and we have generally concluded that the GraphSAGE neural network on the network datasets The cited reference works well for the node classification task.
Keywords: Classification Of Nodes, Graph Neural Networks, Citation Network Datasets -
خوشه بندی گره های گراف از جنبه ساختاری یا محتوایی، همواره موردتوجه پژوهشگران حوزه داده کاوی بوده است؛ اما به خوشه بندی گراف بر مبنای ساختار و محتوا به طور ترکیبی کمتر توجه شده است. با توجه به نیاز خوشه بندی ساختاری-محتوایی در شبکه های اطلاعاتی که شبکه های اجتماعی نمونه ای از آن هاست، در این مقاله الگوریتم خوشه بندی ICS-Cluster ارایه شده که هر دو جنبه ساختار و محتوا را به صورت هم زمان در نظر می گیرد. هدف این روش، رسیدن به خوشه هایی با ساختار درونی منسجم (ساختاری) و مقادیر ویژگی (محتوایی) همگن در گراف است. در این روش ابتدا گراف اولیه به یک گراف ساختاری-محتوایی تبدیل می شود که در آن وزن هر یال (ارتباط) بیانگر شباهت ساختاری-محتوایی دو گره (موجودیت) است. خوشه بندی با توجه به وزن یال ها به صورت افزایشی انجام می شود بدین معنا که گره های یال با وزن بالا به عنوان خوشه در نظر گرفته می شوند و وزن یال های متصل به خوشه با یکدیگر ادغام شده و به صورت یک یال متصل به خوشه در نظر گرفته می شوند، این مراحل تا زمانی که الگوریتم به تعداد خوشه موردنظر کاربر برسد، ادامه خواهد یافت. الگوریتم ICS-Cluster به هر تعداد خوشه که مدنظر کاربر است، گراف را خوشه بندی می کند. مقایسه الگوریتم مطرح شده با سه الگوریتم خوشه بندی ساختاری- محتوایی ارایه شده، بر اساس معیارهای شش گانه سنجش کیفیت خوشه، بیانگر عملکرد مناسب روش ICS-Cluster است. این معیارها معیارهای ساختاری تراکم خوشه، خطای یال و پیمانگی، معیار محتوایی میانگین شباهت، معیار ساختاری-محتوایی CS-Measure و زمان اجرای روش ها است.
کلید واژگان: خوشه بندی گراف, خوشه بندی ساختاری- محتوایی, گراف خصوصیت, استخراج خوشهResearchers have always been interested in graph nodes clustering based on content or structure. But less attention has been paid to clustering based on both structure and content. But a content-structural clustering is needed in information networks like social networks. In this paper, the ICS-Cluster algorithm is proposed which takes into consideration both the structure and content aspects of the nodes. The purpose of this approach is to gain a coherent internal structure (structural aspect) and homogeneous attribute values (content aspect) in the graph. In this approach firstly the graph is converted into a content-structural graph which edges’ weight show similarity between the connected nodes. Incremental clustering is done based on edges’ weight in this process the edges with the most weight is considered as clusters then the weight of connected edge to the cluster is aggregated and they’ll be one edge, the process is repeated until the algorithm reaches the number of clusters that indicated by the user. ICS-Cluster algorithm number of cluster is indicated by the user. Comparing ICS-Cluster with other content structural algorithm based on six criteria for measuring cluster quality shows that ICS-Cluster has good performance. These criteria contain structural criteria (Modularity, Error Link, and Density), content criterion (Average Similarity), content-structural criterion (CS-Measure) and the run time.
Keywords: Graph Clustering, content-structural clustering, Attributed Graph, Cluster Extraction
- این فهرست شامل مطالبی از ایشان است که در سایت مگیران نمایه شده و توسط نویسنده تایید شدهاست.
- مگیران تنها مقالات مجلات ایرانی عضو خود را نمایه میکند. بدیهی است مقالات منتشر شده نگارنده/پژوهشگر در مجلات خارجی، همایشها و مجلاتی که با مگیران همکاری ندارند در این فهرست نیامدهاست.
- اسامی نویسندگان همکار در صورت عضویت در مگیران و تایید مقالات نمایش داده می شود.