خوشه بندی مقالات علمی بر پایه الگوریتم k_means مطالعه موردی: پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک)

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
با رشد روز افزون منابع و مقالات در سطح وب، بکارگیری روش هایی سریع و ارزان برای دسترسی به متون مورد نظر از میان مجموعه وسیع این مستندات، اهمیت بیشتری می یابد. برای رسیدن به این هدف، به کارگیری تکنیک های متن کاوی، گامی ارزشمند در جهت کشف دانش از مستندات متنی به شمار می رود. هدف اصلی این پژوهش خوشه بندی پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک) براساس فنون متن کاوی می باشد. تا مقالات موجود به چند خوشه تقسیم شوند بطوریکه مقالات خوشه های مختلف حداکثر تفاوت ممکن و مقالات موجود در هر خوشه بیشترین شباهت را با هم داشته باشند. مقالات حوزه های مرتبط با فن آوری اطلاعات انتخاب شدند. بدین منظور ابتدا تمام کلید واژه های حوزه های فن آوری اطلاعات بر اساس دفعات بسامد آنها در مقالات پایگاه انتخاب و سپس مقالات هر کلیدواژه از پایگاه ایران داک استخراج گردید. سپس با استفاده از نرم افزار notepad++ مجموعه داده موردنظر ایجاد گردید. در این پژوهش برای انجام خوشه بندی از الگوریتم k_means و از معیار تابع فاصله اقلیدسی[1] برای اندازه گیری تشابه خوشه ها استفاده گردید. سپس نتایج حاصل از خوشه بندی مورد تجزیه و تحلیل قرار گرفت تا میزان شباهت و الگوی مناسب میان مقالات کشف شد. الگوی مورد نظر نشان داد که بیشترین میزان مشابهت میان مقالات دو خوشه داده کاوی و شبکه عصبی با فاصله اقلیدسی 365/1 وجود دارد و کمترین میزان شباهت میان مقالات دو خوشه بهینه سازی و پردازش تصویر با فاصله 387/1 گزارش شده است. دانش حاصل از پژوهش، خوشه بندی مقالات مرتبط با بیشترین وکمترین میزان مشابهت با یکدیگر، یافتن الگوی جدید جهت دسترسی سریع و آسان به مقالات مشابه و کشف ارتباط پنهان میان موضوعات مختلف می باشند.این دانش به پژوهشگران کمک می کند تا بتوانند مقالات موضوعی مرتبط با تخصص خود و مشابه با موضوع مورد مطالعه را به نحوی مطلوب تر شناسایی کنند. [1] -Euclidean distance
زبان:
فارسی
صفحات:
871 تا 896
لینک کوتاه:
magiran.com/p1950471 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
دسترسی سراسری کاربران دانشگاه پیام نور!
اعضای هیئت علمی و دانشجویان دانشگاه پیام نور در سراسر کشور، در صورت ثبت نام با ایمیل دانشگاهی، تا پایان فروردین ماه 1403 به مقالات سایت دسترسی خواهند داشت!
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!