ارائه مدل دسته بندی موضوعی تولیدات علمی حوزه سلامت با استفاده از روش های متن کاوی

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:

با گسترش اینترنت و رشد سریع و روزافزون مقالات الکترونیکی، دسته بندی متون به یکی از ابزارهای کلیدی و مهم برای سازماندهی و مدیریت داده تبدیل شده است. در دسته بندی متون، یک مجموعه دانش اولیه در اختیار سامانه قرار می گیرد تا با یادگیری از این مجموعه، اسناد جدید ورودی به یکی از گروه های موضوعی، ملحق گردد. در متون سلامت به علت تنوع زیاد موضوعات، آماده کردن چنین مجموعه آموزش اولیه عملی بسیار زمان بر و هزینه بر است. هدف از مقاله ارائه مدلی ترکیبی از یادگیری (با نظارت و بدون نظارت) برای دسته بندی موضوعی تولیدات علمی حوزه سلامت است که بدون نیاز به مجموعه برچسب خورده اولیه عمل دسته بندی را انجام دهد. برای استخراج مدل موضوعی متون تولیدات علمی سلامت طی سال های 2009 تا 2019 در پایگاه پابمد، با استفاده از روش آمیخته داده کاوی، شامل متن کاوی و یادگیری ماشینی انجام گرفت. بر اساس مدل موضوعی تخصیص پنهان دیریکله، دادها تحلیل و سپس برای دسته بندی متون، از مدل ماشین بردار پشتیبان استفاده شد. در یافته های این پژوهش، مدل دسته بندی متون سلامت در سه گام اصلی معرفی شد. در گام اول پیش پردازش های لازم بر روی مجموعه داده به دلیل حذف کلمات کم تکرار و غیرضروری از مجموعه داده و افزایش دقت مدل پیشنهادی انجام گرفت. در گام دوم موضوعات موجود در متون به کمک روش احتمالاتی تخصیص پنهان دیریکله استخراج و به عنوان یک مجموعه آموزش اولیه در گام سوم به الگوریتم دسته بندی ماشین بردار پشتیبان داده و عمل یادگیری دسته بند به کمک این موضوعات انجام گرفت. درنهایت به کمک دسته بند، موضوع هر سند مشخص گردید. نتایج نشان داد که مدل پیشنهادی می تواند، یک دسته بندی بهتر با استفاده از ترکیب کردن خواص بدون نظارت خوشه بندی و دانش پیشین نمونه ها بسازد. انجام دادن خوشه بندی روی نمونه های برچسب دار با یک معیار شباهت مشخص، متن های مرتبط را باهم ادغام و یک دانش پیشین ایجاد کرده، سپس الگوریتم یادگیری، دسته بندی را با روشی نظارتی آموزش می دهد. ترکیب دسته بندی و خوشه بندی می تواند دقت دسته بندی متون سلامت را افزایش دهد.

زبان:
فارسی
صفحات:
553 تا 574
لینک کوتاه:
https://magiran.com/p2103544 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!