بررسی رویکردهای متن کاوی و عملکرد آن در کشف و استخراج موضوع

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
زمینه و هدف

در این پژوهش چهار روش متن کاوی بررسی می شود و بر درک و شناسایی خصوصیات و محدودیت های آن ها در کشف موضوع تمرکز می کند. این چهار روش عبارت اند از 1) تجزیه وتحلیل معنایی پنهان(LSA) 2) تحلیل معنایی پنهان احتمالاتی(PLSA)، 3) تخصیص دیریکله پنهان(LDA) و 4) مدل سازی موضوعی همبسته(CTM).

روش پژوهش

پژوهش حاضر از نوع کتابخانه ای است که در آن، ادبیات حوزه متن کاوی و مدل سازی موضوعی مرور و تحلیل شده است.

یافته ها

تجزیه وتحلیل معنایی پنهان می تواند برای تشخیص موضوعات خاص و منحصربه فرد در مدارکی که تنها به یک موضوع پرداخته اند استفاده شود. سه روش دیگر متن کاوی، بر موضوعات و گرایش کلی متن متمرکز هستند. تحلیل معنایی پنهان احتمالاتی  برای مدارکی که به یک موضوع پرداخته اند قابل استفاده است اما برخلاف تجزیه وتحلیل معنایی پنهان ، این روش در کشف موضوعات و مضامین کلی متن کاربرد دارد. درحالی که تخصیص دیریکله پنهان  در مورد مدارکی که به چندین موضوع پرداخته اند کاربرد بیشتری دارد. روش مدل سازی موضوعی همبسته  می تواند در تشخیص ارتباط بین دسته های موضوعی مختلف استفاده شود.

نتیجه گیری

رویکردهای متن کاوی به خاطر بهره گیری از تحلیل معنایی در کشف و استخراج موضوع متون مناسب است

زبان:
فارسی
صفحات:
15 تا 26
لینک کوتاه:
https://www.magiran.com/p2294139 
سامانه نویسندگان
  • دکتر علی منصوری
    نویسنده مسئول (1)
    دکتر علی منصوری
    دانشیار دانشیار گروه علم اطلاعات و دانش شناسی دانشگاه اصفهان، دانشگاه اصفهان، اصفهان، ایران
اطلاعات نویسنده(گان) توسط ایشان ثبت و تکمیل شده‌است. برای مشاهده مشخصات و فهرست همه مطالب، صفحه رزومه را ببینید.
مقالات دیگری از این نویسنده (گان)