استخراج ماشینی کلیدواژه با مدل سازی موضوعی ال. دی. ای.: شباهت سنجی با کلیدواژه های استاندارد و ارزیابی کاربران
زمینه و هدف :
هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتاب های الکترونیکی فارسی حوزه علوم با استفاده از مدل سازی موضوعی ال. دی. ای.، سنجش شباهت کلیدواژه های خروجی با کلیدواژه های استاندارد و ارزیابی کاربران از کلیدواژه های استخراج شده به صورت ماشینی است.
روش پژوهش:
این پژوهش کاربردی، از نوع پژوهش های متن کاوی و به جنبه روش های مورداستفاده در آن پژوهش آمیخته است. از مدل سازی موضوعی ال. دی. ای. برای استخراج کلیدواژه از فهرست های مندرجات کتاب ها استفاده شده و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.
فهرست های مندرجات مورد بررسی با میانگین پیراسته 260.02 کلمه از متون با طول متوسط محسوب می شوند و حدود 20 درصد از کلمات آن ها را ایست واژه ها تشکیل داده اند. میان کلیدواژه های استاندارد سرعنوانی و کلیدواژه های خروجی مدل ال. دی. ای. کسینوس شباهت، 0.0932، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژه های خروجی مدل موضوعی ال. دی. ای. حوزه موضوعی کل پیکره را نشان می دهند، اما ازنظر کاربران به ترتیب کلیدواژه های سرعنوانی استاندارد، کلیدواژه های مستخرج از مدل در زیرحوزه های موضوعی و کلیدواژه های مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفق اند.
کلیدواژه های به دست آمده از مدل موضوعی ال. دی. ای. را می توان در مجموعه های ناشناخته به منظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق موضوع به مدرک در پیکره های بزرگ با موضوعات ناهمگن و متنوع، نمی توان از این روش استفاده کرد. این روش در رویه های رسمی توصیف موضوعی تک تک مدارک به صورت مستقل می تواند به عنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایه ساز به کار گرفته شود.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.