طبقه بندی متون فارسی مبتنی بر شبکه های عصبی عمیق

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:

امروزه با توجه به رشد روزافزون حجم اسناد الکترونیکی، طبقه بندی متون بر اساس روش های مختلفی در میان محققین بازیابی اطلاعات و متون عمومیت یافته است. با توجه به اهمیت موضوع و کارهایی که در این زمینه در زبان های مختلف دنیا انجام گرفته است، نیاز به طبقه بندی متون فارسی به خوبی احساس می شود. به طور کلی روش های طبقه بندی متون را می توان به روش های سنتی (مبتنی بر انتخاب ویژگی و یادگیری ماشین) و روش های مبتنی بر یادگیری عمیق تقسیم بندی کرد. روش های مبتنی بر یادگیری عمیق به دلیل توانایی اشتراک وزن به طور قابل توجهی سبب کاهش تعداد متغیرهای آزاد آموزش پذیر شبکه و در نتیجه افزایش تعمیم پذیری شده است و نتایج بهتری به نسبت سایر روش ها می دهد. در زبان فارسی روش های مبتنی بر یادگیری عمیق بسیار اندکی برای طبقه بندی متون ارایه شده است. در این مقاله دو مدل شبکه عصبی عمیق شامل شبکه عصبی پیچشی ParsCNN و شبکه عصبی با حافظه بلند کوتاه- مدت دوسویه سلسه مراتبی با لایه توجه ParsBiLSTM برای طبقه بندی متون فارسی تشریح شده است. کارایی سیستم های مبتنی بر شبکه عصبی عمیق بر روی مجموعه داده همشهری بررسی شده و از نظر سه معیار ارزیابی دقت، فراخوانی و مقیاس-F مورد مطالعه قرار گرفته است. نتایج آزمایش ها نشان می دهد که روش ParsCNN میزان دقت 69/0، فراخوانی 7/0 و مقیاس-F 69/0؛ همچنین روش ParsBiLSTM میزان دقت 72/0، فراخوانی 73/0 و مقیاس-F 72/0 دارند که نشان دهنده کارایی بالاتر این روش ها نسبت به روش های طبقه بندی متون فارسی مورد مطالعه است.

زبان:
فارسی
در صفحه:
1
لینک کوتاه:
https://magiran.com/p2556188 
مقالات دیگری از این نویسنده (گان)