مرجع گزینی در زبان فارسی با استفاده از شبکه عصبی عمیق
در حال حاضر با توجه به کثرت شبکه های اجتماعی و شبکه های خبری تلویزیونی، رادیویی، اینترنتی و غیره، خواندن تمام متون مختلف و به تبع آن تحلیل آن ها و دست یابی به ارتباطات این متون نیازمند صرف هزینه زمانی و انسانی بسیار بالا است که در عصر کنونی با استفاده از فن های مختلف پردازش زبان طبیعی صورت می گیرد، یکی از چالش های موجود در این زمینه پایین بودن دقت سامانه های مرجع گزینی است که سبب کشف روابط ناصحیح و یا عدم کشف روابط صحیح می شود. مراحل کلی حل مساله مرجع گزینی از سه گام شناسایی موجودیت های نامدار، استخراج ویژگی های موجودیت های نامدار و مرجع گزینی آن ها تشکیل شده است. موجودیت های نامدار ویژگی های فراوانی دارند، وجود ویژگی های مختلف (متناسب و متناقض با مرجع) در گراف ها این امکان را می دهند که بتوان حد آستانه ای را از ترکیب ویژگی های مختلف استخراج کرد. در مقاله ارایه شده ابتدا پیش پردازش های مختلف روی پیکره پژوهشگاه خواجه نصیر [1] انجام گرفت؛ سپس با استفاده از الگوریتم های مبتنی بر شبکه عصبی عمیق داده های موجود به بردارهای عددی تبدیل شدند و پس از آن با استفاده از گراف و با ویژگی هایی که در متن مقاله عنوان شده هرس اولیه انجام گرفت؛ درواقع رویکردهای مبتنی بر گراف، موجودیت ها را همچون مجموعه ای از عناصر مرتبط با یکدیگر می شناسد که تحلیل روابط میان موجودیت های اولیه در گراف و وزن دهی به این ارتباط ها، منجر به استخراج ویژگی های سطح بالاتر و مرتبط تری می شود و نیز تناقضات ایجادشده بر اساس کمبود اطلاعات را تا حدودی کاهش می دهد. سپس با استفاده از شبکه های عصبی، روی پیکره مورداشاره در [30] (پیکره آزمون اپسلا) مرجع گزینی انجام گرفت که نتایج حاصل بیان گر بهبود روش پیشنهادی (رسیدن به دقت 09/62) است که در متن مقاله به طور مشروح بیان شده است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.