تشخیص موجودیت های نامدار در متون فارسی با استفاده از یادگیری عمیق
شناسایی موجودیت های نامدار [1] یکی از فعالیت های زیربنایی در حوزه پردازش زبان طبیعی [2] و به طور کلی زیر مجموعه ای از استخراج اطلاعات [3] است. در فرآیند شناسایی موجودیت های نامدار به دنبال یافتن عناصر اسمی در متن و دسته بندی آنها به رده هایی ازپیش تعیین شده از قبیل اسامی اشخاص، سازمان ها، مکان ها، مذاهب، عنوان کتاب ها، عنوان فیلم ها و غیره هستیم. در این مقاله با بهره گیری از روش های نوین در این حوزه مانند استفاده از دو بردار مختلف بازنمایی معنایی واژگان برمبنای کلمه و حروف تشکیل دهنده آن برمبنای شبکه های عصبیو همچنین استفاده از روش های یادگیری عمیق [4] یک سامانه تشخیص موجودیت های نامدار معرفی می شود. همچنین در راستای پژوهش حاضر، یک پیکره برچسب گذاری شده شامل سه هزار چکیده از ویکی پدیای فارسی که شامل نود هزار واژه است با استفاده از پانزده برچسب مختلف ارایه می شود که گام مهمی در ارتقای پژوهش های آینده این حوزه برداشته خواهد شد. نتایج حاصل از ارزیابی سامانه پیشنهادی نشان می دهد که می توان با استفاده از داده معرفی شده به دقت 09/72 در معیار F رسید.
پرداخت حق اشتراک به معنای پذیرش "شرایط خدمات" پایگاه مگیران از سوی شماست.
اگر عضو مگیران هستید:
اگر مقاله ای از شما در مگیران نمایه شده، برای استفاده از اعتبار اهدایی سامانه نویسندگان با ایمیل منتشرشده ثبت نام کنید. ثبت نام
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.