بهبود کارآمدی سامانه های پرسش و پاسخ دامنه باز برای پاسخ دهی به پرسش های چندگامی در زبان فارسی
نویسنده:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
امروزه یکی از محبوب ترین و چالش برانگیزترین وظایف در پردازش زبان طبیعی پاسخ دهی به پرسش های پیچیده کاربران است. سامانه های پرسش و پاسخ به عنوان نسل جدید موتورهای جستجو پرسش های کاربران را به زبان طبیعی و بدون محدودیت معنایی دریافت می کنند و پاسخ را به صورت دقیق بر می گردانند. در سال های اخیر اکثر پژوهش های انجام شده در حوزه سامانه های پرسش و پاسخ بر روی زبان انگلیسی متمرکز بوده و در زبان های با منابع محدود از جمله فارسی تلاش چندانی صورت نگرفته است. این امر سبب می شود این سامانه ها در پشتیبانی از زبان های با منابع محدود همچون فارسی نتوانند کارآمدی خوبی را در مواجه با یک پرسش از خود ارائه دهند. در همین راستا در این مقاله جهت افزایش کارآمدی سامانه های پرسش و پاسخ در زبان فارسی نسبت به تولید و توسعه یک مجموعه داده برای پاسخ دهی به پرسش های پیچیده چندگامی یا به اختصار چندگامی اقدام گردید. پرسش های چندگامی، نیازمند حداقل دو گام استدلال برای دستیابی به پاسخ هستند. این مجموعه داده یا PersianMHQA به عنوان اولین مجموعه داده پرسش و پاسخ دامنه باز شامل 7000 پرسش چندگامی بوده و در سازوکاری مشخص با استفاده از متن دانش نامه ویکی پدیا فارسی تولید شده است. به منظور ارزیابی و محک زنی این مجموعه داده روی جدیدترین مدل های زبانی پیش آموزش دیده که از زبان فارسی پشیبانی می کنند تنظیم دقیق شده است. بهترین نتایج دست آمده مبتنی بر دو معیار اف وان و تطابق دقیق روی این مجموعه داده به ترتیب 92/75 و 73/71 است. نتایج بدست آمده نشانگر این حقیقت است که این مجموعه داده شروعی قدرتمند برای بهبود پرسش و پاسخ پیچیده چندگامی برای سامانه های پرسش و پاسخ فارسی است.
کلیدواژگان:
زبان:
فارسی
صفحات:
1 تا 10
لینک کوتاه:
https://www.magiran.com/p2782797