دادگان پرسش و پاسخ زبان فارسی
پاسخ سریع و دقیق به سوالات مطرح شده به زبان طبیعی یکی اهداف مهم در توسعه سیستم های پرسش وپاسخ است که در آن رایانه یک متن و سوال را درک می کند و پاسخ دقیق را برای کاربر ارائه می نماید. با اینکه پیشرفت های زیادی در این حوزه صورت گرفته است اما همچنان جزو مسائلی است که نیاز به ارتقا خصوصا برای زبان های غیر از انگلیسی مثل زبان فارسی است. در این مقاله دادگان پرسش وپاسخ زبان فارسی (FarsiQuAD) تهیه شده که توسط انسان و از مقالات ویکی پدیای فارسی ایجاد گردیده و در دو نسخه منتشر شده است. نسخه 1 شامل 10000+ پرسش وپاسخ و نسخه 2 این شامل مجموعه بیش از 145000+ ردیف است. این دادگان قابلیت تجمیع با نسخه انگلیسی SQuAD و سایر دادگان زبان های دیگر که از این استاندارد استفاده کرده باشند را دارد و برای عموم منتشر شده است. این دادگان جهت ساخت مدل های هوش مصنوعی مبتی بر یادگیری عمیق و برای استفاده در سامانه های پرسش و پاسخ زبان فارسی است. نتایج این تحقیق نشان می دهد دادگان پرسش وپاسخ زبان فارسی ایجاد شده می تواند پاسخ به سوالات مطرح شده به زبان طبیعی فارسی را با معیار تطابق دقیق 78 درصد و معیار F1 87 درصد برساند که هنوز نیازمند ارتقا است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.