ارائه یک رویکرد ترکیبی جدید برای یافتن بردارهای پایه معنادار جهت بازنمایی صریح بردارهای کلمه
هدف اصلی این پژوهش بازنمایی صریح بردارهای معنایی کلمه با ابعاد کم است. برای تولید بردارهای معنایی کلمه صریح، بایستی مسیله ی یافتن تعداد محدودی بردار پایه معنادار به گونه ای حل شود که با کاهش ابعاد بردارهای کلمه افت دقت زیادی ایجاد نشود. ما در این پژوهش یک رویکرد ترکیبی برای یافتن بردارهای پایه معنادار ارایه می کنیم. در ابتدا، N بردار پایه را با روش های پیشنهادی 1-معیار نسبت شباهت کلمه به تکرار کلمه، 2-انتخاب ویژگی مبتنی بر مقایسه ماتریس های فاصله، 3-وز ن دهی دودویی مبتنی بر الگوریتم BPSO بدست می آوریم. سپس، برای بهره گیری از خبرگی روش های 1و 2 به میزان یکسان، نیمی از بردارهای پایه بدست آمده با روش معیار نسبت شباهت کلمه به تکرار کلمه را با نیمی از بردارهای پایه انتخاب شده با روش انتخاب ویژگی، ترکیب کرده و بردارهای پایه ترکیبی اول را بدست می آوریم. در مرحله بعدی، کلمات بافتار مشترک دارای وزن "1" بدست آمده با استفاده از روش BPSO را به بردارهای پایه ترکیبی اول حاصل از روش های نسبت شباهت کلمه به تکرار کلمه و روش انتخاب ویژگی می افزاییم. بنابراین، بردارهای پایه ترکیبی دوم بدست می آیند که معنادار هستند و هر بردار پایه معادل یک کلمه بافتار آگاهی بخش است. لذا بردارهای کلمه صریح تولید شده با استفاده از بردارهای پایه معنادار، تفسیرپذیر هستند. ما رویکرد پیشنهادی را با استفاده از پیکره UkWaC آموزش داده و بر روی وظیفه شباهت کلمه مورد ارزیابی قرار می دهیم. هر دو بردارهای پایه ترکیبی اول و دوم سبب بهبود دقت می گردند. این افزایش دقت در بردارهای پایه ترکیبی اول بیشتر است. نتایج حاصل از ارزیابی بردارهای کلمه صریح بدست آمده با بردارهای پایه اول نشان می دهد که با وجود کاهش ابعاد بردارهای کلمه از 5000 به 1511، ضریب همبستگی اسپیرمن بر روی مجموعه های آزمون MEN، RG-65 و SimLex-999 به ترتیب به میزان 2.47%، 7.39% و 0.52% افزایش می یابد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.