شباهت یابی بین زبانی جملات فارسی-انگلیسی با استفاده از یادگیری عمیق

نویسنده:

محمد عبدوس ، بهروز مینایی بیدگلی*

پیام:

نوع مقاله:

مقاله پژوهشی/اصیل (دارای رتبه معتبر)

چکیده:

شباهت یابی معنایی متون یکی از زیرشاخه های پردازش زبان طبیعی محسوب می شود که در چند سال اخیر تحقیقات گسترده ای را به خود معطوف کرده است. سنجش تشابه معنایی بین کلمات یا اصطلاحات، جملات، پاراگراف و اسناد، نقش مهمی در پردازش زبان طبیعی و زبان شناسی رایانشی ایفا می کند. شباهت یابی معنایی متون در سامانه های پرسش و پاسخ، کشف تقلب، ترجمه ماشینی، بازیابی اطلاعات و نظیر آن کاربرد دارد. منظور از شباهت یابی معنایی، محاسبه میزان شباهت معنایی بین دو سند متنی، پاراگراف یا جمله می باشد که به دو صورت تک زبانه و چندزبانه مطرح است. در این مقاله با استفاد از پیکره موازی میزان، برای اولین بار مدل بین زبانی شباهت معنایی جملات فارسی-انگلیسی را ارایه داده و در ادامه مدل خود را با مدل برت چندزبانه مورد آزمون و مقایسه قرار دادیم. نتایج حاکی از آن است که با استفاده از پیکره های موازی می توان کیفیت تعبیه جملات را در دو زبان مختلف بهبود بخشید. در روش پیشنهادی، معیار همبستگی پیرسون بر اساس شباهت کسینوسی بین بردارهای معنایی حاصل از برت چندزبانه از 65 درصد به 73.77 درصد افزایش یافته است. روش پیشنهادی بر جفت زبان عربی-انگلیسی نیز مورد آزمون قرار گرفت که نتایج حاصله بیانگر برتری روش پیشنهادی نسبت به برت چند زبانه است.

کلیدواژگان:

پردازش زبان طبیعی ، شباهت معنایی ، بین زبانی ، یادگیری عمیق

زبان:

فارسی

انتشار در:

مجله رایانش نرم و فناوری اطلاعات، سال یازدهم شماره 1 (بهار 1401)

صفحات:

18 تا 31

لینک کوتاه:

magiran.com/p2450093

دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:

اشتراک شخصی

با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!

اشتراک سازمانی

به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!

اطلاعات بیشتر

توجه!

حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.

In order to view content subscription is required

Personal subscription

Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.

Organization subscription

Please contact us to subscribe your university or library for unlimited access!

More information

علمی مصوب

مجله رایانش نرم و فناوری اطلاعات

Journal of Soft Computing and Information Technology

فصلنامه فنی مهندسی به زبان فارسی و انگلیسی

آخرین شماره | آرشیو

ISSN: 2383-1006 eISSN: 2588-4913

صاحب امتیاز:

دانشگاه صنعتی نوشیروانی بابل

سردبیر:

دکتر علی آقاگل زاده

تلفن نشریه: ۰۱۱-۳۵۵۰۱۴۶۰

اطلاعات بیشتر نشریه

درباره نشریه پیام به نشریه سایت اختصاصی نشریه پذیرش الکترونیکی مقاله راهنمای نویسندگان

سامانه نویسندگان

از نویسنده(گان) این مقاله دعوت می‌کنیم در سایت ثبت‌نام کرده و این مقاله را به فهرست مقالات رزومه خود پیوست کنند. راهنما

به جمع مشترکان مگیران بپیوندید!

شباهت یابی بین زبانی جملات فارسی-انگلیسی با استفاده از یادگیری عمیق

محمد عبدوس ، بهروز مینایی بیدگلی*

پردازش زبان طبیعی ، شباهت معنایی ، بین زبانی ، یادگیری عمیق

مجله رایانش نرم و فناوری اطلاعات

Journal of Soft Computing and Information Technology