جستجوی مقالات مرتبط با کلیدواژه "محتوا" در نشریات گروه "برق"
تکرار جستجوی کلیدواژه «محتوا» در نشریات گروه «فنی و مهندسی»جستجوی محتوا در مقالات مجلات علمی
-
با وجود پیشرفت های اخیر در حوزه ترجمه ماشینی، این فناوری قادر به ترجمه دقیق متون نیست و گاهی ممکن است ویرایش خروجی آن زمان بیشتری نسبت به ترجمه دستی بگیرد. با این حال با داشتن تخمینی از کیفیت خروجی، کاربران می توانند به طور مناسبی با ناکامل بودن این فناوری برخورد کنند. برای کاربردهایی که هدف آنها بالابردن کیفیت ترجمه ماشینی است، نظیر ترکیب خروجی سامانه های ترجمه گر مختلف، بازترتیب فهرست چند ترجمه بهتر و بازتولید خروجی، لازم است که بدون داشتن ترجمه مرجع تخمینی از درستی خروجی داشته باشیم. هنوز روش کارامدی برای تخمین درستی کلمات خروجی ترجمه ماشینی وجود ندارد. در این مقاله پنج گروه ویژگی جدید در قالب ویژگی های مبتنی بر محتوا و مبتنی بر ساختار ارائه شده است. نتایج نشان می دهد که ویژگی مبتنی بر محتوا نسبت به بهترین سامانه پایه (2) برتری 9/63 درصدی در CER، 8/5 درصدی در F-measure و 1/ 5 درصدی در F-measure طبقه منفی داشته است. همچنین ترکیب ویژگی های مبتنی بر ساختار ارائه شده، در مقایسه با بهترین سامانه پایه به ترتیب بهبود 59/ 4، 1/ 4 و 2 درصدی در معیارهای CER، F-measure و F-measure طبقه منفی ایجاد کرده است.
کلید واژگان: تخمین اطمینان, ترجمه ماشینی, اطلاعات متقابل, ساختار, محتواMachine translation has been developed over last years. But this technology is still not able to exactly translate texts. Also post-editing the output may takes longer time than the translation process. So having a quality estimation of machine translation output can be very useful. Moreover, Confidence Estimation can be useful for some applications that their goal is to improve machine translation quality such as system combination, regenerating and pruning. But there is not yet any completely satisfactory method for CE task. We propose 5 syntactic and lexico-semantic features that are never used for confidence estimation task. The experimental results show that proposed lexico-semantic feature outperforms the best baseline system (2) by 9.63% in CER, 8.5% in F-measure and 5.1% in negative class F-measure. Moreover the combination of proposed syntactic features outperforms the best baseline system by 4.49% in CER, 4.1% in F-measure and 2% in negative class F-measure.Keywords: confidence estimation, machine translation, mutual information, syntactic, lexico, semantic
نکته
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.