جستجوی مقالات مرتبط با کلیدواژه "روش مبتنی بر داده" در نشریات گروه "ادبیات و زبان ها"
تکرار جستجوی کلیدواژه «روش مبتنی بر داده» در نشریات گروه «علوم انسانی»-
درک زبان محاوره حوزه خاصی از درک زبان طبیعی را شامل میشود که در آن جملات بیانشده توسط کاربر به اندازه جملات زبان نوشتاری تابع دستور زبان نیستند. در این مقاله، سامانه محاوره مبتنی بر متن برای استخراج معنای جملات محاورهای مربوط به حوزه ذخیره بلیت معرفی می شود. در طراحی این سامانه از شیوههای مبتنی بر داده استفاده شده است. معماری آن شامل دو بخش اصلی استخراج متغیرها و انتساب محتملترین برچسبهای معنایی به دنبالهای از کلمات است. برای این کار از الگوی مخفی مارکوف استفاده می شود. برچسبزنی معنایی دنباله کلمات با استفاده از الگوریتم ویتربی صورت میگیرد. بدین منظور، ابتدا پیکرهای از جملات مورد استفاده در حوزه ذخیره بلیت جمعآوری و سپس به هر کلمه یا ترکیبی از کلمات یک برچسب معنایی تخصیص داده می شود. در مرحله آموزش با استفاده از پیکره برچسبخورده، دنباله برچسبهای ممکن برای توالی کلمات مختلف یاد گرفته میشود. در مرحله آزمون با استفاده از احتمالات استخراجشده از مرحله آموزش، محتملترین برچسب معنایی برای هر کلمه یا ترکیبی از کلمات پیدا میشود. بر اساس آزمایشهای انجامشده، دقت سامانه پیشنهادی در تشخیص سه برچسب کلیدی مبدا، مقصد و تاریخ 91 درصد است.
کلید واژگان: درک معنا, سامانه محاوره ای, روش مبتنی بر داده, الگوی مخفی مارکوف, الگوریتم ویتربیSpoken language understanding is considered as a specific domain of natural language understanding in which the uttered sentences are not as well-formed as written sentences. In the present paper, a text-based system of spoken language understanding is introduced for ticket reservation domain. This system is developed according to the datadriven approach and its architecture includes two main parts: first, extracting parameters of the model and second, assigning the most likely semantic tags to the sequence of words. "Hidden Markov Model" and "Viterbi" algorithm are applied in order to train the parameters and to tag the sequence of words. For this purpose, a corpus of commonly-used sentences in ticket reservation domain is collected and a specific tag is assigned to each word or a combination of words. In the training step, by using the tagged corpus, a sequence of possible tags is learned for a sequence of various words and in the testing step the most likely tag is assigned to a word or a combination of words according to the probabilities calculated in the previous step. Evaluation of the accuracy of system in recognizing the three key tags of departure, arrival and date is 91%.
Keywords: natural language understanding, spoken dialogue system, data, driven approach, Hidden Markov Model, Viterbi algorithm
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.