ارائه روشی جدید برای تعبیه اسناد برای دسته بندی متون خبری
یکی از کاربردهای مهم در پردازش زبان طبیعی، دسته بندی متون است. برای دسته بندی متون خبری باید ابتدا آنها را به شیوه مناسبی بازنمایی کرد. روش های مختلفی برای بازنمایی متن وجود دارد ولی بیشتر آنها روش هایی همه منظوره هستند و فقط از اطلاعات هم رخدادی محلی و مرتبه اول کلمات برای بازنمایی استفاده می نمایند. در این مقاله روشی بی ناظر برای بازنمایی متون خبری ارایه شده است که از اطلاعات هم رخدادی سراسری و اطلاعات موضوعی برای بازنمایی اسناد استفاده می نماید. اطلاعات موضوعی علاوه بر اینکه بازنمایی انتزاعی تری از متن ارایه می دهد حاوی اطلاعات هم رخدادی های مراتب بالاتر نیز هست. اطلاعات هم رخدادی سراسری و موضوعی مکمل یکدیگرند. بنابراین در این مقاله به منظور تولید بازنمایی غنی تری برای دسته بندی متن، هر دو بکارگرفته شده اند. روش پیشنهادی بر روی پیکره های R8 و 20-Newsgruops که از پیکره های شناخته شده برای دسته بندی متون هستند آزمایش شده و با روش های مختلفی مقایسه گردید. در مقایسه با روش پیشنهادی با سایر روش ها افزایش دقتی به میزان افزایش 3% مشاهده گردید.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.