تحلیل پیکره بنیان متون فارسی میانه بر مبنای پایگاه داده پارسیگ
رویکرد نوین در مطالعات زبان شناختی یا یک پدیده زبانی بر اصل وجود مجموعه ای از داده های زبانی گردآوری شده نهادینه شده است؛ بنابراین به تهیه یک پیکره زبانی نیاز است که از تولیدات واقعی گویشوران و نه براساس شم زبانی فردی گردآوری شدهاست. این شیوه پژوهشی برای بررسی داده های زبانی تاریخی که جزء زبان های مرده است و اکنون هیچگونه گویشوری ندارد از اهمیت به سزایی برخوردار است. هدف از انجام این پژوهش، تهیه پیکره زبان پهلوی ساسانی (فارسی میانه) و ساماندهی آن در یک پایگاه است. برای هر واژه، شش لایه اطلاعاتی، اعم از حرف نویسی متن پهلوی، آوانویسی واژه ها به همراه ترجمه فارسی آنها، تعیین مقوله دستوری دانهریز واژه ها، بن واژه سازی واژه ها و تعیین هزوارش بودن آنها، تعریف شده است. برای مقوله دستوری دانه ریز واژه ها، مجموعه برچسب مقولات دستوری فارسی معاصر تهیه شده توسط بیجنخان و همکاران (2011) و ساختارمندشده توسط قیومی (2014) باتوجه به نیازهای زبان پهلوی جرح و تعدیل شده است و از مجموعه جدید برای برچسب گذاری واژه های پهلوی استفاده شده است. پس از نشانه گذاری واژهها و ساماندهی اطلاعات، امکان استخراج اطلاعات آماری وجود دارد که میتواند بینش عمیقتری از محتوای متن منتقل نماید. ازاین رو، اطلاعات آماری از پیکره به دست آمده استخراج شده و توضیح داده می شود تا دورنمای کلی نسبت به منابع تشکیل دهنده این پیکره به دست آید.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.