Application of Computational Linguistics to Predicting Language Proficiency Level of Persian Learners’ Textbooks

Author(s):
Message:
Article Type:
Research/Original Article (دارای رتبه معتبر)
Abstract:

One subfield of assessment of language proficiency is predicting language proficiency level.This research aims at proposing a computational linguistic model to predict language proficiency level and to explore the general properties of the levels. To this end, we collect the data from Persian learners' textbooks and extract statistical and linguistic features from this text corpus to train 3 classifiers as learners. The performance of the model varies based on the learning algorithm and the feature set(s) used for training the model. For evaluating the models, four standard metrics, namely accuracy, precision, recall, and F-measure are used. Based on the results, the model created by the Random Forest classifier performed the best when statistical features extracted from raw text is used. The Support Vector Machine classifier performed the best by using linguistic features extracted from the corpus annotated automatically. This determines that enriching the model and providing various kinds of information do not guarantee that a classifier (learner) performs the best.To discover the latent teaching methodology of the textbooks, we studied the general performance of the classifiers with respect to the language level and the linguistic knowledge used for creating the model. Based on the obtained results, the amount of extracted features plays an important role during to training a classifier. Furthermore, the average best performance of the classifiers is extending the linguistic knowledge from syntactic patterns at level A to all linguistic information at levels B and C.

Language:
English
Published:
Journal of Language Horizons, Volume:6 Issue: 1, Winter and Spring 2022
Pages:
29 to 52
https://www.magiran.com/p2419547  
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با ثبت ایمیلتان و پرداخت حق اشتراک سالانه به مبلغ 1,490,000ريال، بلافاصله متن این مقاله را دریافت کنید.اعتبار دانلود 70 مقاله نیز در حساب کاربری شما لحاظ خواهد شد.

پرداخت حق اشتراک به معنای پذیرش "شرایط خدمات" پایگاه مگیران از سوی شماست.

اگر مقاله ای از شما در مگیران نمایه شده، برای استفاده از اعتبار اهدایی سامانه نویسندگان با ایمیل منتشرشده ثبت نام کنید. ثبت نام

اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!