به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت

جستجوی مقالات مرتبط با کلیدواژه « پیکره » در نشریات گروه « ادبیات و زبان ها »

تکرار جستجوی کلیدواژه «پیکره» در نشریات گروه «علوم انسانی»
  • الهه اسحاقی*، بلقیس روشن

    چند معنایی از جمله مسایلی است که، برحسب سنت مطالعات زبان شناختی،در بخش معنایی دستور و به عنوان موضوعی در بررسی هایمعنی شناختی قابل طرح است. در شرایطی که یک واحد زبانی چند معنی پیدا میکند، از حوزه های مهم بررسی چندمعنایی در رویکرد شناختی، مطالعه افعال حسی است که مربوط به عملکرد حواس پنجگانه اند. پژوهش حاضر بارویکرد معناشناسی شناختی با روش توصیفی - تحلیلی، تحلیلی بر چندمعنایی فعل »بوییدن« به عنوان یکی از افعال حسی در زبان فارسی بر مبنای داده های پیکرهای و سایت گنجوربراساس الگوی لیکاف (1987) ارایه میدهد. در این مرحله (202) جمله از پایگاه دادگان زبان فارسی استفاده شد که برمبنای معانی بسط یافته دسته بندی شدند. از انجا که افعال حسی حاصل تجارب فیزیکی و اجتماعی است، پایهای میشود برای درک ما از مفاهیم انتزاعی. به همین جهت ما شاهد مفاهیم گسترده فعل »بوییدن« هستیم و این شبکه معنایی میتواند در آموزش زبان فارسی به غیر فارسی زبانان کاربرد داشته باشد.

    کلید واژگان: معناشناسی شناختی, چندمعنایی, افعال حسی, فعل حسی», بوییدن«_ پیکره}
    Elahe Eshaghie *, Belghis Rovshan

    Multiple meanings are among the issues that, according to the tradition of linguistic studies, can be proposed in the semantic section of grammar and as a topic in semantic studies. In the situation where a linguistic unit finds multiple meanings, one of the important areas of investigating multiple meanings in the cognitive approach is the study of sensory verbs that are related to the functioning of the five senses.The current study presents the cognitive semantics approach with descriptive-analytical method, an analysis on the polysemy of the verb "smell" as one of the sensory verbs in Persian based on the data of the bodies and site of Ganjur based on the model of Likaf (1987).At this stage, 202 sentences were used from the Persian language database, which were categorized based on expanded meanings. Since sensory verbs are the result of physical and social experiences, they become the basis for our understanding of abstract concepts.For this reason, we see the broad concepts of the verb "smell" and this semantic network can be used in teaching Persian to non-Persian speakers

    Keywords: cognitive semantics, polysemy, sensory verbs, sensory verb, smell, corpus}
  • زیناییدا آندره یونا خاریتانچیک *

    در این مقاله در نتیجه تجزیه و تحلیل معنای اسامی گروه های واژگانی - معنایی در زبان روسی م عاصر (اسامی افراد از نظر خویشاوندی، شغل، اسامی نظامی، حیوانات خانگی و وحشی و غیره) نتیجه گیری می شود. بر این اساس معنای واحدهای معنایی به توصیف آنها در فرهنگ ها که بر اساس پرکاربردترین معانی وابسته به متن آنها استوار شده اند، محدود نمی شود، بلکه تعداد قابل توجهی از ویژگی هایی (دریافتی، رفتاری، مکانی و غیره)را دارند که نماینده ماهیت آنها هستند و در منابع فرهنگ نویسی ثبت نشده اند. این معانی در تعداد زیادی بافت مربوط که از پیکره ملی زبان روسی و دیگر پیکره های زبان روسی استخراج شده اند، تجلی پیدا کرده اند و یک مجموعه بالقوه و باز از واحدهای واژگانی تشکیل می دهند. این مجموعه، پایه داده ای زبان روسی را به عنوان غنی ترین گنجینه دانش و اعتقادات درباره دنیای اطراف تشکیل می دهند.

    کلید واژگان: واحد واژگانی, معنا, پتانسیل معنایی, عبارت, پیکره, ساختار مفهومی}
    Харитончик Зинаида Андреевна *

    В статье в результате анализа семантики наименований разных лексико- семантических групп в современном русском языке (названий лиц по родству или профессии, воинских званий, домашних и диких животных и др.) делается вывод о том, что семантика лексических единиц не ограничивается их словарными дескрипциями, основанными на наиболее часто актуализируемых контекстуально обусловленных значениях, но содержит огромный реестр свойств (перцептивных, поведенческих, локативных и т.д.) репрезентируемых ими сущностей, не регистрируемый в лексикографических источниках. Они эксплицируются в многочисленных соответствующих контекстах, извлеченных из Национального и других корпусов русского языка, и составляют открытый по своему характеру семантический потенциал лексических единиц, формирующий информационную базу русского языка как богатейшей сокровищницы знаний и верований об окружающем мире.

    Keywords: Лексическая Единица, Значение, Семантический Потенциал, Высказывание, Корпус, Концептуальная Структура}
  • آزاده میرزائی*، فاطمه صدقی
    این مقاله از نحوه شکل گیری پیکره «چکیده های مقالات و پایان نامه های دانشگاهی دانشگاه علامه طباطبایی» و همچنین از ویژگی ها و امکانات آن می گوید. داده های این پیکره شامل ده هزار چکیده پایان نامه و 9538 چکیده مقاله (برگرفته از نشریات علمی دانشگاه علامه طباطبایی) با حجمی در حدود سه و نیم میلیون موردواژه است که در قالب طرح پژوهشی گردآوری شده اند. اهمیت داده های این پیکره یعنی چکیده های دانشگاهی از آن جهت است که این نوع داده ها به عنوان متون تالیفی فشرده و با محتوای علمی می توانند تصویرگر ویژگی های خاص زبان علم به عنوان گونه ای از زبان باشند. در این نوشتار برای بیان اهمیت دسترسی به چنین داده هایی و به جهت بررسی امکانات پیکره، محتوای واژه ای بخشی از داده با توجه به مفهوم کلیدی بودگی و فهرست چندپشته ها مورد بررسی قرار گرفت. بررسی ها نشان داد محتوای واژگانی این پیکره می تواند پژوهشگران را به سوی طرح برخی فرضیه ها سوق دهد. همچنین بررسی چندپشته های داده های علمی نشان داد که زبان علم دارای توالی های واژه ای مشخصی است که می تواند تصویرگر نوع خاصی از زبان باشد.
    کلید واژگان: پیکره, زبان علم, کلیدی بودگی, چندپشته, زبان فارسی}
    Azadeh Mirzaei *, Fatemeh Sedghi
    This study explains how to develop the corpus of “ATU Papers, Theses and Dissertations Abstracts” and introduces the different characteristics and features of the corpus. The corpus contains ten thousand thesis abstracts and 9538 article abstracts from the scientific journals of Allameh Tabatabai University with a volume of more than three and a half million tokens. Academic abstracts as brief authored texts with scientific content can depict special linguistic features and therefore, they are valuable documents. In this article, to express the importance of access to such data and to examine some features of the corpus, the word content of a part of the data has been examined and presented according to the concept of keyness and n-grams. The results showed that the lexical content of this corpus could lead researchers to propose some hypotheses. Also, the exploring n-grams of this corpus showed that the language of science has specific word clusters that can depict a particular type of language.
    Keywords: corpus, Language of Science, keyness, N-gram, Persian language}
  • الناز رنجبری، ارسلان گلفام*، مهناز کربلایی صادق
    نشانگرهای گفتمان، عناصر زبانی هستند که درباره ماهیت و همچنین نقش و کارکرد آن ها، بین زبان شناسان اختلاف نظر وجود دارد. هدف پژوهش حاضر، بررسی کارکرد نشانگرهای گفتمان در زبان فارسی به عنوان عناصری ارجاعی بر اساس دیدگاه فریزر است. بدین منظور، پیکره ای از دو نوع متن سیاسی و اقتصادی انتخاب شد. باتوجه به شمارگان چاپ و قدمت، برای متن سیاسی، شانزده سرمقاله روزنامه کیهان و برای متن اقتصادی، پانزده سرمقاله روزنامه دنیای اقتصاد بررسی شد که نشانگرهای گفتمان در چهار طبقه نشانگرهای تقابلی، تفصیلی، استنتاجی و زمانی قرار گرفتند. تحلیل داده ها نشان داد در زبان فارسی، فرمول ارایه شده توسط فریزر درباره توالی جمله هایی که با نشانگرها به هم مرتبط می شوند، اندکی متفاوت است و باید آن را به صورت S2+DM .S1 یا S1.S2+DM بازنویسی کرد. همچنین بر اساس اهمیت اطلاعاتی که در جملات پیش و پس از نشانگرها وجود دارد، می توان آن ها را به انواع پیش مرجع (نشانگرهای که پس از پیام اصلی قرار می گیرند)، پس مرجع (نشانگرهای که پیش از پیام اصلی قرار می گیرند) و مرجع مشترک (نشانگرهای که بین دو پیام اصلی قرار می گیرند) تقسیم بندی کرد. در زبان فارسی، تحلیل داده ها نشان داد که از نظر ارجاع دهی، نشانگرهای تقابلی و تفصیلی از نوع مرجع مشترک محسوب می شوند و نشانگرهای استنتاجی و زمانی از نوع پس مرجع هستند. یافته های پژوهش بیان می کند که نشانگرهای گفتمان می توانند نقش و کارکردی ارجاعی در ساخت اطلاع داشته باشند.
    کلید واژگان: نشانگر گفتمان, ارجاع, ساخت اطلاع, پیکره}
    Elnaz Ranjbari, Arsalan Golfam *, Mahnaz Karbalaei Sadegh
    Discourse markers are language elements that linguists do not have a consensus about their nature as well as their role and function. The present study aimed to investigate the function of Persian discourse markers as reference elements, based on Fraser's (1999, 2006) approach. For this purpose, a corpus of two types of political and economic texts was selected. Taking print run and history into consideration, 16 editorials of Kayhan newspaper for political texts and 15 editorials of Donya-e-Eqtesad newspaper for economic texts were analyzed, and the discourse markers were classified into four categories: contrastive, elaborative, inferential and temporal. Data analysis showed that the formula presented by Fraser (1999, 2006), for the sequence of sentences connected by discourse markers, is slightly different in Persian and should be rewritten as S2+DM.S1 /S1.S2 + DM. Furthermore, based on the importance of the information contained in the sentences preceding and succeeding the markers, they can be divided into cataphoric marking (markers placed after the main message), anaphoric marking (markers placed before the main message), and joint marking (markers placed between two main messages). Data analysis indicated that contrastive and elaborative markers are considered as joint marking, and inferential and temporal markers are anaphoric marking in Persian. Based on the research findings, it can be concluded that discourse markers can have a referencing function in information structure.
    Keywords: discourse marker, reference, information structure, corpus}
  • محمد حسن زاده*، حدیث تمله

    پژوهش های مرتبط با دسته های واژگانی اخیرا در راس مطالعات پیکره ای قرار گرفته اند. پژوهش های پیشین پیکره ای در پیوند با بررسی  دسته های واژگانی در نوشتار نویسندگان انگلیسی زبان، گاه به نتایج متناقضی درباره فراوانی و تقسیم بندی کارکرد این توالی ها دست یافته اند. با این حال، هیچ مطالعه ای تا به امروز، به بررسی دسته های واژگانی در بخش «بحث» مقالاتی که صرفا نویسندگان انگلیسی زبان به نگارش درآورده اند، نپرداخته است. پژوهش کنونی با بررسی فراوانی، ساختار و کارکرد توالی های واژگانی چهارکلمه ای تلاش کرده تا این شکاف را برطرف کند. داده مورد بررسی در این پژوهش از بخش «بحث» مقالات نویسندگان انگلیسی زبان به دست آمد. تمامی این مقالات از پنج مجله ممتاز بین المللی در رشته زبان شناسی کاربردی استخراج گردید. درنهایت، پیکره ای متشکل از بیش از سیصد هزار واژه گردآوری شد. با بهره گیری از نرم افزار  AntConc همه دسته های چهارکلمه ای، با فراوانی ده و دامنه پنج استخراج شد. یافته های به دست آمده نشان داد که دسته های واژگانی در پیکره بررسی شده فراوانی بالایی داشتند. در رابطه با تقسیم بندی ساختاری دسته های واژگانی، نتایج حاکی از آن بود که دسته های عبارتی فراوانی بیشتری نسبت به دسته های ساختاری داشته اند. همچنین، یافته ها نشان داد که به لحاظ کارکرد از دسته های ارجاعی به وفور بهره گیری شده است. افزون بر این، دسته های حالتی و گفتمان پردازها  پس از دسته های ارجاعی، به ترتیب بیشترین فراوانی را داشتند. در پایان آموزه های این پژوهش برای نویسندگان غیر انگلیسی زبان و دوره های تحصیلات تکمیلی دانشگاه ها در پیوند با بکارگیری دسته های واژگانی در نگارش دانشگاهی بیان شده است.

    کلید واژگان: دسته های واژگانی, پیکره, بحث, نگارش دانشگاهی, نویسندگان انگلیسی زبان}
    Mohammad Hassanzadeh*, Hadis Tamleh

    Lexical bundle research has recently come to the forefront of corpus-driven studies. Previous corpus studies have documented conflicting results regarding the frequency and function of lexical bundles (LBs) in academic prose. To date, however, no study has exclusively investigated LBs in the "discussion" sections of research articles generated by professional native English authors. The current study addressed this gap by examining the frequency, structure, and function of the most frequent four-word LBs. The corpus was composed of the discussions of published research papers authored by native (L1) writers. The data were extracted from five reputable international journals in the field of applied linguistics, consisting of over 300,000 words. Using AntConc, all the lexical sequences were retrieved with a frequency of 10 and a range of 5. The results revealed that LBs were predominantly used by English writers. Structurally, it was found that phrasal bundles were the most frequent in our corpus. Findings also demonstrated that functionally, referential bundles were extensively employed. In addition, stance bundles and discourse organizing bundles were the most prevalent after referential bundles. Finally, the findings are discussed in terms of the implications for non-native writers regarding the use of LBs in academic prose.

    Keywords: Corpus, Discussion, Lexical bundles, Native-English writers, AntConc}
  • فاطمه نایب لوئی*، سید مصطفی عاصی، آزیتا افراشی، مسعود قیومی
    تمایزات واژگانی میان زبان ها، بیانگر تفاوت در فرهنگ های مرتبط با هر زبان است. واژه های چندمعنا در هر فرهنگ، می تواند نمودی از این قبیل تمایزات واژگانی در یک زبان باشد. در معناشناسی شناختی، رویکردهای مختلفی به پدیده چندمعنایی در زبان وجود دارد؛ نظریه معناشناسی قالبی یکی از این رویکردها در معناشناسی شناختی است که به مسیله چندمعنایی، از منظر قالب های معنایی نگریسته است. صورت تکامل یافته این نظریه، در شبکه معنایی فریم نت، تحقق پیدا کرده است. قالب های معنایی بسته هایی معنایی هستند و هرکدام از قالب ها از برخی مولفه های معنایی تشکیل شده اند. روابط معنایی در این شبکه، به صورت روابط میان قالبی ارایه شده است. در این مقاله، سعی بر آن است تا تحلیلی معنایی و پیکره بنیاد از چندمعنایی افعال «شنیدن» و «گوش دادن» در زبان فارسی، بر مبنای اصول شبکه فریم نت در زبان انگلیسی، ارایه شود. براین اساس، دو کلیدواژه مذکور، در پیکره های موجود در پایگاه داده زبان فارسی، بررسی شدند و از میان مفاهیم موجود در جملات شاهد، هفت قالب معنایی «حس فعال»، «ادراک حسی»، «جستجو»، «آگاهی»، «فهمیدن»، «اطاعت» و «توجه» و سه رابطه میان قالبی «توارث» میان قالب والد «ادراک» و فرزند «حس فعال» و قالب والد «ادراک» و فرزند «ادراک حسی» و قالب والد «آگاهی» و فرزند «فهمیدن»، یک رابطه میان قالبی «کاربرد» میان قالب والد «توجه» و فرزند «حس فعال» و یک رابطه میان قالبی «بیشتر» میان قالب های «حس فعال» و «ادراک حسی» استخراج شد. نتایج تحلیل های انجام شده نشان می دهد که رویکرد حاضر به پدیده چندمعنایی، رویکردی کارآمد برای بررسی چندمعنایی افعال «شنیدن» و «گوش دادن» در زبان فارسی است.
    کلید واژگان: افعال «شنیدن» و «گوش دادن», پیکره, معناشناسی شناختی, شبکه معنایی فریم نت, نظریه معناشناسی قالبی}
    Fateme Nayeblui *, Mostafa Assi, Azita Afrashi, Masood Ghayoomi
    Vocabulary differences between languages indicate differences in the cultures associated with each language. Polysemous words in any culture can be an expression of such lexical differences in a language. In cognitive semantics, there are different approaches to the polysemous phenomenon in language; The theory of Frame semantics is one of these approaches in cognitive semantics that has looked at the issue of polysemy from the perspective of semantic frames. The revised form of this theory has been realized in FrameNet . Semantic frames are semantic packages and each frame is composed of semantic components called frame elements. Semantic relationships in this network are presented as relationships between semantic frames. In this article, an attempt is made to provide a semantic and corpus-based analysis of the polysemy of the conceptual domain of the verb "Listening" in Persian based on the principles of the FrameNet network in English. Accordingly, the keywords "šeno", " šenid" and "guš" have been studied in the Persian database . Among the concepts found in sentences extracted from the corpus, six semantic frames of Perception_active, Perception_experience, Awareness, Compliance, Seeking and Attention and two "inheritance" Frame to frame relations between "Perception-Active" and "Perception-Experience" Frames and "use" Frame to frame relations between "Attention" and Perception-Active" Frames were extracted. The results of the analysis show that the current approach to the phenomenon of polysemy is an efficient approach to study the meaning of the verb "Listening" in Persian and can provide a picture of Persian language culture in this conceptual area.
    Keywords: cognitive semantics, corpus, English FrameNet, hearing, listening, Theory of Frame Semantics}
  • غلامحسین کریمی دوستان، آرزو رازانی*
    تحلیل الگوهای پیکره ای، روشی برای بررسی معنا و قالب افعال در زبان است که در بررسی زبان های گوناگونی مانند انگلیسی، اسپانیایی و ایتالیایی به کار رفته است. از آن جایی که در زبان فارسی از ساخت افعال سبک، استفاده گسترده ای می شود، در پژوهش حاضر کاربرد این روش در زبان فارسی و در مورد فعل «زدن»- یکی از پربسامدترین فعل های سبک زبان فارسی- مورد بررسی قرار گرفته است. از این رو، با استفاده از داده های مستخرج از پیکره زبان فارسی بیجن خان، در مرحله نخست، فهرستی از پایه هایی که همراه فعل سبک «زدن» به کار می روند، در پیکره تهیه گردید. سپس، روش تحلیل الگوهای پیکره ای بر روی این پایه ها به کار برده شد. با استفاده از 600 کاربرد ساختاری متفاوت و در حدود 500 معنای مختص به آن ها، چهار کاربرد برای فعل زدن از یک دیگر تمیز داده شد. در نتیجه در این مقاله، افزون بر کاربرد «زدن» به عنوان فعل سنگین و فعل سبک، دو کاربرد جدید در داده های به دست آمده از پیکره زبانی معرفی می گردد: نخست، [نوع معنایی] + فعل سبک «زدن»؛ و دوم، عبارت فعلی حاوی فعل سبک «زدن» که یک چارچوب معنایی را تشکیل می دهد و با افزوده شدن یک جزء معنایی متغیر، که معمولا یک صفت است، معنای آن کامل می شود.
    کلید واژگان: تحلیل الگوهای پیکره ای, فعل سبک, پیکره, زبان فارسی}
    Gholamhossein Karimi Doostan, Arezoo Razani *
    With the advent of huge corpora in recent decades, there has appeared a tendency among researchers to utilize them in lexicography. According to Miller (2018), a major issue involved in Persian lexicography is the presence of light verbs. The present study sought to address the issue using corpora and methods of computational lexicography.A light verb is in fact a complex predicate composed of two or more predicate elements: a semantic light verb and a second component (including a noun, an adjective, or a prepositional phrase). In Persian, there are 150 to 200 full verbs, and other verb-related ideas are expressed by light verbs, which explains why they are of such great significance in the language. Light verbs have been investigated from different aspects including compoundability, separability, and syntactic structure. The present function-oriented research, however, was based exclusively on data extracted from a corpus.
    Keywords: corpus, Corpus Pattern Analysis (CPA), light verbs, Meaning, Persian}
  • فریبا صبوری، محمد راسخ مهند، سالومه غلامی

    نقش اصلی گفتمان نما برقراری ارتباط میان کلام و موقعیت گفتمان، یعنی تعامل بین گوینده و شنونده، بیان نگرش گوینده و سازمان دهی متن است. مقاله حاضر به واکاوی نقش های مختلف نقش نمای گفتمانی «دیه» (در فارسی «دیگر») در گویش همدانی می پردازد. برای نیل به این هدف، از حدود 6 ساعت فایل صوتی و تصویری از پیکره گویش همدانی استفاده شده است. این نقش نما در گویش همدانی بسامد بالایی دارد و چندنقشی است. نتایج حاصل از این بررسی نشان می دهد که این گفتمان نما در کارکرد بینافردی، نقش هایی چون بیان نگرش، تاکید، درخواست تایید و پاسخ غیرمستقیم (طفره رفتن یا ارجاع به دانش مشترک میان گوینده و شنونده) را ایفا می کند. و در کارکرد متنی، به حفظ یا دادن نوبت، نشان دادن توالی یک رویداد، پایان دادن به یک موضوع یا به بیان توضیح، توجیه، تضاد یا نتیجه در رابطه با گزاره پیشین یا بعدی کمک می کند. بررسی آهنگ کلام با استفاده از نرم افزار Praat، نشان می دهد این گفتمان نما بسته به نقش های متفاوت، الگوی آهنگی متفاوتی دارد.

    کلید واژگان: دیگر, گفتمان نما, گویش همدانی, پیکره, تحلیل گفتمان}
    Fariba Sabouri, Mohammad Rasekh Mahand, Saloumeh Gholami

    The main function of discourse markers is to make connections between the discourse and the discourse situation, thus managing the interaction between speaker and listener, expressing the speaker's attitude, and organising the flow of discourse. In this research, different functions of the pragmatic marker diye in the Hamedani dialect were examined. To achieve this goal, around six hours of audio and video files of the Hamedani dialect corpus were used. Diye is a high-frequency pragmatic marker in the Hamedani dialect and has several functions. For example, our results show that this pragmatic marker is used for interpersonal functions such as expression of attitudes, emphasis, and confirmation-seeking, as well as for indirect responses (in order to evade the subject and appeal to shared knowledge between speaker and listener). In terms of textual function, it helps to keep or relinquish the floor, show a sequence of events, or end a topic, or to express an explanation, justification, contradiction, addition, or conclusion in relation to a previous or subsequent proposition. Examining the intonation of diye with Praat software shows that the intonation pattern of this pragmatic marker varies, depending on its particular function.

    Keywords: pragmatic marker, Hamedani dialect, Diye, corpus, discourse analysis}
  • الهام علایی ابوذر*، نصرالله پاک نیت، علی اصغر حجت پناه، مجتبی زالی، محمدهادی آقالویی آغمیونی

    بسیاری از پژوهش های زبان شناسی و برنامه ریزی های زبانی با استفاده از پیکره های زبانی انجام می شود. در این پژوهش پیکره ای با استفاده از متون مقاله های پژوهش نامه پردازش و مدیریت اطلاعات ساخته شده است. این پیکره شامل بیش از 600 مقاله (بیش از چهار میلیون واژه) است. موضوع این مقاله ها کتابداری و اطلاع رسانی، علم اطلاعات و دانش شناسی، فناوری اطلاعات، زبان شناسی، زبان شناسی رایانشی، اصطلاح شناسی، هستان شناسی و سایر حوزه های پردازش اطلاعات است. متون مقاله ها تخصصی و میان رشته ای است و برای پردازش هایی که مستلزم بهره گیری از متون تخصصی است، ارزشمند است. برای ساخت پیکره پس از نمونه گیری و وارد کردن داده ها در پیکره، فراداده مقاله ها وارد پیکره شد. سپس نرمال سازی ماشینی و به دنبال آن برچسب گذاری ماشینی (نوعا برچسب گذاری اجزای واژگانی کلام) انجام شد. در نهایت تعداد قابل توجهی از فایل های برچسب خورده در پیکره به صورت رندوم انتخاب شد و الگوهای زبانی برای اصلاح ماشینی و دستی برچسب ها استخراج و در پیکره به کار برده شد.

    کلید واژگان: پیکره, نرمال سازی, برچسب گذاری اجزای واژگانی کلام}
    Elham Alayiaboozar *, Nasrollah Pakniat, Aliasghar Hojjatpanah, Mojtaba Zali, Mohammadhadi Aghalouyaghmiyouni

    Numerous linguistic studies as well as language planning involves the use of corpus to analyze different aspects of language. In present study a corpus was built from published articles of the journal of information processing and management. The corpus include more than 600 articles and 4000000 words. The articles cover hot topics including information science, information technology,, linguistics, computational linguistics, terminology, ontology and the like; so, actually the corpus is the specialized one which could be considered as a prerequisite for specific language processing. After sampling, in present study, data as well as metadata was inserted to corpus, Then, normalization and POS tagging were done via available software and finally some files were randomly chosen for checking their POS tags which led to extracting some rules for correcting wrong tags. Then the rules were applied to corpus.

    Keywords: corpus, normalization, Part Of Speech (POS) tagging}
  • نویسندگان غیرانگلیسی زبان که به دنبال انتشار نتایج مطالعات علمی خود در مجلات بین المللی هستند به دلیل عدم آشنایی با قراردادهای حاکم بر ژانر مقالات تحقیقاتی ممکن است با چالش هایی مواجه گردند. مطالعه حاضر با دو هدف صورت گرفته است: (الف) شناسایی راهبرد ها و مراحلی که قسمت بحث مقالات روانشناسی را تشکیل می دهند و (ب) بررسی تفاوت های بین راهبرد ها و مراحل به کار رفته در مقالات روانشناسی که توسط نویسندگان انگلیسی زبان و نویسندگان ایرانی به زبان انگلیسی نگارش شده اند. جهت حصول این اهداف، یک پیکره انگلیسی و یک پیکره ایرانی هر یک با پنجاه مقاله انگلیسی روانشناسی شکل گرفت. پیکره انگلیسی متشکل از مقالات نگارش یافته توسط نویسندگان انگلیسی زبان بود و پیکره ایرانی از مقالات نوشته شده توسط نویسندگان ایرانی تشکیل می شد. مدلل بکار رفته در مقاله حاضر مدل سویلز بود. داده ها هم به صورت کمی و هم به صورت کیفی مورد تحلیل قرار گرفتند. برای تحلیل داده های کمی از آزمون خی دو استفاده شد و داده های کیفی به صورت محتوایی مورد بررسی قرار گرفتند. بر اساس تحلیل ژانر محور صد مقاله  که معرف پنج زیر شاخه اصلی رشته روانشناسی بودند (بالینی، شناختی، رشد، تربیتی، و اجتماعی)، یک مدل "راهبرد-مرحله" جدید با شش راهبرد و ده مرحله برای قسمت بحث مقالات روانشناسی پیشنهاد شد. نتایج تحقیق حاکی از وجود تفاوت های آماری معنادار بین نویسندگان انگلیسی زبان و نویسندگان ایرانی در خصوص به کارگیری یک راهبرد و تعدادی از مراحل بود. برخلاف نویسندگان انگلیسی زبان، نویسندگان ایرانی اغلب قادر به استفاده از تمامی مراحل جهت آشکارسازی عملکرد کلی یک راهبرد خاص نبودند. تحقیق حاضر با بیان تعدادی از پیامدهای نظری و آموزشی برای فراگیران رشته روانشناسی که از انگلیسی برای اهداف آکادمیک استفاده می کنند و متخصصان انگلیسی برای اهداف ویژه که به تدریس دوره های انگلیسی برای اهداف آکادمیک مشغولند، به پایان می رسد.

    کلید واژگان: پیکره, نویسندگان انگلیسی زبان, تحلیل ژانر محور, نویسندگان ایرانی, راهبرد}
    Zeinab Ariarid, Rajab Esfandiari *

    Nonnative English speaking (NNES) writers seeking to publish the results of their studies in international English-medium journals may find it challenging because of unfamiliarity with the genre conventions of research articles (RAs). The goal of the present study was twofold: (a) to identify the moves and steps characterizing the discussion section of RAs and (b) to investigate the differences in the use of moves and steps employed by English Writers (EWs) and Iranian Writers (IWs). To these ends, an English Corpus (EC) composed of 50 RAs written by EWs, and an Iranian Corpus (IC), including 50 RAs written by IWs were developed. Drawing on Swales’ moves analysis, this genre-based study used corpus data for genre analysis. The data were quantitatively and qualitatively analyzed. A series of one-way chi-square procedures was used to analyze the frequency data quantitatively. For qualitative analysis, corpus data were content analyzed to identify moves and steps. A list of moves and steps, including six moves and 10 steps of the discussion section of RAs was proposed based on the analysis of 100 English RAs representing five core subfields. The results showed statistically significant differences in using one of the moves and several steps between EWs and IWs. Unlike EWs, IWs mostly failed to use all steps to linguistically textualize and manifest the overall function of a particular move. The study concludes with some implications for English for specific purposes (ESP) practitioners.

    Keywords: Corpus, English Writers, Genre-Based Investigation, Iranian Writers, move}
  • عطیه کامیابی گل*، الهام اخلاقی باقوجری، هانیه حبیبی

    پیکره شامل متن های پیوسته طبیعی است که به صورت الکترونیکی ارایه شده است و می‏توان از آن اطلاعات درباره عناصر زبانی، به صورت واژگانی و غیرواژگانی در کم ترین زمان ممکن و با بالاترین میزان دقت، استخراج نمود. نویسندگان این مقاله، پیکره زبانی آکادمیک فردوسی را ایجاد کرده و هدف از این مقاله معرفی پیکره اعضای هیات علمی دانشگاه فردوسی مشهد و به کارگیری آن در تحلیل و توصیف عبارات احتیاط آ میز در دو حوزه علومانسانی و علومپایه است. عبارات احتیاط آمیز میزان قطعیت کلام نویسنده را با کلماتی مانند «شاید»، «ممکن است» و «حتما» مشخص می کند. پژوهش هایی که تاکنون بر روی این عبارات انجام شده است، با داده هایی اندک و به صورت کاملا دستی انجام شده اند. در این پژوهش ضمن استفاده از دسته بندی سلاجرمیر (1997) برای شناسایی عبارات احتیاط آمیز، داده ها با استفاده از پیکره الکترونیکی ساخته شده که شامل 1100 مقاله زبان فارسی می باشد، استخراج شدند. بر اساس نتایج حاصل از این پژوهش میزان کاربرد عبارات احتیاط آمیز در حوزه علوم انسانی حدود دو برابر بیشتر از حوزه علوم پایه بود. در این میان استفاده از شرطی ها و عبارات حاکی از شک و تردید در هر دو حوزه بسامد بالایی داشتند. نتایج حاصل از این پژوهش به علت بالاتر بودن حجم داده های مورد استفاده نسبت به تحقیقات پیشین، قابلیت تعمیم بیشتری به عنوان الگو در نوشتن مقالات علمی زبان فارسی را دارا هستند. همچنین تایید شد پیکره ساخته شده در این پژوهش که تا 96 درصد دقت دارد، به عنوان منبع بسیار خوبی برای تحلیل و تحقیق بر روی متون علمی قابل استفاده است.

    کلید واژگان: پیکره, مقالات علمی- پژوهشی, زبان فارسی, اعضای هیات علمی, عبارات احتیاط آمیز}
    Atiyeh Kamyabi Gol *, elham akhlaghi, Hanieh Habibi

    A corpus consists of natural continuous texts that are presented electronically and from which information about linguistic elements (both lexical and non-lexical) can be extracted; this can be done in the shortest possible time and with the highest degree of accuracy. The authors of this article have created Ferdowsi Annotated Academic Language Corpus and the purpose of this article is to introduce the corpus of faculty members of Ferdowsi University of Mashhad and use it in analyzing and describing hedges in both fields of humanities and science. Hedges indicate the certainty of the author through words such as "maybe", "possibly" and "definitely". Research in this area has mainly focused on manual analysis of limited number of words. In this study, Salager Meyer’s (1997) classification has been used to identify, and categorize hedges. The data were extracted from Ferdowsi Annotated Academic Language Corpus which contains 1100 Persian language articles. Based on the results, the use of hedges in the field of humanities was about twice as much as in the field of science. Meanwhile, the use of conditionals and expressions of doubt in both fields had a high frequency. The results from this study have a better chance at being generalized to the fields under study due to the greater number of entries. The accuracy of the corpus labeling is 96% and it can be used as an excellent source for analysis and research on scientific texts.

    Keywords: Corpus, Scientific-research articles, Persian language, Faculty members, Hedges}
  • یوسف نظری*

    رویکردهای جدید زبانشناسی، ابزارهای نوینی برای بررسی زبان در اختیار قرار داده است. یکی از این رویکردها، زبانشناسی پیکره ای است که با کمک حجم وسیعی از داده های زبانی، به مطالعه زبان می پردازد. بررسی باهم آیی واژگان در یک پیکره بزرگ از داده های زبان طبیعی، افق گسترده تری برای بررسی هم معنایی ترسیم می کند. در پژوهش حاضر پنج دسته از واژگان هم معنا انتخاب شده است که عبارتند از (طرد، نبذ، دحر)، (ترک، غادر)، (اعطی، منح)، (کتم، ستر) و (ارتشف، شرب). رویکرد پژوهش بررسی همزمانی است. با استفاده از ابزار Sketch Engine واژه های هم معنا در پیکره arTenTen2012 جستجو شد. همنشینهای پربسامد هر کدام استخراج شد. از آنجاکه تمام افعال از نوع متعدی انتخاب شده اند، با تمرکز بر همنشین هایی که مفعول فعل -یا شبه فعل- محسوب می شوند، سطوح مشترک و متمایز هر کدام در قالب یک جدول آماری ارایه گردید. نتایج نشان داد (طرد) با اشخاص، (نبذ) با صفات نکوهیده و (دحر) با سرکوب فتنه ها و بیماری ها، بیشترین همنشینی را دارند. فعل های (ترک و غادر) صرفا در مورد اماکن اشتراک معنایی دارند. (غادر) با اماکنی بیشترین بسامد را دارد که برگشت فرد به آن مکان، به طور معمول زیاد اتفاق نمی-افتد. (ترک) به صورت انحصاری در مورد تکالیف دینی و برجای گذاشتن اثر و نشانه، به کار رفته است. حال آنکه (غادر) در این موارد هیچ بسامدی ندارد. فعل (اعطی) با مواردی سر و کار دارد که اعطای آنها به صورت فیزیکی اتفاق نمی افتد. اما مفعول های همنشین با (منح) از نوع فیزیکی و یا مواردی هستند که به صورت مدرک و مجوز ارایه شده اند.

    کلید واژگان: هم معنایی, باهم آیی, زبان عربی, پیکره}
    Yusuf Nazari *

    Linguistic perspectives have provided new tools for the study of language. One of these approaches is corpus linguistics which studies language with utilizes enormous amount of linguistic data. Scrutinizing the collocation of words in a large body of natural language data provides a broader horizon for examining synonymy. In the present study, five categories of synonymous words have been selected, including: (کتم, ستر), (اعطی, منح), (ترک, غادر), (طرد, نبذ, دحر) and (شرب, ارتشف). The research approach was synchronic and synonymous words were searched in arTenTen2012 corpus using Sketch engine tool. Then, collocations with higher frequencies were extracted. Since all verbs were chosen from among several types with a focus on left-hand collocations which are considered as object verbs or quasi-verbs. Common and distinct levels of each synonym are presented in the form of statistical tables. Results of the study demonstrated that “طرد”, “نبذ” and “دحر” collocate with persons, reprehensible attributes and suppression of seditions and diseases, respectively. Verbs which mean “ترک” and “غادر” only have meaning in common with places. However, “غادر” has the highest frequency with places where the person doesn’t normally return to them. In contrast, “ترک” has been used exclusively for religious duties and signs. It is noteworthy that “غادر” is not used in these contexts. The verb “اعطی” deals with cases in which bestowal does not occur physically. But objects which collocate with “منح” are of physical type or items that are provided as evidence and permission.

    Keywords: Synonymy, Collocations, arabic language, corpus}
  • طاهره احمدی، بتول علی نژاد*، حسین کارشناس، باقر باباعلی

    با توجه به نقش اساسی پیکره ها در بهبود کیفیت عملکرد سیستم های مبتنی بر داده ، به کارگیری پیکره های گفتاری مناسب در سیستم های پردازش گفتار نیز امری ناگزیر است. به طور معمول، در سیستم های پردازش گفتار، از پیکره های واجی بهره گرفته می شود. یکی از روش های شناخته شده برای افزایش دقت سیستم های پردازش گفتار در سال های کنونی، بهره گیری از پیکره های واج گونه ای است. ویژگی آشکار پیکره های واج گونه ای در مقایسه با پیکره های واجی، اختصاص برچسب های واج گونه ای به هر یک از واج ها است. راه کار پیشنهادی برای تهیه پیکره واج گونه ای، پیاده سازی برنامه ای با بهره گیری از روش مبتنی بر قاعده، برای تبدیل واج ها به واج گونه ها و اعمال این برنامه بر پیکره واجی است. شالوده بهره گیری از رویکرد مورد اشاره، دسترسی به چنین قواعدی است. پس از تدوین این قواعد از منابع موجود در زبان، ایجاد بستر مناسب پیاده سازی و سپس پیاده سازی برنامه مربوطه و اعمال آن بر پیکره گفتاری واجی، پیکره واج گونه ای تهیه می شود. زبان فارسی نیز فاقد پیکره واج گونه ای است و پیکره گفتاری فارس دات کوچک در این زبان، دارای تقطیع در سطح واج و واژه است. به منظور تبیین هر چه بهتر راه کار پیشنهادشده در پژوهش حاضر، به عنوان یک نمونه عملی، مرحله های برچسب گذاری واج گونه ای پیکره واجی فارس دات کوچک، به صورت گام به گام اجرا شده است.

    کلید واژگان: واج, واج گونه, پیکره, نظام الفبای آوانگاری بین المللی (آی.پی.ای)}
    Tahere Ahmadi, Batool Alinezhad *, Hossein Karshenas, Bagher Babaali

    The corpus is a collection of spoken and / or written texts that can be used for linguistic analysis. More precisely, it can be said that these texts are purposefully labeled and categorized based on specific rules and allow the user to do various studies. Corpus linguistics is a branch of applied linguistics that examines and compares different aspects of linguistic data, and, of course, corpora are integral tools of this branch of linguistics. Due to the increasing role and importance of corpus linguistics in development of various sciences in recent decades, the produce and development of various linguistic corpora has been one of the priorities of scientists and researchers in different languages ​​during these years. After the creation of speech processing systems since about two decades ago, the use of context-dependent methods has become particularly prominent  in an effort to increase the accuracy of these systems and some special studies  conduct in linguistics,. One of the best ways to achieve this, is to use corpora that, have special labels in addition to segmentation at the phoneme level, to indicate the differentiation of various allophones. These allophnescan only be achieved by obtaining the necessary phonological rules. In linguistics, this process can be called allophonic labeling of corpus. About 10 years after the introduction of allophonic corpora in the world, no allophonic labeling has been performed for any of Persian language corpora yet. The small Farsdat corpus is the main spoken corpus in Persian. Hence, the need to equip this corpus with allophonic labels to increase the accuracy, to improve the performance of speech processing systems , and to produce specific study, research programs, and tools in linguistic is obvious. In order to elucidate the method proposed in the present study for allophonic labeling of phonemic corpuses, and in parallel for equipping the Persian language with at least one allophonic corpus, the steps of the task are precisely performed on the small Farsdat phonemic corpus. The corpus is one of Persian-language corpora in the last two decades that consists of 6080 sentences spoken by 304 Persian speakers. The speakers of this corpus have indeed one of the most widely spoken dialects in Persian and all of sentences in this corpus, are segmented in to different levels. The segmentation of sentences in word and phoneme levels results in their efficiency in various speech processing systems, such as speech recognition systems, broad transcription systems, and text-to-speech systems. Moreover,  the small Farsdat corpus has the potential to be used in the systems. The suggested solution to prepare an allophonic corpus is to implement a program using the rule-based method and applying it on the phonemic corpus to add allophonic labels on it. The basis of the rule-based method in this research is access to rules for converting phonemes into allophones. After compiling these rules from the resources available in each language and preparing the appropriate settings (for implementation),  the program is implemented. Finally by applying this program to the phonemic corpus, an allophonic corpus is prepared. As noted, special phonological rules are required to convert phonemes into allophones in Persian and to add allophonic labels to the small Farsdat corpus. The purpose of this research is not to study phonemes based on acoustic and laboaratory approaches in order to obtain Persian allophones; but rather to formulate and synchronize phonemes identified in various studies and then to adapt them to the International Phonetic Alphabet System. This ultimately leads to provide a standard set of allophones as far as possible and to achieve the phonological rules necessary for converting phonemes into allophones in Persian (based on existing studies. Although one of the limitations of this study is its incompleteness regarding the extraction of different allophones in Persian, the implemented program has the capability to be updated. if  any studies are carried out in the field of allophones to supplement the existing theoretical resources in the future, it has the possibility to be  to modified or to be enhanced regarding the performance . The present study may also highlight the need for more recent linguistic experiments and the use of more accurate tools and facilities to identify Persian phonemes. This can increase the motivation of phonetics and phonology researchers to take more practical steps in this field as well. After providing the necessary preparations in the phonemic corpus (such as the syllable segmentation) and implementing the above rules, the allophonic labels can be added to the phonemic corpus by implementing this program on it.

    Keywords: phoneme, allophone, corpus, IPA system}
  • آیدا عظیمی، آزیتا افراشی*

    در این پژوهش ابتدا معانی افعال حوزه شنیدن را به شیوه کتابخانه ای در فرهنگ های لغت یافتیم وفهرستی از معانی افعال حوزه شنیدن فراهم آوردیم و برچسب های معنایی دسته بندی شده ای را ایجاد کردیم که تمام معانی ذکر شده در فرهنگ ها را شامل گردد . سپس شواهد کاربرد این افعال را از پایگاه دادگان زبان فارسی، که پیکره ای از متون فارسی است، استخراج و در نرم افزار Excel درج نمودیم. با توجه به شواهد فرهنگ های لغت و پیکره معاصر، 11 معنی برای فعل "شنیدن"، 6 معنی برای "شنفتن"، 3 معنی برای "گوش دادن"، 4 معنی برای "گوش کردن" و 5 معنی برای "نیوشیدن" استخراج شد. همچنین با توجه به داده های به دست آمده از پیکره تاریخی، 11 معنی برای فعل "شنیدن"، 1 معنی برای "شنفتن"، 2 معنی برای "گوش دادن"، 2 معنی برای "گوش کردن" و 2 معنی برای "نیوشیدن" استخراج گردید. به عنوان نتیجه، با استفاده از بسامد معانی، نمودار شبکه معنایی فعل شنیدن، گوش دادن و گوش کردن در پیکره معاصر ترسیم شد. از این یافته ها می توان در فرهنگ نگاری، آموزش زبان به غیر فارسی زبانان و به منظور مقایسه بینازبانی معانی افعال حوزه شنیدن با نتایج سایر پژوهش ها در زبان های دیگر بهره برد.

    کلید واژگان: معناشناسی شناختی, چندمعنایی نظام مند, افعال حسی, افعال حوزه شنیدن, پیکره, زبان فارسی}
    Ayda Azimi, Azita Afrashi *

    This study is performed using a library-based method, in which a list of different meanings of hearing verbs was provided and later classified to meaning labels. The next step was to extract examples from Persian Language Data Base (PLDB), which is a 100 million word corpus of Persian texts. According to the contemporary corpus, there are 11 meanings for /ʃeniːdæn/, 6 meanings for /ʃenoftæn/, 3 meanings for /ɡuːʃ dadæn/, 4 meanings for /ɡuːʃ kærdæn/ and 5 meanings for /ni:juʃi:dæn/. Based on the historical corpus, there are 11 meanings for / ʃeniːdæn/, 1 for /ʃenoftæn/, 2 for /ɡuːʃ dadæn/, 2 for /ɡuːʃ kærdæn/ and 2 meanings for /ni:juʃi:dæn/.Using the meaning frequencies, resulting from the meanings in their context, made it possible to draw the semantic network for “to hear” and “to listen”. The results obtained from this study can make possible the cross-linguistic comparison of meanings of hearing verbs in similar research conducted on other languages and be used in lexicography and teaching Persian to non-Persian speakers.

    Keywords: cognitive semantics, Systemic Polysemy, Verbs of Perception, Hearing Verbs, corpus, Persian language}
  • فرزانه خدابنده*، مینا رمضانی

    توالی های کلیشه ای (Formulaic Sequences) در زبانهای مختلف مورد توجه پژوهشگران قرار گرفته اند. این مطالعه با هدف مقایسه توالی های کلیشه ای در سخنرانی ها در زبان انگلیسی به عنوان مشترک (Lingua Franca) و زبان انگلیسی به عنوان زبان بومی (Native Language) انجام شده است. علاوه بر این، این مطالعه تلاش کرده است تا کارکردهای متنی و ساختاری توالی های کلیشه ای را در محتوای دو سخنرانی مورد ارزیابی قرار دهد. در نهایت، این مطالعه به هدف یافتن جایگاه توالی های کلیشه ای در جمله انجام شد. به این منظور، دو پیکره، یکی رونوشتهای انگلیسی محاوره ای غیربومی و دیگری نوشته های انگلیسی محاوره ای آکادمیک دانشگاه میشیگان برای بررسی انتخاب شدند. از هر گروه، 50000 کلمه انتخاب شد. همچنین در این مطالعه از نرم افزار Antconc برای دستیابی به اهداف پژوهش استفاده شد. 638 توالی کلیشه ای از مطالعات گذشته استخراج شد و یک به یک در پیکره مورد بررسی قرار گرفت. این توالی ها براساس اهداف پژوهش و از زوایای مختلف مورد تجزیه و تحلیل قرار گرفتند. نتایج نشان داد که گوینده های غیر بومی بیشتر از گوینده های بومی از توالی های کلیشه ای استفاده می کنند. ضمن اینکه، بیشترین کارکرد متنی مورد استفاده در هر دو گروه گوینده های بومی و غیر بومی، کارکرد متنی مکانی-زمانی بود وعبارات قیدی بیشترین ساختار مورد استفاده توسط هر دو گروه بود. علاوه بر این، دو گروه مورد مطالعه، از جایگاه های آغازین، بیشتر از سایر جایگاه ها استفاده کردند. بطور کلی، مطالعه حاضر کاربرد فراوانی برای دانشجویان، مدرسان و تدوین کنندگان برنامه های تحصیلی و آموزشی دارد.

    کلید واژگان: توالی های فرمولواره ای, زبان انگلیسی به عنوان یک زبان واسطه, تابع متنی, جایگاه, پیکره, عبارات قیدی}
    Farzaneh Khodabandeh *, Mina Ramezani

    The high significance of Formulaic sequences (FSs) in each language has attracted the attention of scholars. This study aimed at comparing the use of FSs in English as a foreign language (EFL) and English as Native Language (ENL) lectures. Additionally, it attempted to discover the textual and structural functions of used FSs in two corpora of lectures. Finally, this study aimed at finding the position of FSs in sentences. To this end, two corpora, namely the transcribed corpus of spoken English of ELF and the Michigan Corpus of Academic Spoken English were selected to be studied. The present study selected 100,000 words from the two corpora, approximately 50,000 from each The study employed Antconc software in order to accomplish its goal. Then, 638 FSs were extracted from previous studies and examined one by one. They were analyzed from different perspectives according to the objectives of the study. The results indicated non-native speakers used FSs more than native ones. Moreover, the most used textual function was saptio-temporal one both by non-native and native speakers. The most used structure by both groups was prepositional phrase. Furthermore, both groups used FSs in initial position more than other positions. The present study has implications for students, teachers, and material developers.

    Keywords: Formulaic Sequence, Lingua Franca, Textual Function, position, saptio-temporal}
  • دانیال شیرزادی، حمیدرضا دولت آبادی *

    امروزه اهمیت داتش واژگانی منظم و خاص در هر حوزه ای امری واضح و پذیرفته شده است. علیرغم اهمیت این موضوع، فقدان تحقیقات میدانی در حوزه ی واژگان دانشگاهی مدیریت اطلاعات پزشکی کاملا مشهید است. برای پرکردن این شکاف علمی، تحقیق حاظر مجموعه ی گسترده ای از مقالات پژوهشی و کتابهای درسی را در این حوزه مورذ بررسی قرار داد تا بتواند به یک مفهوم جامع از فهرست واژگان دانشگاهی دست یابد. بدین منظور مجمو عه ای از واژگان زنده که تعداد بیش از دو میلیون واژه را در برمیگیرد توسط نرم افزار رنج (range) مورد تحلیل و آنالیز قرار گرفت. در فرایند تحقیق ، ما قادر به طراحی و ارایه ی یک لیست و فهرست کاملا جدید از واژگان شدیم که صرفا برای دانشچویان مدیریت اطلاعات یر حوزه های پزشکی و درمانی کابرد داردو بیش از 15 درصد از واژگان اصلی در حوژه ی پزشکی را در بر میگیرد. این درصد ، پیشرفتی قابل توجه و چشمگیر نسبت به لیست واژگان دانشگاهی قبلی میباشد. لذا امیدواریم که یافته های تحقیق حاضر بتواند نیازهای دانشجویان، اساتید، دبیران و طراحان مطالب درسی در این حوزه را برطرف نماید.

    کلید واژگان: پیکره, فهرست واژگانی, مدیریت اطلاعات, کتابهای درسی, انسجام, دانش واژگان}
    Danial Shirzadi, Hamid Reza Dowlatabadi *

    Importance of discipline specific vocabulary knowledge is well perceived. Despite the importance of the issue, there is a dearth of empirical research to unravel frequent academic vocabulary in the field of Health Information Management. To fill this research gap, the present study drew on a corpus of research articles and course books written in this field to underscore the concept of Academic Word List. To do so, a corpus of 2,264,981 running words analyzed by Range software package. In the process of research, we proposed a new discipline specific word list specially tailored for the students of health information management which can cover for 15.09% of all tokens in the corpus. This proportion of coverage is an improvement over previous academic word lists. Accordingly, it is hoped that the findings of the present study could contribute to students, teachers, material developers and researchers in this field of study.

    Keywords: research articles, Course Books, discipline, vocabulary knowledge, Tokens}
  • الهام فراهانی، هوشنگ یزدانی قره‌آغاج*، موسی احمدیان، مجید عامریان

    پژوهش های اخیر نشان می دهند اصطلاحات، که معمولا وجهی غیررسمی، پر رنگ و لعاب، و سرگرم کننده از زبان محسوب می شوند، به گفتمان رسمی هم راه یافته اند، ولی تاکنون در مورد ورود اصطلاحات به ژانرهای نوشتاری و رسمی، از جمله مقاله های پژوهشی، تحقیقی صورت نگرفته است. پژوهش حاضر نقش کاربردی اصطلاحات در پیکره ای زبانی مشتمل بر 409،122 واژه را، که به صورت تصادفی از مقاله های منتشرشده در حوزه زبانشناسی کابردی انتخاب شده اند، شناسایی و بررسی کرده است. افزون بر این، کاربرد اصطلاحات در مقاله های انگلیسی نویسندگان فارسی زبان و انگلیسی زبان این حوزه مقایسه شده است. نتایج تحلیل های آماری استنباطی نشان می دهند که، در نگارش مقاله های پژوهشی، نویسندگان انگیسی زبان به طرز بارزی بیش از نویسندگان فارسی زبان از اصطلاحات استفاده می کنند. بر مبنای پژوهش حاضر، شش نقش کاربردی اصطلاحات استخراج و همچنین فهرستی از پرکابردترین اصطلاحات در مقالات پژوهشی عرضه شده است. این نقش های شش گانه عبارت اند از: ارزیابی کننده، اطلاعات دهنده، تعیین ماهیت، تاکیدی، سازماندهی کننده و چندگانه. با بررسی و ارایه اصطلاحات انگلیسی آکادمیک در مقاله های پژوهشی زبانشناسی کاربردی، یافته های این تحقیق می تواند مورد استفاده استادان دانشگاهی درس های نگارش انگلیسی،دانشجویان مقاطع تحصیلی کارشناسی ارشد و دکتری و تهیه کنندگان کتاب های آموزشی قرار گیرد.

    کلید واژگان: اصطلاحات انگلیسی, کاربرد اصطلاحات, پیکره, مقالۀ پژوهشی, زبانشناسی کاربردی}
    Elham Farahani, Hooshang Yazdani Gharehaghaj *, Moussa Ahmadian, Majid Amerian

    Idioms, commonly considered to be a figure of informal, colorful, and entertaining language, are supposed not to lend themselves to formal discourses. However, idioms have been recently found to be employed in formal communications and academic discourse. This study strives to identify idioms in a corpus of 409122 words of 50 randomly selected Applied Linguistics papers. Moreover, the study aims to analyze different aspects of English idiom usage along with the pragmatic functions they perform in Applied Linguistics research articles. Furthermore, a comparison was made between the employment of English idioms and their functions in the articles written by native English-speaking and those of native Persian-speaking authors. Results of descriptive statistics indicated that English –speaking writers significantly used more idiomatic expressions in their research articles. Six pragmatic functions fulfilled by idioms in research articles were also extracted. Two lists of the most frequently used idioms in research articles were compiled. The six pragmatic functions include evaluative, informational, modalizing, emphatic, organizational, and cross-functioning. By studying and providing the most frequent academic idioms in Applied Linguistics research articles, the findings of this study can be useful for the EFL writing instructors, Applied Linguistics graduate and post graduate students, and teaching materials developers.

    Keywords: English idioms, pragmatic functions, Corpus, research articles, Applied linguistics}
  • هادی زارع میرک آباد*، سعید کتابی، اکبر حسابی

    پژوهش حاضر قصد دارد تا گروه های واژگانی در متون خبری سیاسی را شناسایی و بررسی کند. گروه های واژگانی عبارتند از عباراتی که به علت تکرار زیاد در متن به صورت ثابت نمایان می شوند و تغییر در این عبارات باعث غیرطبیعی شدن این عبارات می شود. در گونه های زبانی مختلف از گروه های واژگانی مخصوص به خود استفاده می شود. به همین دلیل شناسایی و آموزش این گروه های واژگانی مختص به گونه های زبانی می تواند منجر به تولید متون سلیس و روان شود. متون خبری یکی از گونه های زبانی در زبان فارسی است که گروه های واژگانی مختص به خود دارد. عدم استفاده از گروه های واژگانی اختصاصی در گونه های زبانی باعث غیر طبیعی شدن متون نوشته شده، می شود. در این پژوهش گروه های واژگانی مورد استفاده در پیکره ی زبانی متون خبری سیاسی شناسایی و نقش و کاربرد هر یک به صورت مجزا بررسی شده است. به طور کلی 44 گروه واژگانی که بیش از 100 بار در متن تکرار شده بود به وسیله نرم افزار تحلیل زبان استخراج شد. سپس با بررسی جملات نمونه ای که در آنها گروه های واژگانی استفاده شده بود کاربرد و نحوه استفاده از هر یک را تحلیل کرده ایم که می تواند به منظور آموزش نگاشتن متون خبری از آنها استفاده شود.

    کلید واژگان: گروه های واژگانی, پیکره, زبان شناسی پیکره ای, الگوهای زبانی}
    hadi zare, saeed ketabi, Akbar Hesabi

    The present study aims to identify and examine lexical groups in political news texts. Vocabulary groups are phrases that appear consistently due to high repetition in the text, and changes in these phrases make these phrases unnatural. In different language types, special lexical groups are used. For this reason, identifying and teaching these lexical groups specific to linguistic types can lead to the production of smooth and fluent texts. News texts are one of the linguistic types in Persian that have their own lexical groups. Failure to use specific lexical groups in linguistic variants will make the written texts unnatural. In this study, the lexical groups used in the linguistic body of political news texts have been identified and the role and application of each have been studied separately. A total of 44 vocabulary groups that were repeated more than 100 times in the text were extracted by language analysis software. Then, by examining the sample sentences in which lexical groups were used, we analyzed the application and how to use each of them, which can be used to teach writing news texts.

    Keywords: Vocabulary groups, Figure, Body linguistics, Linguistic patterns}
  • راضیه غلامی نژاد*، محمدرضا عنانی سراب

    هدف پژوهش حاضر بررسی میزان حضور واژگان دانشگاهی کاکسهد (2000) در پیکره ای از کتب رشته آموزش زبان انگلیسی است. واژگان دانشگاهی کاکسهد که شناخته شده ترین فهرست واژگان دانشگاهی موجود است، برای کمک به فراگیری واژگان دانشگاهی دانشجویان رشته های مختلف کاربرد دارد. در این پژوهش، پس از طی چند مرحله، پیکره ای با حجم بیش از 11 میلیون واژه مستخرج از کتابهای درسی گرایش آموزش زبان انگلیسی ایجاد گردید. پیکره 13عنوان درسی را با میزانی برابر از واژه در هر درس دربرمی گیرد. در مرحله دوم، با استفاده از نرم افزار میزان پوشش واژه های دانشگاهی در سراسر پیکره مورد تحلیل قرارگرفت. نتایج نشان می دهد که واژگان دانشگاهی کاکسهد 13/11 درصد از کل پیکره را پوشش می دهند. این رقم از رقم بدست آمده در بسیاری از رشته های دیگر بیشتر است. پوشش فهرست کاکسهد در هر یک از زیرپیکره ها نیز مورد بررسی قرارگرفت و تفاوت قابل توجهی بین همپوشانی فهرست با هریک از دروس مشاهده شد.

    کلید واژگان: واژگان دانشگاهی, پیکره, انگلیسی برای اهداف دانشگاهی, فهرست واژه, آموزش زبان}
    Razieh Gholaminejad *, MohammadReza Anani Sarab

    The current research is a corpus-based lexical study which aims to discover the presence of Coxhead’s (2000) academic word list (AWL) in a corpus of language teaching textbooks. The AWL, as the most well-known list of academic vocabulary available, is used to increase the knowledge of English vocabulary in students studying different disciplines across universities of the world. In the present study, after a series of steps, we developed a corpus of more than 11 million words, composed of language teaching textbooks. The corpus consists of 13 areas, which constitute almost equal number of words in the corpus. Then, using the Range software, the AWL coverage was analyzed across the corpus. The results reveal that the AWL items cover 11.13% of the entire corpus. This is higher than the figure obtained in similar studies conducted on many other disciplines. We also analyzed the AWL’s coverage in each sub-corpus, and found a significant difference among the coverage figures.

    Keywords: Academic vocabulary, Corpus, Vocabulary, English for AcademicPurposes, EAP, Word-list, Language teaching}
  • الهام علایی ابوذر*
    این پژوهش تلاش دارد با جمع آوری اطلاعات مربوط به شاخص ها و مراحل ساخت پیکره زبانی، به پژوهشگران در زمینه ساخت انواع پیکره های زبانی کمک کند. در این راستا، در این مقاله، پس از بررسی نظرات پژوهشگرانی که اقدام به ساخت پیکره هایی در زبان های مختلف کرده اند، به شاخص های کلی ساخت پیکره های زبانی پرداخته می شود. این شاخص ها مربوط به ساخت گونه های متنی و گفتاری پیکره است که نمونه گیری، نمایندگی، توازن، اندازه، نوع پیکره و  یک دستی را شامل می شوند. سپس، فرآیند ساخت پیکره متنی ارایه می شود که انتخاب متون، پیش پردازش متون و حاشیه نویسی را در بر می گیرد و در این راستا به تفصیل درباره هر یک از مراحل توضیح داده می شود. در پایان، فرآیند ساخت پیکره گفتاری بیان می شود که جمع آوری داده ها، آوانویسی، نمایش و حاشیه نویسی و دسترسی را در بر می گیرد. درباره هر یک از مراحل مذکور نیز به تفصیل توضیح داده می شود.
    کلید واژگان: پیکره, شاخص های کلیدی, ساخت پیکره, فرآیند ساخت پیکره, گونه نوشتاری, گونه گفتاری}
    Elham Alayiaboozar *
    The aim of this paper is to take readers through the basic steps involved in building a corpus of language data for different purposes. This is done via gathering information about corpus construction from related sources. After a review of literature (regarding corpus construction and the use of corpus in different fields) , this article offers advice in a non-technical style to help the researchers to make sure that their corpus is well-designed and fit for the intended purpose. Key points to be considered in constructing any corpus (written or spoken language) include: Sampling, Size, Representativeness, Balance, General vs. Specialized corpus and Homogeneity. The steps involved in constructing a text corpus are: text selection, text normalization and different kinds of annotation. The steps to be followed in constructing a spoken language/speech-based corpus are: data gathering, transcription, representation, annotation and access. In this paper all the afore-mentioned steps have been explained with related details.
    Keywords: corpus, key points in corpus construction, corpus construction process, text corpus, spoken language corpus}
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال