به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت

جستجوی مقالات مرتبط با کلیدواژه « farsi » در نشریات گروه « برق »

تکرار جستجوی کلیدواژه «farsi» در نشریات گروه «فنی و مهندسی»
  • Somayeh Bakhshaei, Reza Safabakhsh, Shahram Khadivi
    Labeled data are useful resources for different application in different fields like image processing, natural language processing etc. Producing labeled data is a costly process. One efficient solution for alleviating the costly process of annotating data is managing the sampling process. It is better to query for essential samples instead of a group of unnecessary ones. Active learning (AL) attempts to overcome the labeling bottleneck by sending queries for unlabeled instances to be labeled with the help of an annotator. This technique is applied to Natural Language Processing (NLP) especially in Statistical Machine Translation (SMT) tasks that we also focus on in this work. In Statistical Machine Translation, parallel corpora are scarce resources, and AL is a way of solving this problem. It attempts to alleviate the costly process of data annotating by sending queries just for translation of the most informative sentences which are essential for system improvement. The contribution of our work is proposing a new approach in AL for selecting sentences through a soft decision making process. In this algorithm, in addition to scoring sentences according to their information, the distribution of the space of unlabeled data is also considered. Each sentence (either labeled or unlabeled) changes to a vector of feature scores. Then each new coming sentence is observed in the feature space and gets two probabilities: how probable it is to be either labeled or unlabeled. These probabilities are calculated according to the position of new instance related to its labeled and unlabeled neighbors. We have applied the proposed model for improving training corpus of a SMT system. Also Farsi-English language pairs are selected as the base-line SMT system. We have sampled the best sentences that can improve the quality of our SMT system and send query for their translations. In this way the costly approach of making parallel corpus is alleviated. Finally, our experiments show significant improvements for sampling sentences by soft decision making in comparison to the random sentence selection strategy.
    Keywords: component, Active Learning, Statistical Machine Translation, Farsi, English pair Languages, Soft Decision Making, Kernel Based Distance, Density Based KNN}
  • سعید مظفری*، علی اصغر اروجی، محی الدین مرادی
    استخراج اطلاعات متنی از تصاویر ویدیویی نقش مهمی را در کاربردهایی نظیر تحلیل معنایی ویدیو، بازیابی اطلاعات متنی، آرشیو تصاویر ویدیویی و اطلاعات مربوطه ایفا می کند. در این مقاله روشی جهت استخراج متن فارسی- عربی از تصاویر ویدیویی ارائه می گردد. در ابتدا با استفاده از آشکارساز لبه مناسب، لبه های موجود در تصویر استخراج گردیده و با استفاده از مکان تلاقی لبه ها، گوشه های تصنعی موجود در تصویر مشخص می شوند. تحلیل هیستوگرام جهت حذف برخی از گوشه های تصنعی نواحی غیر متنی انجام می شود. سپس ضرایب تبدیل فوریه کسینوسی گسسته بلوک های تصویر استخراج شده و با ترکیب تعدادی از ضرایب، تصویر شدت بافت حاصل می شود. با تلفیق مشخصه های حاصل از گوشه های تصنعی و تصویر شدت بافت، بردار مشخصه ای جهت اعمال به یک طبقه بندی جهت جدا سازی نواحی متنی از غیرمتنی حاصل می شود. در نهایت با رسم پروفایل های نرمالیزه شده شدت بافت، بازبینی نهایی انجام شده و تفکیک خطوط متنی از یکدیگر انجام می گیرد.
    کلید واژگان: متون فارسی, عربی, ویدیو, آشکارسازی متن, گوشه تصنعی, تبدیل فوریه کسینوسی گسسته}
    Video text detection plays an important role in applications such as semantic-based video analysis، text information retrieval، archiving and so on. In this paper، we propose a Farsi/Arabic text detection approach. First، with an appropriate edge detector، edges are extracted and then by using edges cross ponts، artificial corners are extracted. Artificial corner histogram analysis is done for rejecting some non text corners. The discrete cosine transform (DCT) coefficients of input picture are extracted and texture intensity picture is created by combining appropriate coefficients. With combining artificial corners image and texture intensity image، a features vector is extracted and fed into support vector machine (SVM) classifier for detecting text regions. Finally with drawing normalized texture intensity profiles، final verification is done and text lines are sepersted from each others
    Keywords: Farsi, Arabic, video sequence, text detection, artificial corner, DCT}
  • وحید قدس، احسان الله کبیر
    در این مقاله گروه بندی و بازشناسی حروف تنهای فارسی که به صورت برخط نوشته شده باشند، بر اساس ویژگی های ساختاری آن ها ارائه شده است. حروف بر اساس شکل و ساختار نوشتاری بدنه اصلی آن ها به 9 گروه تقسیم می شوند. پس از استخراج ویژگی ها، گروه بندی با استفاده از درخت تصمیم انجام می شود. بازشناسی نهایی حروف با توجه به ساختار اجزای کوچک آن ها در هر گروه صورت می پذیرد. با توجه به این که در این مقاله از روش های زمان بر برای بازشناسی استفاده نشده است، روش پیشنهادی، روشی سریع در بازشناسی حروف برخط فارسی است. نتایج پیاده سازی این روش بر روی مجموعه داده «حروف برخط دانشگاه تربیت مدرس»، گروه بندی و بازشناسی حروف را به ترتیب با دقت بالای %94 و %92 نشان می دهد و این در حالی است که میانگین زمان پردازش و بازشناسی یک حرف حدود 3 میلی ثانیه به دست آمد.
    کلید واژگان: بازشناسی, گروه بندی, دستنوشته برخط, درخت تصمیم, فارسی, حروف تنها}
    Vahid Ghods, Ehsanollah Kabir
    In this paper، grouping and recognition of online Farsi discrete characters are presented according to their structural features. The letters are divided into 9 groups based on the form and structure of their main bodies. After feature extraction، grouping is performed using a decision tree. Final recognition of letters is carried out in each group by delayed strokes. The proposed method is a rapid method in character recognition because time-consuming methods have not been used. Our proposed method was tested on TMU-OFS dataset، and a recognition rate of 94% and 92% was achieved for character grouping and recognition، respectively. The mean processing time for recognizing a letter was 3ms.
    Keywords: Recognition, Grouping, Online handwriting, Decision tree, Farsi, Discrete letters}
  • وحید قدس، احسان الله کبیر *

    در بازشناسی دست نوشته ها به صورت برخط (یا برون خط)، آگاهی از انواع نوشتن حروف در کلمه ها ضروری است. در این مقاله، پایگاه داده برخط دانشگاه تربیت مدرس را انتخاب کرده ایم -که شامل حدود 10،000 نمونه از 1،000 زیرکلمه پرکاربرد فارسی است- و گروه بندی های متفاوت را از نظر بدنه اصلی و اجزای کوچک زیرکلمه ها معرفی کرده ایم. در بخش دیگر مقاله، به بررسی انواع دستخط می پردازیم و مهم ترین شکل های متفاوت نوشتن حروف را پیدا می کنیم. سپس با توجه به آن ها، زیرکلمه ها را گروه بندی می نماییم. بررسی فراوانی حروفی که به چند شکل نوشته می شوند و تحلیل آن ها از مباحث نهایی این مقاله است. نتایج اولیه بهبود موثر دقت بازشناسی را با انجام گروه بندی بر اساس انواع نوشتن حروف، نشان می دهد.

    کلید واژگان: پایگاه داده, دست نوشته برخط, دستخط, فارسی, بازشناسی}
    Vahid Ghods, Ehsanollah Kabir

    Knowledge of the styles of writing letters in the word is necessary in recognition of online (or offline) handwriting. In this paper, we have chosen Tarbiat Modarres University (TMU) dataset which includes about 10,000 samples from the 1000 Farsi useful subwords. Different grouping based on the main body and the small signs of the subwords have been introduced. Diverse styles of Farsi handwriting were investigated and the most important forms of letters writing were found. Then, the subwords were classified according to their styles. Frequency of letters that are written in different forms was discussed and analyzed. The results showed effective improvement in recognition rate using grouping based on the writing styles of letters.

    Keywords: Dataset, Online handwriting, Writing styles, Farsi, Recognition}
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال