فهرست مطالب

فصلنامه پردازش علائم و داده ها
سال چهاردهم شماره 2 (پیاپی 32، تابستان 1396)

  • تاریخ انتشار: 1396/06/30
  • تعداد عناوین: 10
|
  • تشخیص دست نوشته برخط فارسی با استفاده از مدل زبانی و کاهش قوانین نگارش کاربر
    سلمان مسکنتی، احمد کشاورز* صفحات 3-24
    پیوسته بودن کلمات فارسی و وجود تنوع بسیار زیاد رسم الخط این زبان و همچنین شکل های متنوع حروف فارسی بسته به محل قرارگیری شان در کلمه، تشخیص دست نوشته های فارسی را به چالش کشانده اند. مهم ترین اشکال در اغلب روش های بازشناسی بی توجهی به بافت جمله است که باعث می گردد در مواردی که کلمه ی ورودی اشتباه بازشناسی می شود، واژه ای با ظاهر درست در جمله ای نابجا به کار رود. طراحی مدلی که بتواند بافت جمله را به خوبی تحلیل کند مستلزم در اختیار داشتن منابع زبانی حجیمی است که نماینده خوبی از زبان مورد بازشناسی باشند. در این مقاله روش جدیدی برای بازشناسی کلمات برخط فارسی ارائه شده است که با استفاده از بافت جمله سعی در بهبود بازشناسی دارد. فرآیند بازشناسی معرفی شده در این نوشتار به این صورت است که ابتدا علائم و بدنه ی زیرکلمات دست نوشته ی ورودی تفکیک شده و بدنه ی هر زیرکلمه و علائم آن مشخص می شود. سپس علائم زیرکلمات تشخیص داده شده و بر اساس آن مجموعه ای از واژگان به عنوان فرضیه در نظر گرفته می شوند. به هر فرضیه بر اساس میزان شباهت آن به دست نوشته ورودی امتیازی تعلق می گیرد و بر اساس امتیاز حاصله محتمل ترین فرضیات مشخص می شوند. سپس این رویه توسط مدل زبانی برای یافتن فرضیات محتمل تر، هدایت می شود. نتایج آزمایش های به عمل آمده نشان می دهد که کاهش قابل توجهی در نرخ خطای بازشناسی کلمات حاصل شده و کاربر در نگارش ملزم به رعایت محدودیت های کمتری است. از طرفی روش پیشنهادی می تواند نسبت به روش های قبلی با در اختیار داشتن یک پایگاه داده دست نویس محدود، صحت مطلوب تری ارائه کند. با به کارگیری روش ارائه شده، دقت بازشناسی در مرحله اولیه در سطح حروف 95.9% و پس از بازشناسی به کمک مدل زبانی دقت بازشناسی به 99.3% ارتقاء یافت. برای بهبود عملکرد الگوریتم، استفاده از الگوریتم یادگیری تقویتی برای تطبیق پذیری الگوریتم با نویسنده به عنوان کار آینده پیشنهاد می گردد.
    کلیدواژگان: بازشناسی برخط، دست نوشته فارسی، نزدیکترین همسایه، مدل زبانی، محدودیت کاربر
  • طبقه بندی آریتمی های قلبی مبتنی بر ترکیب نتایج شبکه های عصبی با نظریه شواهد دمپستر- شفر
    جمال قاسمی*، سمیه کرد، محمد غلامی صفحات 25-42
    آریتمی های قلبی یکی از شایع ترین بیماری های قلبی است که ممکن است سبب مرگ بیمار گردد. از این رو شناسایی آریتمی های قلبی بسیار مهم است. در این مقاله برای دسته بندی آریتمی های قلبی در سه کلاس PAC، PVC و Normal روشی مبنی بر ترکیب طبقه بندی کننده ها با استفاده از نظریه شواهد لحاظ شده است. بدین شکل که ابتدا پیک های R در ECG شناسایی گردید. سپس ویژگی های خطی ECG شامل RMSSD، SDNN و HR Mean و همچنین ویژگی غیر خطی آن با استفاده از SVD بدست آمد. ترکیب ویژگی های بدست آمده به شبکه های عصبی MLP، Cascade Feed Forward و RBF داده شد. اصل عدم قطعیت در مورد پاسخ آن ها بررسی و در نهایت پاسخ این طبقه بندی کننده ها با استفاده از نظریه شواهد با یکدیگر ترکیب شدند. جهت پردازش ECG نیاز به حذف نویز نبوده و روش پیشنهادی توانسته است در حضور نویز، نوع آریتمی قلبی را در بهترین حالت با حساسیت 98 % تشخیص دهد.
    کلیدواژگان: سیگنال الکتروکاردیوگرام، طبقه بندی کننده ها، شبکه عصبی، نظریه شواهد
  • تحلیل ممیز غیرپارامتریک بهبودیافته برای دسته بندی تصاویر ابرطیفی با نمونه آموزشی محدود
    آزاده کیانی سرکله، پروفسور محمدحسن قاسمیان* صفحات 43-58
    استخراج ویژگی نقش مهمی در بهبود دسته بندی تصاویر ابرطیفی دارد. روش های استخراج ویژگی غیرپارامتریک، نسبت به روش های پارامتریک، برای داده های با توزیع غیر نرمال از کارایی بهتری برخوردارند و می توانند ویژگی های بیشتری را استخراج نمایند. روش های استخراج ویژگی غیرپارامتریک از ماتریس های پراکندگی غیرپارامتریک برای محاسبه ماتریس انتقال استفاده می کنند. تحلیل ممیز غیرپارامتریک[1]، یکی از روش های غیرپارامتریک در استخراج ویژگی است که در آن برای تشکیل ماتریس های پراکندگی غیرپارامتریک، از میانگین های محلی هر نمونه و تابع وزن استفاده می شود. میانگین محلی با استفاده از k نمونه همسایه بدست می آید و تابع وزن، بر روی نمونه های مرزی در تشکیل ماتریس پراکندگی بین دسته ای تاکید می کند. در این مقاله، NDA بهبود یافته[2] به منظور اصلاح NDA معرفی شده است. در MNDA، تعداد نمونه های همسایه در محاسبه میانگین محلی با توجه به موقعیت نمونه در فضای ویژگی بدست می آید. روش پیشنهادی از توابع وزن جدید در تشکیل ماتریس های پراکندگی استفاده می کند. توابع وزن پیشنهادی تاکید روی نمونه های مرزی در تشکیل ماتریس پراکندگی بین دسته ای و تاکید روی نمونه های نزدیک به میانگین دسته، در تشکیل ماتریس پراکندگی درون دسته ای دارند. علاوه براین، به منظور اجتناب از تکین شدن ماتریس پراکندگی درون دسته ای، از تنظیم آن استفاده شده است. نتایج آزمایش ها روی تصاویر ایندیانا و سالیناس نشان می دهد که MNDA کارایی بهتری را نسبت به روش های استخراج ویژگی پارامتریک و غیرپارامتریک مورد مقایسه داشته است. بیشترین مقدار صحت متوسط دسته بندی برای داده ایندیانا %34/80 است که با 18 نمونه آموزشی، دسته بند ماشین بردار پشتیبان و 10 ویژگی استخراج شده از MNDA بدست آمده است. برای داده سالیناس، بیشترین مقدار صحت متوسط دسته بندی، %31/94 است که با 18 نمونه آموزشی، دسته بند ماشین بردار پشتیبان و 9 ویژگی استخراج شده از MNDA بدست آمده است. آزمایش ها نشان می دهند که با استفاده از توابع وزن پیشنهادی و ماتریس پراکندگی درون دسته ای تنظیم شده، روش پیشنهادی نتایج بهتری را در دسته بندی تصاویر ابرطیفی با نمونه های آموزشی محدود بدست آورده است.
    [1] (Nonparametric Discriminant Analysis (NDA
    [2] (Modified NDA (MNDA
    کلیدواژگان: تتصاویر ابرطیفی، استخراج ویژگی، دسته بندی نظارت شده، پدیده هیوز، نمونه های آموزشی محدود
  • روشی جدید جهت استخراج موجودیت های اسمی در عربی کلاسیک
    سید محمد باقر سجادی *، حسن رشیدی، بهروز مینایی بیدگلی صفحات 59-74
    تشخیص واحدهای اسمی به عنوان یکی از سامانه های پردازش زبان طبیعی عبارت است از تشخیص اسامی خاص و طبقه بندی آن ها به یکی از گروه های شخص، مکان، سازمان و زمان. این عملیات به دلیل تاثیر قابل توجه در بهبود کارایی دیگر حوزه های پردازش زبان طبیعی مانند ترجمه ماشین، بازیابی اطلاعات، خوشه بندی نتایج جستجو و پرسش و پاسخ، در سال های اخیر مورد توجه محققان در زبان عربی نیز قرار گرفته است. گرچه بیشتر تحقیقات در این حوزه روی عربی استاندارد امروزی انجام شده است، اما در این مطالعه عربی کلاسیک مورد توجه است. در همین راستا، روشی جدید جهت تشخیص واحدهای اسمی در زبان عربی ارائه می گردد. در این تحقیق یک پیکره متنی عربی کلاسیک به نام نورکورپ، متشکل از 130 هزار کلمه برچسب گذاری شده توسط متخصصین، معرفی می گردد. همچنین از یک فرهنگ لغات شامل 18000 اسم شخص که از کتب حدیثی استخراج شده است به عنوان منابع خارجی استفاده می شود. مدل پیش بینی، بر اساس مجمع رده بندها و یک روش دو-مرحله ای پیشنهاد شده است به طوری که در مرحله اول تشخیص واحدهای اسمی از طریق الگوریتم آدابوست M1 و در مرحله دوم طبقه بندی آن ها به گروه های از پیش تعیین شده توسط الگوریتم آدابوست M2 انجام می گیرد. به منظور غلبه بر چالش های زبان عربی عملیات نشانه گذاری، برچسب گذاری ادات سخن و قطعه کردن عبارت پایه به کار گرفته شده است. با استفاده از یک روش آماری، برخی از کلمات پر کاربرد در واحدهای اسمی به عنوان کلمات کلیدی استخراج شدند. نتیجه به دست آمده از مدل پیشنهادی در ارزیابی F-measure معادل 85/86 درصد است که بیانگر عملکرد مطلوب مدل می باشد. در آخر، روش پیشنهادی روی یک پیکره استاندارد امروزی به نام انرکورپ اعمال و نتایج با پیکره نورکورپ مقایسه شده اند.
    کلیدواژگان: تشخیص واحدهای اسمی، مجمع رده بندها، روش بوستینگ، زبان عربی کلاسیک
  • الگوریتم ژنتیک با حهش آشوبی هوشمند و ترکیب چند نقطه ای مکاشفه ای برای حل مسئله ی رنگ آمیزی گراف
    سیدعلی ساداتی تیله بنی، حمید جزایری *، مجتبی ولی نتاج صفحات 75-96
    تخصیص مقدار رنگی به هر یک از گره های گراف، به گونه ای که هیچ دو گره ی مجاوری دارای رنگ یکسانی نباشد و کمترین مقدار رنگی استفاده شود را مسئله ی رنگ آمیزی گراف گویند. این مسئله به عنوان یکی از مسائل NP-hard شناخته می شود که کاربردهای مختلفی در زمینه ی تخصیص پهنای باند، اختصاص حافظه به برنامه ها و همچنین، طراحی مدارهای مجتمع دارد. در مقاله ی حاضر، از الگوریتم ژنتیک و پدیده ی آشوب برای حل این مسئله استفاده شده است. در روش پیشنهادی حاضر، عملگر ترکیب چند نقطه ای مکاشفه ای به نام CMHn معرفی شده است. این عملگر، با انتخاب چند نقطه ی برش در والدین و معتبر کردن یکی از زیر بخش های والدین (دومین زیربخش هر والد می تواند معتبر یا غیر معتبر باشد) آنها را با هم، با استفاده از روشی ابتکاری ترکیب می کند. برای این که بتوان از بهینه ی محلی فرار کرد و همچنین، برای یافتن فضای جستجوی جدید، از عملگر جهش استفاده می شود. در این مقاله، عملگر جهش آشوبی هوشمند معرفی شده است که با استفاده از فرمولی گره هایی که برای جهش مناسب ترند را انتخاب و بر روی آنها جهش را اعمال می کند. همچنین، نیمی از جمعیت اولیه با استفاده از روش ابتکاری و نیمی از آن با روش تصادفی تولید شده اند. به منظور ارزیابی الگوریتم پیشنهادی از نمونه گراف های DIMACS استفاده شده است. نتایج بدست آمده نشان می دهد که روش پیشنهادی در اکثر گراف ها، به خصوص گراف های بسیار بزرگ (wap)، جواب بهتری نسبت به تحقیقات مشابه ارائه می دهد.
    کلیدواژگان: مسائل NP، مسئله ی رنگ آمیزی گراف، الگوریتم ژنتیک، روش ابتکاری، ترکیب چند نقطه ای مکاشفه ای، جهش آشوبی هوشمند
  • فشرده سازی تصویر با کمک حذف و کدگذاری هوشمندانه اطلاعات تصویر و بازسازی آن با استفاده از الگوریتم های ترمیم تصویر
    علی جمشیدی *، مهران یزدی، مریم سادات منافی صفحات 97-114
    روش های فشرده سازی با اتلاف به دلیل ایجاد فشرده سازی بیشتر کاربرد گسترده تری دارند. اگرچه روش های زیادی تا به حال برای فشرده سازی تصاویر پیشنهاد شده است، اما، به استفاده از روش های هوشمندانه ی حذف اطلاعات کمتر توجه شده است. ترمیم، مجموعه ای از تکنیک هایی است که اصلاحاتی را بروی تصاویر انجام می دهد با این هدف که بیننده تفاوتی بین تصویر اصلاح شده و تصویر اصلی احساس نکند. در این مقاله، پس از بررسی و معرفی بعضی از روش های ترمیم تصویر و روش های فشرده سازی تصویر با کمک ترمیم، روش جدیدی پیشنهاد می شود که علاوه بر این که باعث فشردگی قابل توجه تصویر در زمان ارسال می شود، نتیجه ی کیفی مناسبی نیز در گیرنده خواهد داشت. در روش پشنهادی تصویر به نواحی ساختاری و بافتی تقسیم می شود و برای هر ناحیه بلوک های قابل حذفی که امکان بازسازی مناسبی در گیرنده با استفاده از روش های ترمیم دارند شناسایی و حذف می شوند و اطلاعات کمکی لازم جهت ترمیم بهتر از آنها استخراج می شود. این بلوک ها به همراه بلوک های غیرقابل حذف تصویر پس از کد شدن ارسال می شوند و در گیرنده پس از کدگشایی، بلوک های از دست رفته بازسازی و ترمیم می گردند تا در نهایت تصویر اولیه در گیرنده قابل استفاده باشد. ویژگی های روش پیشنهادی اولا متغیر بودن سایز بلوک های حذفی است که باعث فشردگی بیشتر می شود و ثانیا ارائه روش جدیدی جهت بازسازی بلوک های شامل لبه در گیرنده است که کیفیت بلوک های ترمیم شده ی این نواحی را افزایش می دهد.
    کلیدواژگان: ترمیم تصویر، فشرده سازی تصاویر، حذف هوشمندانه اطلاعات، کد کردن
  • یک روش جدید برای طبقه بندی نانوساختارها بر اساس آنالیز سری زمانی و منطق فازی
    نوشین بیگدلی *، مهندس حامد جباری صفحات 115-130
    میزان پراکندگی نانوذرات در نانوساختارها، از مهمترین شاخصهایی است که جهت تایید کارآیی روش های پیشنهادی در زمینه سنتز نانومواد بکار می رود. تصاویر میکروسکوپی الکترونی روبشی نانوذرات دارای اطلاعات ساختاری، شیمیایی و مورفولوژیکی با وضوح بالا در مقیاس نانومتری نانومواد میباشند. در این مقاله، یک الگوریتم جدید جهت طبقه بندی نانوساختارها با استفاده از این تصاویر ارائه شده است. بدین منظور، ابتدا تصاویر میکروسکوپی الکترونی روبشی نانوذرات به سری زمانی تبدیل شده و مشخصات آنها از طریق روش های آنالیز سری زمانی بررسی گردید. سپس ویژگی های آماری این سری ها استخراج شدند. ویژگی های استخراج شده به عنوان ورودی های یک سیستم استنتاج فازی برای طبقه بندی تصاویر میکروسکوپی نانوساختارها در سه گروه خوب، متوسط و بد در نظر گرفته شدند. این الگوریتم برروی 65 تصویر میکروسکوپی نانوذرات با ابعاد یکسان (250×250 پیکسل) اعمال گردیده و دقتی بالاتر از 90 درصد را به دنبال داشته است که بسیار مناسب است.
    کلیدواژگان: تصاویر میکروسکوپی الکترونی روبشی نانوذرات، آنالیز سری زمانی، ویژگی های آماری، منطق فازی
  • فروغ نجفی، محمد میکائیلی* صفحات 131-140
    سیستم های رابط مغز و کامپیوتر p300 speller به عنوان عضوی از خانواده سیستم های رابط مغز و کامپیوتر سعی دارد تا توانایی تایپ حروف و برقرای ارتباط با این شیوه را برای بیماران و معلولان فراهم آورد.یکی از موارد بسیار مهم در این سیستم ها قابلیت شخصی سازی می باشد.با توجه به آنکه اکثر پژوهش های این حوزه بر اساس نمایش حروف انگلیسی انجام شده است ،در این تحقیق سعی شده است تا برای اولین بار عملکرد یک سیستم ارتباط مغز و کامپیوتر p300 speller به ازای نمایش حروف زبان فارسی مورد سنجش قرار گیرد.در این پژوهش پس از ثبت داده از داوطلبین و سنجش عملکرد سیستم مورد بررسی ،صحت تشخیص 91.39% و نرخ انتقال اطلاعات 7.22 بیت در دقیقه به ازای 15 تکرار با طبقه بند خطی LDA بدست آمد.همچنین در این پژوهش اثر تغییر تعداد تکرار و کاهش زمان آزمایش نیز مورد بررسی قرار گرفت و نشان داده شد که به ازای حداقل تعداد تکرار 4 میتوان به صحت تشخیص 82.82% و نرخ انتقال اطلاعات 21.52 بیت بر دقیقه دست یافت.
    کلیدواژگان: سیستم های رابط مغز و کامپیوتر، سیستم p300 speller BCI، طبقه بند خطی LDA، مولفه p300
  • رفع اعوجاج هندسی متون به کمک اطلاعات هندسی خطوط متن
    علیرضا احمدی فرد*، مجمد امین طلوع بیدختی صفحات 141-158
    تصاویر سند تهیه شده توسط اسکنر یا دوربین دیجیتال، همواره با اعوجاج های فتومتریک و هندسی همراه هستند. وجود هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم افزارهای شناسایی نویسه ها OCR می شوند. در این مقاله روشی نوین جهت رفع اعوجاج های هندسی از تصاویر متنی ارائه شده است. در روش پیشنهادی به منظور تصحیح اعوجاج هندسی، در ابتدا خطوط متن از تصویر استخراج می شود و سپس هر خط متن به ستون هایی به عرض مساوی شکسته می شوند. برای هر قطعه استخراج شده از یک خط، راستای قطعه به نحوی تصحیح می گردد که حروف موجود در آن قطعه در راستای افقی قرار گیرد. برای این منظور به ازای چرخش های مختلف قطعه ی متن، افکنش افقی تصویر محاسبه می شود و چرخشی از قطعه که بلندترین قله افکنش را ایجاد کند، راستای تصحیح شده آن قطعه در نظر گرفته می شود. بر این اساس یک نقطه مرجع که معرف راستای مبنا است، برای هر قطعه خط هم راستا شده با افق استخراج می گردد. به کمک نقاط مرجع، هر قطعه از خط، انحنای آن خط متن به کمک برازش یک تابع درجه ی سه به دست می آید. درنهایت با استفاده از تخمین تبدیل پرسپکتیو، اعوجاج هندسی هر خط برطرف می گردد. جهت افزایش پایداری روش پیشنهادی در تخمین انحنای خطوط متن با طول کم، از انحنای خطوط با طول بزرگ تر مجاور آن خط استفاده شده است.
    روش پیشنهادی بر روی پایگاه های داده ی فارسی و انگلیسی پیاده سازی شده و با برخی روش های هم تراز آن مقایسه گردیده است. نتایج بیانگر قدرت و دقت روش پیشنهادی در رفع اعوجاج هندسی می باشد.
    کلیدواژگان: اعوجاج هندسی، پردازش دوبعدی اسناد، تخمین تبدیل پرسپکتیو، نویسه خوان نوری
  • آرش چاقری *، محمدرضا فیضی درخشی صفحات 159-169
    الگوریتم رقابت استعماری (ICA)، یکی از کاراترین الگوریتم های فرا ابتکاری برای پیدا کردن جواب بهینه سراسری در مسائل بهینه سازی می باشد. در این مقاله از الگوریتم رقابت استعماری برای خوشه بندی خودکار مجموعه داده های بزرگ و واقعی بدون برچسب استفاده شده است. با بهره گیری از ساختار مناسب برای هر یک از کروموزم ها و استفاده از الگوریتم رقابت استعماری، در زمان اجرا تعداد بهینه خوشه ها هم زمان با خوشه بندی بهینه داده ها به دست می آید. همچنین برای افزایش دقت و افزایش سرعت همگرایی، ساختار الگوریتم رقابت استعماری با تغییراتی همراه است. روش پیشنهادی (ACICA) نیاز به هیچ گونه دانش قبلی برای خوشه بندی داده ها ندارد. علاوه بر آن روش پیشنهادی در مقایسه با سایر روش های خوشه بندی مبتنی بر الگوریتم های تکاملی، دقت بیشتری را دارد. از معیارهای ارزیابی خوشه بندی DB و CS به عنوان تابع هدف استفاده شده است. برای نشان دادن برتری روش پیشنهادی، میانگین مقدار بهینه تابع هدف و تعداد خوشه های تعیین شده توسط روش پیشنهادی با سه الگوریتم خوشه بندی خودکار مبتنی بر الگوریتم های تکاملی مقایسه می شود.
    کلیدواژگان: خوشه بندی تفکیکی، خوشه بندی خودکار، الگوریتم رقابت استعماری
|
  • Online Persian Hand Writing Recognition Using Language Model and Reduction of User Writing Rules
    Salman Maskanati, Ahmad Keshavarz Pages 3-24
    The Joint-up and cursive form of Persian words and immense variety of its scripts and also different figures of Persian letters which depend on their sitting positions in the words have turned the Persian handwritings recognition to an intense challenge. The major obstacle of most often recognition ways is their inattention to sentence contexture, causes utilization of a word with correct appearance within an incorrect sentence all when input word is misrecognized. Sketching a solution that provides suitable analysis of sentence contexture requires huge linguistic resources to takes place as a fine representative for the chosen language to be recognized. In this article, a new method for Persian words online recognition is presented which tries to improve recognition process by using the term contexture. Also, to reduce the limits and rules that gainers compel to submit. The recognition method demonstrated in this article includes: the symptoms and morphemes framework of input handwritten are segregated and the framework of each morpheme with its symptoms is specified at first, then the symptoms of morphemes are specified and based on them a collection of words is being considered as a hypothesis. Each hypothesis is given a score by measuring its similarity to input handwritten and according to taken scores the likely hypothesizes are indicated. Then this procedure is led to achieve more likely hypothesizes by lingual model. To totalize the scores of a hypothesis, for the reason of the differences in scale of taken scores, a method of scores normalization is being offered. The test results demonstrate that by utilization of a language model with an online system of handwriting recognition, a significant reduction of words recognition error rate is being achieved. In addition of error rate reduction, by taking advantage of language model, a technique is being offered that can handle the Persian vocabulary recognition entirely. By availing the offered manner, the recognition precision at initial stage of letters level up to 95.9% and so the language model recognition up to 99.3% improved. So using a huge linguistic resources for Persian language and utilization of a language model, can improved the accuracy of recognition. For furture work, reinforcement learning algorithm is suggested for adaptation the algorithm to users.
    Keywords: Online Recognition, Persian Handwriting, k-nearest Neighbor, Language Model, User Limitation
  • classification of Cardiac Arrhythmias based on combination of the results of Neural Networks using Dempster-Shefer Evidence Theory
    Dr. Jamal Ghasemi*, Somayeh Kord, Dr. Mohammad Gholami Pages 25-42
    Cardiac arrhythmias are one of the most common heart diseases that may cause the death of the patient. Therefore, it is extremely important to detect cardiac arrhythmias. 3 categories of arrhythmia, namely, PAC, PVC, and normal are considered in this paper based on classifier fusion using evidence theory. At first R peaks of ECG were identified. Then, the line features including ECG RMSSD, SDNN and HR Mean, and also non-linear characteristics were obtained by using SVD. The combination of these features results is given in MLP, Cascade Feed Forward and RBF neural networks. Next the principle of uncertainty about their response was checked, and finally, the results of these classifiers were combined by applying evidence theory. ECG processing is not needed to remove noise, however, the proposed method, in the presence of noise, is able to detect the cardiac arrhythmia, in best situation with 98% sensitivity.
    Keywords: Electrocardiogram signal, classifier, Neural Network, Dempster-Shafer Theory
  • Modified Nonparametric Discriminant Analysis for Classification of Hyperspectrl Images With Limited Training Samples
    Azadeh Kianisarkaleh, Professor Mohammad Hassan Ghassemian* Pages 43-58
    Feature extraction performs an important role in improving hyperspectral image classification. Compared with parametric methods, nonparametric feature extraction methods have better performance when classes have nonnormal distribution. Besides, these methods can extract more features than parametric feature extraction methods do. Nonparametric feature extraction methods use nonparametric scatter matrices to compute transformation matrix. Nonparametric Discriminant Analysis (NDA) is one of the nonparametric feature extraction methods in which, in order to form nonparametric scatter matrices, local means of samples and weight function are used. Local mean is calculated by k nearest neighbors of each sample and weight function emphasizes on boundary samples in between class scatter matrix formation. In this paper, modified NDA (MNDA) is proposed to improve NDA. In MNDA, the number of neighboring samples, when measuring local mean, are determined considering position of each sample in feature space. MNDA uses new weight functions in scatter matrix formation. Suggested weight functions emphasizes on boundary samples in between class scatter matrix formation and focus on samples close to class mean in within class scatter matrix formation. Moreover, within class scatter matrix is regularized to avoid singularity. Experimental results on Indian Pines and Salinas images show that MNDA has better performance compared to other parametric and nonparametric feature extraction methods. For Indian Pines data set, the maximum average classification accuracy is 80.34%, which is obtained by 18 training samples, support vector machine (SVM) classifier and 10 extracted features achieved by MNDA method. For Salinas data set, the maximum average classification accuracy is 94.31%, which is obtained by 18 training samples, SVM classifier and 9 extracted features achieved by MNDA method. Experiments show that using suggested weight functions and regularized within class scatter matrix, the proposed method obtained better results in hyperspectrl imag classification with limited training samples.
    Keywords: Hyperspectral images, Feature extraction, Supervised classification, Hughes Phenomenon, Limited training samples
  • A New Approach for Extracting Named Entity in Classical Arabic
    Seyed Mohammad Bagher Sajadi*, Hassan Rashidi, Behrooz Minaei Bidgoli Pages 59-74
    In Natural Language Processing (NLP) studies, developing resources and tools makes a contribution to extension and Effectiveness of researches in each language. In recent years, Arabic Named Entity Recognition (ANER) has been considered by NLP researchers. While most of these researches are based on Modern Standard Arabic (MSA), in this paper, we focus on Classical Arabic (CA) literature. We propose a corpus called NoorCorp with 200k labeled words for research purposes which is annotated by expert human resources manually. We also collected about 18k proper names from old Hadith books as gazetteer which is called NoorGazet. Using ensemble learning, we develop a new approach for extraction of named entities (NEs) including person, location and organization. Adaboost.M2 algorithm, as implementation of multiclass Boosting method, is applied to train the prediction model. Results show that performance of the method is better than decision tree as the base classifier. We have used tokenizing, part of speech (POS) tagging, and base phrase chunking (BPC) to overcome linguistic obstacles in Arabic. An overall F-measure value of 86.85 is obtained. Finally, the proposed approach is applied on ANERCorp as MSA corpus and we have compared the results with NoorCorp.
    Keywords: Named entity recognition (NER), Ensemble learning, Boosting method, Classical Arabic Language
  • Genetic algorithm with intelligence chaotic algorithm and heuristic multi-point crossover to graph coloring problem
    Seyyed Ali Sadati Tileboni, Hamid Jazayeriy*, Mojtaba Valinataj Pages 75-96
  • Image Compression Based on Intelligent Information Removing and Inpainting Reconstruction Algorithms
    Dr. Ali Jamshidi*, Dr. Mehran Yazdi, Maryam Manafi Pages 97-114
    Compression can be done by lossy or lossless methods. The lossy methods have been used widely than the lossless compression. Although, many methods for image compression have been proposed yet, the methods using intelligent skipping proper to the visual models has not been considered in the literature. Image inpainting refers to the application of sophisticated algorithms to replace lost or corrupted parts of the data so that visual difference cannot be inferred from the reconstructed image. In this paper, first we review some of the image inpainting algorithms and some of the image compression techniques using the inpainting algorithms, we propose a new inpainting based image compression algorithm that can improve the compression rate considerably. Simulation results show that our proposed method has reasonable visual quality in comparison with the other proposed image compression algorithms.
    Keywords: Image Inpainting, Image Compression, Intelligent Information Removing, Coding
  • A New Method for Classification of Nano-Structures based on Time Series Analysis and Fuzzy Logic
    Dr Nooshin Bigdeli, Hamed Jabbari Pages 115-130
    The degree of particles dispersion in the nanostructures is of the most important indicators used to verify the performance of the proposed methods in the synthesis of nanomaterials. Scanning electron microscopy (SEM) images of nanoparticles have structural, chemical and morphological information in nano-meters with high resolution. In this paper, classification of nanostructures using time series analysis and statistical features is presented. To reach this, SEM images were converted to the time series, and their statistical features were extracted from them. These features were fed to a fuzzy inference system as its inputs to classify the images of nanostructures as good, average and bad structures. The obtained results for 65 SEM images of nanoparticles with the same dimensions (250 × 250 pixels) showed more than 90% accuracy.
    Keywords: SEM image of nanoparticles, Time series analyses, Statistical features, Fuzzy logic
  • Foroogh Najafi, Dr Mohammad Mikaeili* Pages 131-140
    BCI P300 speller as a Brain computer interface system try to help disabled people and patients to regain some of their lost ability and help them to communicate via typing. The ability of personalization is one of the most important feature in BCI system. The typing language as a personalization factor is one of the most important feature in BCI systems. Most prior research on p300 spellers has focused on displaying English alphabet.in this research, we present a P300 Speller system, based on row or column paradigm, for Persian (Farsi) character input.as performance determination we calculated accuracy and bit rate for the said system based on recorded data from volunteers and reached the average accuracy of 91.39 % and bit rate of 7.22 (bits/minute) (we uses Linear LDA classifier for classification and the total trial number was set to 15). Furthermore in this research performance was measured for different trial number and final results demonstrated that this system can achieve high average accuracy of 82.82 % and average bit rate of 21.52 (bits/minute) by using only 4 repetitions.
    Keywords: Brian computer interface systems, BCI p300 speller, p300 wave, LDA classifier
  • Removing Geometrical Distortion of Documents using Geometry of text lines
    Dr Alireza Ahmadyfard*, Mohammad Amin Tolou Beidokhti Pages 141-158
    Document images produced by scanner or digital camera, usually have geometric and photometric distortions. Existence of either type of distortion, deteriorate the performance of OCR systems. In this paper, we present a novel method to eliminate geometric distortion from document images. In the proposed method to eliminate the geometric distortion,first text lines are extracted from image, then each line is broken into equal-width columns. For each extracted segment from a line, its direction is corrected in such a way that the segment lies in horizontal direction. For this aim, for each different rotation of text segment, horizontal projection of its image is calculated and rotation which causes maximum of projection is considered as corrected direction of that segment and based on this, for each line segment parallel to horizon, a reference point, which is introduced as base direction, is extracted. Using reference points of each line segment, a polynomial is fitted to the text line. At the end, geometric distortion of each part of a text line is eliminated using a perspective transform which is estimated based on the extracted polynomial function. To increase the stability of the proposed method for short text lines, the curve fitting is performed using reference information for adjacent long lines. The proposed method is implemented on Persian and English databases and has been compared with the existing methods. The results indicate the efficiency and accuracy of the proposed method in elimination of geometric distortions.
    Keywords: Geometric distortion, documents processing, perspective Transform, Optical character recognition (OCR)
  • Arash Chaghari*, Mohammad-Reza Feizi-Derakhshi Pages 159-169
    Imperialist Competitive Algorithm (ICA) is considered as prime meta-heuristic algorithm to find the general optimal solution in optimization problems. This paper presents a use of ICA for automatic clustering of huge unlabeled data sets. By using proper structure for each of the chromosomes and the ICA, at run time, the suggested method (ACICA) finds the optimum number of clusters while optimal clustering of the data simultaneously .To increase the accuracy and speed of convergence, the structure of ICA changes. The proposed algorithm requires no background knowledge to classify the data. In addition, the proposed method is more accurate in comparison with other clustering methods based on evolutionary algorithms. DB and CS cluster validity measurements are used as the objective function. To demonstrate the superiority of the proposed method, the average of fitness function and the number of clusters determined by the proposed method is compared with three automatic clustering algorithms based on evolutionary algorithms.
    Keywords: Partitional Clustering, Automatic Clustering, Imperialist Competitive Algorithm (ICA)