فهرست مطالب

ماشین بینایی و پردازش تصویر - سال چهارم شماره 2 (پاییز و زمستان 1396)

نشریه ماشین بینایی و پردازش تصویر
سال چهارم شماره 2 (پاییز و زمستان 1396)

  • تاریخ انتشار: 1396/11/15
  • تعداد عناوین: 6
|
  • گل نوش حامدنژاد، حسین پورقاسم * صفحات 1-17
    بیماری هایی چون دیابت، فشار خون بالا و اختلال هایی با منشا مغزی بر عروق شبکیه ی چشم انسان تاثیر می گذارند. با استفاده از طبقه بندی عروق شبکیه به دو گروه سرخرگ و سیاهرگ، می توان وجود و میزان پیشرفت بیماری ها را ارزیابی نمود. در این مقاله، یک الگوریتم تفکیک عروق خونی شبکیه براساس ویژگی های ساختاری، جهتی و فرکانسی و بهینه سازی ویژگی مبتنی بر الگوریتم ژنتیک تاگوچی ارائه شده است. برای این منظور، با هدف طبقه بندی رگ ها در تصاویر فوندوس ، ابتدا عروق ناحیه بندی و جداسازی می شوند. در این الگوریتم، جهت استخراج اطلاعات هم زمان مربوط به جهت، قطر و رفتار دینامیکی انحناء رگ، ویژگی های جدیدی برپایه ی تبدیل موجک گسسته با بهره گیری از مفهوم آنتروپی در ضرایب موجک گسسته و روش آنتروپی موجک جهتی و تبدیل فوریه با کمک توصیفگرهای فوریه ارائه شده است. همچنین ویژگی دوبعدی قطاع های تشابه فرکانسی جهت بیان و استخراج تغییرات ضخامت و راستای رگ معرفی شده است. پس از استخراج بردار ویژگی، با استفاده از مدل ترکیبی الگوریتم ژنتیک همراه با استراتژی تاگوچی ویژگی های بهینه انتخاب می شوند. سپس با بهره گیری از طبقه بند شبکه عصبی چندلایه، عروق به دو کلاس سرخرگ و سیاهرگ طبقه بندی می شوند. درنهایت، نرخ صحت 82/09% و نرخ دقت 81/58% به طور هم زمان در کلاس بندی عروق شبکیه ی چشم بر روی یک پایگاه داده تصاویر فوندوس شبکیه چشم شامل 40 تصویر حاصل می گردد.
    کلیدواژگان: ویژگی ساختاری، ویژگی های فرکانسی و جهتی، طبقه بندی رگ های شبکیه ی چشم، الگوریتم ژنتیک تاگوچی
  • عباس مهبد *، حسین کریمیان صفحات 19-34
    در بررسی عملکرد حسگر تصویر هوشمند، کاهش توان مصرفی سیستم تصویربرداری و افزایش ضریب فضای موثر هر سلول، اهمیت فراوان دارد؛ در این تحقیق با تعریف دو حالت کاری مجزا به منظور پردازش فریم های مختلف و همچنین طراحی و پیاده سازی واحد مدیریت توان در ساختار اصلی سیستم تصویربرداری، حجم پردازش اطلاعات اضافی در بررسی فریم های کم-اهمیت به میزان چشمگیری کاهش یافته است که نتیجه ی آن کاهش توان مصرفی در سیستم های تصویربرداری مبتنی بر تشخیص حرکت خواهد بود. همچنین ارائه ی ساختاری نوین در طراحی هر سلول، زمینه ساز افزایش قابل توجه ضریب فضای موثر در سطح هر پیکسل شده است. بطوریکه ولتاژ مربوط به هر سلول در بررسی فریم های متوالی، صرفا از طریق یک مسیر خروجی و به صورت سری در اختیار واحد تشخیص حرکت قرار می گیرد. نتایج شبیه سازی نشان می دهد که در پیاده سازی آرایه ای از پیکس ل ها با ابعاد 64×64 و بهره گیری از تکنولوژی CMOS استاندارد 180 نانومتر، توان مصرفی حسگر پیشنهادی تحت تصویربرداری با نرخ 100 فریم بر ثانیه معادل با 2/. میلی وات و ضریب فضای موثر هر سلول برابر با 45% خواهد بود.
    کلیدواژگان: حسگر تصویر هوشمند، توان مصرفی پایین، افزایش ضریب فضای موثر، تشخیص حرکت، سنسور تصویر
  • سمیه برومند، مجید ایرانپور مبارکه * صفحات 35-47
    بازشناسی کلمات دست نوشته و تبدیل آن به متن تایپی معادل می تواند در تفسیر دست نوشته و جستجو در اسناد بسیار حائز اهمیت باشد. در این مقاله سیستمی به منظور تشخیص برون خط دست نوشته فارسی در یک فرهنگ لغت محدود معرفی شده است. به منظور استخراج ویژگی، بعد از بلوک بندی تصویر ورودی و استخراج مرکز هر بلوک توسط مرکز ثقل، میانگین مرکز اجزای متصل از الگوریتم سیفت متراکم استفاده شده است. از روش آنالیز تفکیک کننده خطی برای کاهش تعداد ویژگی ها استفاده شده است. در این مقاله، در مرحله نخست کلمات موجود در فرهنگ لغت بر اساس شباهت با استفاده از الگوریتم ISOCLUSE به همراه الگوریتم سلسله مراتبی خوشه بندی شده است. میانگین هر خوشه در فضای ویژگی به عنوان نماینده آن خوشه و مدخل مشترک اعضای آن خوشه در فرهنگ لغت تصویری، در نظر گرفته شده است. در مرحله دوم به منظور بازشناسی کلمه ی جدید از کلمات کاندید، از روش ماشین بردار پشتیبان به صورت چندکلاسه و دو کلاسه استفاده شده است. نتایج بدست آمده نشان دهنده عملکرد بهتر روش ماشین بردار پشتیبان دو کلاسه از لحاظ سرعت و دقت بر روی مجموعه داده ایران شهر می باشد. در مرحله بازشناسی با انتخاب 5 خوشه نزدیک به کلمه دست نوشته مورد آزمون با دقت 93.37% حدود 76.65% از کلمات مورد بررسی کاهش خواهد یافت.
    کلیدواژگان: تشخیص کلمه دست نوشته، آنالیز تفکیک کننده خطی، سیفت متراکم، کاهش فرهنگ لغت، الگوریتم خوشه بندی ISOCLUSE، کلاس بند ماشین بردار پشتیبان دوکلاسه
  • سینا توسن، ناصر مهرشاد *، کاظم قائمی صفحات 49-57
    آشکارسازی دقیق و به موقع ناحیه تومور مغزی در انتخاب نوع درمان، میزان موفقیت آن و دنبال کردن روند بیماری در طول درمان تاثیر بسیار بالایی دارد. الگوریتم های موجود برای تشخیص تومور مغزی از نظر عملکرد خوب روی تصاویر مغزی متنوع با کیفیت های مختلف، حساسیت پایین نتایج به پارامترهای معرفی شده در الگوریتم و نیز تشخیص مطمئن تومورها در مراحل اولیه شکل گیری با مشکلاتی مواجه هستند. در این تحقیق یک روش بخش بندی دو مرحله ای برای آشکارسازی دقیق ناحیه تومور در تصاویر تشدید مغناطیسی مغز ارائه شده است. در مرحله اول پس از انجام پیش پردازش های لازم روی تصویر، موقعیت تومور با استفاده از یک روش بخش بندی مبتنی بر آستانه مکان یابی می شود و در مرحله دوم، به عنوان نشان گر در یک روش بخش بندی حوضچه مبتنی بر نشان گر مورد استفاده قرار می گیرد. با توجه به اینکه در مرحله اول تاکید زیادی بر آشکارسازی دقیق ناحیه تومور نیست، انتخاب مقادیر آستانه در بازه بزرگی از مقادیر، در نتایج نهایی تاثیری نخواهد داشت. در مرحله دوم، استفاده از روش بخش بندی حوضچه مبتنی بر نشان گر، آشکارسازی دقیق ناحیه تومور را به دنبال خواهد داشت. نتایج پیاده سازی ها نشان می دهند که روش پیشنهاد شده برای آشکارسازی دقیق ناحیه تومور در بازه بزرگی از تغییرات پارامترهای ورودی نتایج یکسان و دقیقی را به دنبال دارد.
    کلیدواژگان: تومور مغزی، تصویر MRI، بخش بندی دومرحله ای، تبدیل حوضچه
  • بهرام افرا، هادی گرایلو * صفحات 59-73
    یکی از روش های تشخیص هویت افراد، امضا یا دست خط هر فرد می باشد. در این مقاله روشی برای تشخیص امضای یک فرد بر مبنای اطلاعات پویای موجود در ویدئوی دست فرد امضاکننده در حین امضا ارائه شده است. روش پیشنهادی شامل چهار مرحله است. در مرحله اول تصویر پیش زمینه که شامل دست و قلم فرد امضاکننده است، در هر فریم استخراج می شود. در مرحله بعد مختصات نوک قلم تصویر پیش زمینه در هر فریم تعیین می شود تا بتوان شکل امضا را با پیوند دادن این نقاط تشکیل داد. در این مرحله روشی برای تشخیص و رفع خطا در یافتن مختصات نوک قلم ارائه شده است. در مرحله سوم، تعدادی ویژگی مربوط به شکل امضا و تصویر انرژی حرکتی از امضای هر فرد استخراج می شود. در مرحله آخر مدل امضای هر فرد تشکیل می شود که توسط آن امضاهای اصلی از جعلی تمیز داده شود. به منظور آزمایش روش پیشنهادی از پایگاه داده ای که در کار این مقاله تهیه شده و شامل امضاهای 50 فرد است استفاده می شود. از 13 امضای اصلی هر فرد برای آموزش و تشکیل مدل امضا و از 8 امضا اصلی دیگر و 8 امضای جعلی برای آزمایش روش پیشنهادی استفاده می شود. دقت و نرخ خطای برابر،معیارهای ارزیابی کمی روش پیشنهادی هستند. مقادیر این دو معیار برای روش پیشنهادی به ترتیب 95/02 و 3/8 درصد به دست آمده است.
    کلیدواژگان: تشخیص برخط امضا، ردیابی نوک قلم، استخراج ویژگی های پویا، تبدیل موجک، تصویر انرژی حرکتی
  • هدا نعمت، علی محلوجی فر *، علی گویا، نسرین احمدی نژاد صفحات 75-89
    سرطان پستان، دومین عامل مرگ ومیر زنان در جهان محسوب می شود و به دلیل ناشناخته بودن علت این بیماری، تنها روش کنترل آن شناسایی و تشخیص زودهنگام است. مهمترین روش تشخیص سرطان پستان، نمونه برداری از بافت مشکوک و انجام آزمایش های آسیب شناسی است. از آنجا که انجام این روش تهاجمی بوده و در اکثر موارد غیرضروری می باشد، به همین جهت محققان در تلاش اند تا با ارائه سیستم های تشخیصی کمک-رایانه ای با قابلیت اطمینان بالا، تعداد نمونه برداری های غیرضروری را کاهش دهند. این سیستم ها از چهار بخش پیش پردازش، ناحیه بندی، استخراج و انتخاب ویژگی، و کلاس بندی تشکیل می شوند و ابزاری سودمند برای تشخیص سرطان پستان هستند. در این پژوهش به منظور طبقه بندی توده های پستان به دو گروه خوش خیم و بدخیم، پس از پیش پردازش تصاویر، به ناحیه بندی آنها و تعیین مرز توده، با ترکیب دو رویکرد دستی و کامپیوتری، پرداخته شده است. در مرحله بعد 827 ویژگی شامل 24 ویژگی ریخت شناسی مبتنی بر شکل و 803 ویژگی ریخت شناسی مبتنی بر مرز از هر تصویر استخراج شده که 604 ویژگی از آنها به تازگی در این پژوهش ارائه شده اند. پس از آن با استفاده از کلاسبند رگرسیون لجستیک تنک به حذف ویژگی های نامرتبط و کلاس بندی تصاویر پرداخته شده است. پایگاه داده مورد استفاده در این پژوهش شامل 104 تصویر سونوگرافی از توده های پستان (72 تصویر مربوط به توده های خوش خیم و 32 تصویر مربوط به توده های بدخیم) است که با اعمال الگوریتم پیشنهادی به این تصاویر،نوع توده با صحت %89/42، حساسیت %78/13 و دقت %94/44 تشخیص داده شده است.
    کلیدواژگان: تصاویر اولتراسوند، رگرسیون لجستیک، سیستم تشخیصی کمک، رایانه ای، کلاس بندی
|
  • Golnoush Hamednejad, Hossein Pourghassem * Pages 1-17
    Human diseases such as diabetes, high blood pressure and the cerebral source disorders have effects on the retina vessels of human’s eyes. By classifying the retina vessels as two sets of arteries and veins, it can be evaluated the progress and symptoms of mentioned diseases. In this paper, a retinal blood vessel classification algorithm based on structural, directional and frequency features along with feature optimization using Tagouchi genetic algorithm is proposed. For this purpose, to classify the vessels in fundus images, at first the vessels are segmented. In this algorithm, to extract simultaneously information related to direction, diameter and dynamical behavior of the blood vessel, a novel feature based on wavelet transform using entropy contents of DWT and Directional Wavelet Entropy (DWE), Fourier transform using Fourier descriptors have been presented. Also 2-D Frequency Similarity Sectors (2DFSS) is introduced to represent and describe the variations of thickness and direction of the blood vessel. After extracting the feature vector using hybrid model of Genetic algorithm and Tagouchi strategy, the optimal features are selected. Then by employing the multi-layer neural network classifier, the vessels are recognized into arteries and veins classes. With these represented attributes, the classification is performed based on the structure and direction of vessels. Ultimately, the accuracy rate of 82.09% and precision rate of 81.58% are simultaneously obtained in problem of the retinal vessel recognition on a database consisting of 40 images.
    Keywords: Structural feature, frequency, directional features, retinal blood vessel classification, Taguchi genetic algorithm
  • Abbas Mahbod *, Hossein Karimiyan Pages 19-34
    Power consumption and fill factor improvement are known as the vitally important parameters in evaluating smart image sensors. In this paper, due to considering two different operation modes in processing different frames, and also designing power management unit, the amount of redundant data processed in unimportant frames has been reduced significantly, and therefore the proposed imaging system consumes less power compared with counterpart imagers. Furthermore, a novel pixel structure is introduced that outputs two consecutive frame voltages in series, with the result that the pixel size is minimized and a higher fill factor is achieved. The performance of this technique is demonstrated using a 64×64 pixel sensor designed in a 0.18µm standard CMOS technology. The sensor chip consumes 0.2mW of power while operating at 100fps with a fill factor of 45%.
    Keywords: Smart image sensor, Low power consumption, High fill factor, Motion detection, CMOS imager
  • Somayeh Boroumand, Majid Iranpourmobarakeh * Pages 35-47
    Handwritten word recognition (HWR) is very important in document analysis and retrieval. In this paper, an off-line handwritten recognition system for Persian manuscript is introduced. For feature extraction, SIFT descriptors extracted densely from the block of word image and enriched by appending the normalized x and y coordinates and the scale they were extracted at. Linear discriminate analysis (LDA) is used for feature reduction. All words in the dictionary were hierarchically clustered by ISOCLUSE algorithm. In order to recognize the word images, multiple-class and two-class SVM classifiers methods were used. The experimental results showed a better performance in terms of speed and precision of two-class SVM method on the Iranshahr data set. The accuracy of proposed system by select 5 top cluster is shown 93.37% by 76.65% reduction of lexicon.
    Keywords: Handwritten word recognition, Linear Discriminant Analysis (LDA), Dense Sift, Lexicon Reduction, ISOCLUS
  • Sina Tosan, Nasser Mehrshad *, Kazem Ghaemi Pages 49-57
    Accurate and timely detection of brain tumor can help patients to choose the kind of treatment and follow-up process and also has a very high impact on the treatment success rate. In this study, a two- phase segmentation method for accurate detection of tumor in the brain magnetic resonance images is provided. In the first stage, after performing the necessary pre-processing schemes on the image, location of the tumor using a threshold-based segmentation method is characterized and secondly, in a marker-based watershed segmentation method is used. Given that in the first stage is not too much emphasis on accurate detection of the tumor area, selecting the threshold values in a wide range of values, will not affect the final results. In the second stage, marker -based segmentation method will lead to accurate detection of the tumor area. The implementation results show that the proposed method in a wide range of input parameters leads to the same accurate results.
    Keywords: Brain tumor, MRI image, two-phase segmentation, watershed transform
  • Bahram Afra, Hadi Grailu * Pages 59-73
    Signature is one of the personal identification methods. In this paper we have proposed a signature identification approach which is based on using dynamic information of signature video. It composes of four stages. First, the foreground image is extracted. Second the signature shape is obtained by detecting and tracking the pen tip in each frame. The pen tip detection error rate is decreased using a proposed modification. Third, some features based on energy motion image are calculated. At the last stage, the signature model is formed which is used in signature identification procedure. We have generated a signature video database of 50 persons to evaluate the proposed method. The number of 13 signatures of each person are used for training. In addition 8 genuine and 8 fake signatures are used for testing purposes. The Accuracy and Equal Error Rate measures areobtained as 95.02% and 3.8% respectively
    Keywords: Online Signature Verification, Pen Tip Tracking, Extraction of Dynamic Features, Wavelet transform, Motion Energy Image
  • Hoda Nemat, Ali Mahloojifar *, Ali Gooya, Nasrin Ahmadinejad Pages 75-89
    Breast cancer is the second leading cause of death for women all over the world and since the cause of the disease remains unknown, the only method for controlling it is its early detection and diagnosis. The most prominent method for the treatment of breast cancer is biopsy and pathological tests. As the mentioned treatments are invasive and are, in many cases, unnecessary, researchers are in search for high-reliability computer-aided diagnostic systems in order to decrease the number of unnecessary biopsies. These systems consist of four major parts: preprocessing, segmentation, feature extraction and selection, and classification which are beneficial tools for diagnosis of breast cancer. In the present study in order to classify the breast tumors into benign and malignant, borders of the tumors are identified after image preprocessing using with a combination of manual and computerize approaches. In the next stage, 827 features, consisting of 24 shape-based morphological features and 803 border-based morphological features, have been extracted from each image, which 604 of them are recent features added in the present study. Subsequently, a sparse logistic regression classifier was used to eliminate the irrelevant features and classify the images. The data base used in the current study includes 104 Sonography images from breast tumors (72 from benign and 32 from malignant tumors). By applying the suggested algorithm in the present study to images, type of tumors was identified with 89.42% accuracy, 78.13% sensitivity, and 94.44% precision.
    Keywords: Classification, computer-aided diagnostic system, Logistic Regression, ultrasound images