فهرست مطالب

ماشین بینایی و پردازش تصویر - سال ششم شماره 1 (بهار و تابستان 1398)

نشریه ماشین بینایی و پردازش تصویر
سال ششم شماره 1 (بهار و تابستان 1398)

  • تاریخ انتشار: 1398/05/01
  • تعداد عناوین: 6
|
  • رویا راد*، منصور جم زاد صفحات 1-17
    امروزه با رشد تکنولوژی های ثبت و به اشتراک گذاری تصاویر، تعداد تصاویر دیجیتال افزایش چشمگیری یافته است. مدیریت این حجم از داده های تصویری به سامانه ای کارآمد جهت مرور، دسته‎بندی، جستجو و بازیابی نیاز دارد. سامانه های بازیابی تصاویر در نسل های جدید یک عبارت معنایی را معمولا به صورت یک یا چند کلمه کلیدی از کاربر گرفته، به دنبال بازیابی تصاویری با محتویات بصری مرتبط با آن معنا هستند. داشتن مکانیزمی که بتواند به صورت خودکار محتوای یک تصویر را مانند انسان به صورت متنی توصیف کند به کارایی این سامانه ها کمک زیادی می نماید. برچسب زنی خودکار تصاویر یک روش تخصصی برای بیان محتوای تصاویر به صورت کلمات کلیدی یا برچسب است. سامانه های برچسب زنی خودکار رابطه بین معنای یک متن و ویژگی های سطح پایین یک تصویر را با تکنیک های یادگیری ماشین بررسی کرده، به صورت خودکار به تصاویر چندین برچسب نسبت می دهند تا امکان جستجو و بازیابی مبتنی بر محتوای آن ها بهتر فراهم شود. در این مقاله به بررسی مراحل مختلف پیاده سازی یک سامانه برچسب زنی خودکار خواهیم پرداخت و کارهای پیش رو را مرور کرده، مشکلات و چالش های موجود برای طراحی این سامانه ها را خواهیم دید. همچنین به معرفی چند پایگاه داده مناسب جهت بررسی و آزمودن سامانه های برچسب زنی خودکار خواهیم پرداخت.
    کلیدواژگان: برچسب زنی خودکار تصاویر، حاشیه نویسی، بازیابی تصویر، استخراج ویژگی
  • علی اصغر شریفی نجف آبادی، فرح ترکمنی آذر* صفحات 19-30
    تحلیل مولفه های اصلی یکی از روش های مطرح به منظور کاهش ابعاد مجموعه داده است که برای داده های یک بعدی و دوبعدی قابل استفاده است. با توجه به تنک نبودن بردارهای پایه ، تحلیل مولفه های اصلی تنک مطرح گردیده است که با حفظ خواص تحلیل مولفه های اصلی استاندارد، بعضی از درایه های بردارهای پایه را صفر می کند. در این مقاله، با توجه به خاصیت تنکی بردارهای پایه، که سبب بی تاثیر گشتن بعضی از مقادیر مجموعه داده در انتقال به فضای جدید می گردد، دو آلگوریتم به منظور حذف افزونگی از داده های خام، در حالت یک بعدی و دوبعدی ارائه شده است. در الگوریتم یک بعدی، افزونگی بین درایه های سیگنال تشخیص و سپس از تمامی مشاهدات مجموعه حذف می شوند. در الگوریتم دوبعدی اهمیت سطر وستون های تصاویر مجموعه داده، تشخیص و سطر وستون های با اهمیت کمتر به طور مستقیم از داده های خام حذف می شوند. یکی از مهمترین مزیت آلگوریتم های پیشنهادی که به عنوان روش های نمونه برداری غیریکنواخت نیز میتوانند خوانده شوند، حفظ ظاهر سیگنال ها می باشد. پس از حذف افزونگی داده های خام توسط دو الگوریتم ارائه شده، می توان از داده های جدید با ابعاد کمتر در کاربردهای دیگری همچون بازشناسی مجموعه داده، فشرده سازی و... استفاده کرد
    کلیدواژگان: حذف افزونگی از داده های خام، تحلیل مولفه های اصلی تنک، تحلیل مولفه های اصلی دوبعدی دوطرفه تنک، استخراج ویژگی
  • ساجد رخشانی، عصمت راشدی*، حسین نظام آبادی پور صفحات 31-46
    در این مقاله، روشی بر اساس یادگیری ژرف برای برجسته کردن شناسه ها و خواندن پلاک خودروهای ایرانی ارائه شده است. پژوهش حاضر برای ارتقای تصویر و برجسته کردن تصویر پلاک بجای استفاده از روش های متداول ارتقای تصویر از شبکه های عصبی همگشتی با ساختار رمزگذار-رمزگشا استفاده می کند. شبکه پیشنهاد شده می تواند با یادگیری تصاویر پلاک خودرو در شرایط متنوع، شناسه های پلاک خودرو را برجسته نماید. پس از آن، شناسه های پلاک از روی تصویر دودویی  شده با استفاده از شبکه های عصبی بازگشتی و بدون نیاز به جداسازی شناسه ها، خوانده می شوند. این کار می تواند خطای ناشی از ناحیه بندی شناسه ها را تا حد زیادی کاهش دهد. روش پیشنهادی برای بازشناسی پلاک خودرو در یک پایگاه داده با 4000 تصویر آزمون به نرخ بازشناسی 94.19 درصد دقت نهایی رسیده است که این دقت در مقایسه با سایر روش ها قابل قبول می باشد.
    کلیدواژگان: یادگیری ژرف، بازشناسی پلاک خودرو، شبکه عصبی رمزگذار-رمزگشا، خود رمزگذار
  • علی حسینی، محمد امین شایگان*، سعید صدیقی صفحات 47-64
    بیشتر وسایل نقلیه هوشمند زیر آبی و وسایل نقلیه کنترل از راه دور دریایی، برای تصویر برداری از زیر آب به دوربین های نوری مجهز می باشند. لیکن با توجه به خواص آب و ناخالصی آن، کیفیت تصاویر گرفته شده توسط این وسایل تصویربرداری به اندازه کافی مطلوب نیستند. زیرا که آب باعث تضعیف نور شده و هر چه میزان عمق آب بیشتر شود، نور کاهش بیشتری پیدا خواهد کرد که این موضوع باعث جذب شدن رنگ ها توسط آب خواهد گردید. لذا عملیات پردازش تصویر برای تصاویر زیر آب از اهمیت بسیاری برخوردار هستند. در این مقاله به منظور افزایش کیفیت تصاویر زیر آب، روش جدیدی برای بهبود تباین تصاویر معرفی شده است. در روش پیشنهادی، از دو عملیات کشش و متعادل سازی بافت نگار استفاده شده است. در قسمت متعادل سازی، یک روش جدید شکستن و برش بافت نگار معرفی شده است. روش ارائه شده بر روی چندین تصویر مرجع آزمایش و نتایج حاصل از آن با روش های متداول، مورد مقایسه قرار گرفته است. تجزیه و تحلیل نتایج روش پیشنهادی، افزایش 40/16% تباین در مقایسه با روش ساتیا و همکاران، که بهترین روش در بین روش های مورد مقایسه می باشد، را در بهترین حالت نشان می دهد.
    کلیدواژگان: بهبود تباین، پردازش تصویر، تصاویر زیر آب، فضای رنگی YIQ، متعادل سازی بافت نگار
  • بهنام سبزعلیان*، حسین مروی، علیرضا احمدی فرد صفحات 65-78
    شناسایی رفتار ناهنجار ازلحاظ اهمیت یک ضرورت در سامانه های نظارت بصری تبدیل شده است. همچنین این حوزه به عنوان یک چالش در تحقیقات بینایی ماشین بدل شده است. گرچه تلاش های بسیاری به منظور رفع این مشکل انجام شده است، اما شناسایی رفتار در یک محیط واقعی و غیرقابل کنترل فاصله معناداری تا به بلوغ رسیدن آن وجود دارد. مشکل اصلی ابهام در تفاوت خصوصیات رفتار غیر نرمال و نرمال است که تعریف آن معمولا با توجه به زمینه پیشین تصاویر می تواند متفاوت باشد. در این مقاله یک سیستم شناسایی و موقعیت یابی رفتارهای ناهنجار در سکانس های ویدئویی ارائه شده است. جنبه کلیدی این روش درواقع ترکیب شبکه عصبی کانولوشنی زمان-مکانی دوبعدی و سه بعدی به منظور شناسایی رفتار غیر نرمال در فریم های متوالی ویدئویی است. همچنین از روش شناساگر Features from Accelerated Segment Test (FAST) به منظور افزایش ضریب اطمینان در شناسایی موقعیت های موردنظر در تصاویر ورودی به مدل شبکه عصبی کانولوشنی بهره گرفته شده است. این ویژگی ها تنها از حجم پیکسل های دارای حرکت استخراج می شوند تا بتوانند هزینه محاسبه را کاهش دهند. ساختار مدل شبکه عصبی کانولوشنی به ما اجازه استخراج ویژگی های زمان-مکانی که شامل استخراج ویژگی هایی با حرکات پیچیده نیز هست را می دهد.روش ارائه شده توسط مجموعه داده ی متداول که شامل رفتارها و اعمال ناهنجار متفاوت انسانی در موقعیت های گوناگون است، مورد آزمایش و ارزیابی قرار گرفته است. نتایج حاصل از آزمایش های مربوطه نمایانگر این است که سیستم ارائه شده در مقایسه با بسیاری از روش های متداول پیشین، عملکرد بهتری را دارد و کارایی آن در شناسایی رفتار غیر نرمال در مقایسه با روش های قبلی بسیار رقابتی است.
    کلیدواژگان: بینایی ماشین، شناسایی رفتارهای ناهنجار در تصاویر ویدئویی، شبکه های عصبی کانولوشنی، یادگیری ماشین، ویژگی های زمان-مکانی
  • نجمه علی بابایی، علی محمد لطیف* صفحات 79-92
    نویز متناوب با ایجاد الگوهای مشابه در تصویر باعث تخریب کیفیت تصویر می گردد. در این پژوهش یک سیستم فازی برای یافتن نویز متناوب در حوزه فرکانس و رفع آن معرفی می گردد. در سیستم فازی موقعیت تقریبی ضرایب نویز توسط دو ورودی به دست می آید. ورودی اول موقعیت ضریب فرکانسی و ورودی دوم نسبت مقدار ضریب فرکانسی به میانه پنجره همسایگی است. خروجی سیستم فازی ماسک اصلاح کننده در حوزه فرکانس خواهد بود که از آن برای رفع نویز استفاده خواهد شد. عملکرد روش پیشنهادی روی تعدادی تصویر محک آغشته به نویز مصنوعی و واقعی بررسی گردید. به منظور ارزیابی، معیارهای کیفی و کمی سنجش موردتوجه قرار گرفت. نتایج شبیه سازی حاکی از عملکرد قابل قبول آن در مقایسه با روش های مطرح در این حوزه است.
    کلیدواژگان: حذف نویز تصویر، سیستم فازی، نویز متناوب
|
  • Roya Rad *, Mansour Jamzad Pages 1-17
    Today, with the development of technologies to capture and share images, the number of digital images has increased significantly. The management of this volume of images requires an efficient system to review, classify, search and retrieve the images.New generations of image retrieval systems usually take one or a few keywords from the user to retrieve images with visual content related to that keywords. A mechanism that can automatically describe the content of an image (like a human) can increase the efficiency of these systems.Automatic Image Annotation or AIA is a professional method to express the content of images by keywords or tags. AIA systems, investigate the relationship between the meaning of a text and low-level image features by using machine learning techniques. They automatically assign some tags to images to facilitate fast search based on image contents.In this paper, we explain the different steps to implement an AIA system, review the related works and express the problems and challenges in designing such systems. We also introduce several datasets suitable for AIA systems.
    Keywords: Automatic Image Annotation, AIA, Image Retrieval, Feature Extraction
  • Ali Asghar Sharifi Najafabadi, Farah Torkamnai Azar * Pages 19-30
    Principal component analysis (PCA) is one of the proposed methods to reduce the size of the data set that can be used for both one and two-dimensional data. Regarding the lack of sparsity property in the base vectors, sparse PCA has been proposed, which maintains the properties of standard PCA and simultaneously forces some of the elements of the base vectors to zero. In this paper, due to the sparsity in base vectors that cause some dataset values to be ineffective in moving to new space, two algorithms are presented in one-dimensional and two-dimensional mode to remove redundancy from raw data. In the one-dimensional algorithm, redundancy is detected between signal layers and then removed from all set observations. In a two-dimensional algorithm, the significance of the row and the column of the dataset images are detected and the less important ones are eliminated directly from raw data. One of the most important advantages of proposed algorithms, which can be read as non-uniform sampling methods, is to preserve the appearance of signals. After removing the raw data redundancy by the two algorithms presented, new data with fewer dimensions can be used in other applications such as dataset recognition, compression, and so on.
    Keywords: Removing redundancy from raw data, Sparse Principal Component Analysis (SPCA), Two- Dimentional Sparse Principal Component Analysis (2DSPCA), Feature Extraction
  • Sajed Rakhshani, Esmat Rashedi *, Hossein Nezamabadi, Pour Pages 31-46
    In this paper, a method based on deep learning is presented to highlight and recognize the Iranian license plate numbers. The current research uses the convolutional neural network with the encoder-decoder structure to enhance the image and highlight the plate image numbers instead of using traditional image enhancement techniques. The proposed network can highlight vehicle license plate numbers by learning the plate images in various conditions. After that, the plate numbers are recognized from the reproduced image using a recurrent neural network without the need to plate image segmentation. This method can reduce the error caused by the license plate number segmentation. The proposed method reached the final recognition rate up to 94٫19 percent on a database with 4000 test images for recognizing the license plates which is acceptable in comparison to three recent methods.
    Keywords: Autoencoder, Deep Learning, Encoder-decoder neural network, Vehicle license plate recognition
  • Ali Hosseini, Mohammad Amin Shayegan *, Saeed Sedighi Pages 47-64
    Most intelligent underwater vehicles and remote control marine vehicles are usually equipped with optical cameras for underwater photography. However, due to water properties and its impurity, the quality of the images taken by these imaging equipment is not desirable, enough. Because, water reduces the light and by increasing the deep of water, the further light will diminish, which will result in the absorption of colors by water. Hence, image processing operations are crucial for underwater images .In this paper, a new method has been proposed to improve the contrast and quality of underwater images. In the proposed method, the two methods of contrast stretching and histogram equalization have been employed. In the histogram equalization phase, new methods have been introduced for thresholding and histogram clipping. The proposed method has been applied on a benchmark images dataset and the results have been compared with the results of common methods. The analysis of the proposed method results, compared to the Sathya et al., which is the best method compares to other rival methods, shows 40.16% increase in the contrast of the images, in the best case
    Keywords: Contrast Enhancement, image processing, Underwater Images, YIQ Color Space, Histogram Equalization
  • Behnam Sabzalian *, Hossein Marvi, Alireza Ahmadyfard Pages 65-78
    Unusual behavior detection is critically important for visual surveillance. It is also a challenging research topic in computer vision. Although much effort has been devoted to tackle this problem, such detection task in a realistic and uncontrolled environment is still far from mature. The major difficulty lies in the ambiguous characteristic in differentiating normal and abnormal behaviors, whose definitions often vary according to the context of video's history. In this paper we propose a framework for detecting and locating abnormal activities in video sequences. The key aspect of our method is the pairing of the 2D and 3D spatial-temporal Convolutional Neural Networks (CNN) for anomaly detection in contiguous video frames. The Features from Accelerated Segment Test (FAST) detector has been used In order to increase the reliability in identifying the interest locations in entry frames of convolutional neural network model. These feature extracted only from volumes of moving pixels that reduce the computational costs. The architecture of CNN model allows us to extract spatial-temporal features that contain complicated motion features. We test our framework on popular benchmark dataset containing various human abnormal activities and situations. Evaluation results show that our method outperforms most of other methods and achieves a very competitive detection performance compared to state-of-the-art methods.
    Keywords: Machine Vision, Abnormal Behavior Detection in Video, Convolutional Neural Networks, Machine Learning, Spatial-temporal CNN Features
  • Najmeh Alibabaie, Alimohammad Latif * Pages 79-92
    Periodic noise damages the visual quality of images by imposingrepetitive patterns to them. In this research work, we introduce anew method which is based on fuzzy systems for de-noising periodic noise.The position of a frequency coefficient in the origin shifted Fouriertransformed image and the current coefficient's amplitude to a localmedian ratio are used as inputs of the fuzzy system. The output of the fuzzy system will be a restorationmask. Weimplemented the proposed method and evaluated its performance againstsome images corrupted with periodic noise. The experimental results showan acceptable level of performance. Overall, this research implies thatthe procedure conducted by experts in the notch filter can be automatedby using a fuzzy system.
    Keywords: Noise Removal, Periodic Noise, Fuzzy System