آشکارسازی و تعیین مکان متون فارسی - عربی در تصاویر ویدیویی

چکیده:
استخراج اطلاعات متنی از تصاویر ویدیویی نقش مهمی را در کاربردهایی نظیر تحلیل معنایی ویدیو، بازیابی اطلاعات متنی، آرشیو تصاویر ویدیویی و اطلاعات مربوطه ایفا می کند. در این مقاله روشی جهت استخراج متن فارسی- عربی از تصاویر ویدیویی ارائه می گردد. در ابتدا با استفاده از آشکارساز لبه مناسب، لبه های موجود در تصویر استخراج گردیده و با استفاده از مکان تلاقی لبه ها، گوشه های تصنعی موجود در تصویر مشخص می شوند. تحلیل هیستوگرام جهت حذف برخی از گوشه های تصنعی نواحی غیر متنی انجام می شود. سپس ضرایب تبدیل فوریه کسینوسی گسسته بلوک های تصویر استخراج شده و با ترکیب تعدادی از ضرایب، تصویر شدت بافت حاصل می شود. با تلفیق مشخصه های حاصل از گوشه های تصنعی و تصویر شدت بافت، بردار مشخصه ای جهت اعمال به یک طبقه بندی جهت جدا سازی نواحی متنی از غیرمتنی حاصل می شود. در نهایت با رسم پروفایل های نرمالیزه شده شدت بافت، بازبینی نهایی انجام شده و تفکیک خطوط متنی از یکدیگر انجام می گیرد.
زبان:
فارسی
صفحات:
87 تا 104
لینک کوتاه:
https://www.magiran.com/p1253191 
مقالات دیگری از این نویسنده (گان)