معرفی یک مجموعه داده برای کاربردهای درک و ناحیه بندی تصاویر اسناد فارسی
وجود مجموعه داده های تصویری نقش اساسی در زمینه تشخیص نویسه خوان نوری (OCR) و بازیابی اسناد دارد. علی رغم اینکه تا به امروز مجموعه داده های تصویری زیادی با اشیا متفاوت در حوزه درک و ناحیه بندی اسناد غیرفارسی منتشر شده است، رسم الخط فارسی از این پیشرفت عقب مانده است و تاکنون در زمینه درک و ناحیه بندی اسناد فارسی، مجموعه دادگانی با دسترسی عمومی ارایه نشده است. از سوی دیگر، اگرچه زبان های فارسی و عربی شباهت های زیادی دارند، اما تفاوت بین ساختار این دو زبان باعث می شود که سیستم های آموزش دیده OCR با مجموعه داده عربی، دقت مناسبی روی تصاویر اسناد فارسی نداشته باشند. در این مقاله، یک مجموعه داده برای تصاویر اسناد فارسی معرفی میگردد که مشتمل بر 5598 تصویر است. تصاویر تهیه شده متعلق به روزنامه ها، کتاب های درسی، مقالات علمی، فایلهای PDF فارسی، پایاننامه ها، انواع لوگو ایرانی، کتب دستنوشته قدیمی و جزوات تایپ شده و دستنویس ریاضی هستند. در مجموعه داده معرفی شده، اشیا درون تصاویر به 6 گروه پاراگراف (متن)، شکل، جدول، لوگو، رابطه ریاضی و سرصفحه دسته بندی و برچسب گذاری شده اند. برای ارزیابی کارایی مجموعه تصویر پیشنهادی، سه روش شناخته شده مبتنی بر یادگیری عمیق پیاده سازی و نتایج بر مبنای معیارهای مختلف گزارش شده است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.