پیاده سازی و بهینه سازی الگوریتم AKAZE در پردازنده ARM و ارزیابی افزایش سرعت الگوریتم با استفاده از واحد NEON
در این مقاله الگوریتم تشخیص ویژگی AKAZE برای بر روی یک پردازنده ARM نسل هفتم پیاده سازی می شود و سعی می شود سرعت اجرای آن افزایش یابد. در این راستا ابتدا بخش هایی از الگوریتم AKAZE که زمان زیادی صرف اجرای آن ها می شود و به نوعی گلوگاه های الگوریتم به حساب می آیند، شناسایی شده و با استفاده از زبان برنامه نویسی C++ بازنویسی می شوند تا سرعت اجرای الگوریتم افزایش یابد در ادامه استفاده از واحد NEON در پردازنده ARM جهت بهبود سرعت اجرای الگوریتم مورد بررسی قرار خواهد گرفت و بخش هایی از برنامه که امکان اجرای همزمان را دارند با استفاده از دستورات اختصاصی این واحد پیاده سازی خواهند شد. بررسی انجام شده نشان می دهد که بازنویسی بخش هایی که گلوگاه سرعت هستند تاثیر چشمگیری در افزایش سرعت اجرای الگوریتم خواهند داشت و زمان اجرای الگوریتم با روش پیشنهادی تا 60 برابر نسبت به کدهای موجود کاهش می یابد. همچنین استفاده از واحد NEON و برداری سازی در برخی از بخش های الگوریتم، باعث بهبود سرعت اجرای آن بخش ها می شود. این افزایش سرعت در کاربردهایی که نیاز به پردازش تصاویر ویدیویی بصورت بلادرنگ دارند بسیار حایز اهمیت است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.