تشخیص سرقت ادبی در متون علمی مبتنی بر بلوک بندی متن و معیار مشابهت کسینوسی
در دهه اخیر با گسترش دسترسی به شبکه جهانی اینترنت، سرعت و سهولت در دسترسی به ایده ها، مستندات، مقالات، دست نوشته ها و داده های جمع آوری شده توسط دیگران افزایش یافته است. این موضوع باعث شده است که تبادل اطلاعات و افکار بین محققین و تولیدکنندگان علوم آسان تر شود، اما در مقابل باعث آسان شدن اعمال رونوشت غیرمجاز، خلاصه نویسی بدون ذکر منبع و در کل سرقت متون ادبی شده است. از آنجایی که دانشگاه ها و مراکز آموزشی، منابع علمی و پژوهشی را با سهولت در دسترس اغلب کاربران قرار می دهند، تشخیص میزان اصالت متون علمی در این مراکز مهم تر و بالطبع آن از حساسیت بیشتری برخوردار است. در این پژوهش روشی ارایه شده تا با استفاده از بلاک بندی قطعات اسناد، مقایسه بین قطعات مرتبط انجام شود. در روش پیشنهادی پس از دسته بندی اسناد به دو دسته اسناد اصلی و اسناد مشکوک، پیش پردازشی با هدف حذف ایست واژه ها و جمله بندی جدید صورت پذیرفته است. سپس اسناد قطعه بندی شده و با استفاده از شباهت کسینوسی، میزان شباهت متون با یکدیگر تعیین شده است. روش پیشنهادی در آزمون 50 سند موجود در مجموعه داده ها، دقت 94 درصدی را کسب کرده که به نسبت به یکی از روش های مشابه بهبود 2 درصدی داشته است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.