تحلیل چالش های پیوسته نویسی و جدا نویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاه های اطلاعاتی

پیام:
چکیده:
مقدمه
ویژگی های خاص دستوری و نگارشی زبان و خط فارسی، دشواری هایی را در ذخیره و بازیابی اطلاعات در محیط رایانه‎ای پدید آورده است. رسم الخط فارسی نیز از یک سو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگی های ذاتی خود، به‎هنگام ذخیره، جستجو و بازیابی چالش های متعددی را برای طراحان و نمایه‎سازان پایگاه ها، کاربران و پدیدآورندگان منابع به وجود آورده است.
روش بررسی
این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایان‎نامه های موجود رشته کتابداری و اطلاع رسانی به منزله نمونه ای از متون فارسی در پایگاه های اطلاعاتی پژوهشگاه های علوم و فناوری اطلاعات ایران و مرکز منطقه‎ای اطلاع رسانی علوم و فناوری و از هر پایگاه 50 عنوان به‎صورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاه ها، ارزیابی و مقایسه شد.
یافته ها: نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شده‎اند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایان‎نامه ها، در مورد نحوه نگارش کلماتی که 2 جزئی و مشتق می‎باشند، دچار خطا شده‎اند. در پایگاه اطلاعاتی مرکز منطقه‎ای اطلاع رسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر ‎انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسم الخط همچنان بازیابی شدند.
نتیجه گیری: این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقه‎ای اطلاع رسانی علوم و فناوری، در بازیابی عنوان پایان نامه ها در حالتهای مختلف پیوسته و جدا نوشته شده، بهتر عمل می‎کند. همچنین، باید به نویسندگان پایان نامه ها، استفاده از قواعد یکدست ملی بویژه در نگارش کلمات 2 جزئی و مشتق تاکید شود.
زبان:
فارسی
در صفحه:
9
لینک کوتاه:
https://www.magiran.com/p1033972 
مقالات دیگری از این نویسنده (گان)