زهره هنرجویان
-
نشریه مطالعات کتابداری و سازماندهی اطلاعات، سال سی و سوم شماره 4 (پیاپی 132، زمستان 1401)، صص 17 -37هدف
هدف پژوهش حاضر، مرور نظام مند پژوهش های حوزه توقف جستجو، به منظور تعیین ابعاد و جنبه ها و نیز سطوح توقف بررسی شده در متون و شناسایی شکافهای پژوهشی این حوزه است.
روشپژوهش حاضر، به روش مرور نظام مند و در دو بخش تحلیل توصیفی و محتوایی انجام شده است. بدین منظور، پژوهش های مرتبط با توقف جستجو در بازه زمانی 1961-2020 در پایگاه های اطلاعاتی جستجو شده، پس از پالایش نتایج، در نهایت محتوای 60 پژوهش به روش تحلیل مضمون و در قالب مفاهیم پایه، سازمان دهنده، و فراگیر تحلیل شد.
یافته ها:
متون مرور شده در این پژوهش، دو سطح از توقف را شناسایی کرده اند که عبارت است از توقف نشست جستجو و توقف پرسش/ توقف در سطح خلاصه نتایج. در سطح دوم، نشست جستجو به طور کامل متوقف نمی شود، بلکه کاربر پس از پالایش پرسش به جستجو ادامه می دهد. همچنین متون از شیوه دیگری از توقف با عنوان «توقف در سطح صفحه نتایج» نیز نام می برند که طی آن، کاربر پس از استنباطی کلی از نتایج جستجو، صفحه را بدون کلیک بر نتایج ترک می کند. پس از این توقف، ممکن است کاربر با پالایش پرسش، جستجو را ادامه دهد یا آنکه به طور کلی دست از جستجو بکشد. بنابراین در اینجا با سطح دیگری از توقف مواجه نیستیم، بلکه تنها زمان تصمیم گیری درباره توقف تغییر کرده است. عمده پژوهش های موجود، به توقف نشست جستجو پرداخته اند.شناسایی قواعد متوقف جستجو، بررسی کاربست قواعد توقف جستجو در شرایط گوناگون، شناسایی عوامل موثر بر توقف جستجو و توقف پرسش، بررسی توقف در سطح صفحه نتایج، بررسی عمق جستجوی کاربران، تمایز میان نشانه های توقف ناشی از رضایت و نارضایتی از جستجو، و کاوش نشانه های توقف جستجو، ابعادی از موضوع توقف جستجو هستند که در متون بررسی شده اند. قواعد شناسایی شده برای توقف جستجو نیز شامل «رضایت دهی و ناکامی»، «آستانه اندازه»، «آستانه تفاوت»، «تثبیت بازنمون»، «فهرست ذهنی»، و «تک معیار» است و عواملی که توقف جستجو را تحت تاثیر قرار می دهند مشتمل بر محدودیت زمانی، ساختار وظایف جستجو، ردپای اطلاعات، ویژگی های رابط کاربری سامانه، اهمیت کار در نظر کاربر، انگیزه، دانش موضوعی، علاقه به موضوع، و ویژگی های «نیاز به خاتمه» و «نیاز به شناخت» در افراد است.
نتیجه گیری:
پژوهش های موجود، هریک با پرداختن به جنبه(های) خاصی از رفتار توقف جستجو، کوشیده اند قواعد حاکم یا شماری از عوامل موثر بر آن را شناسایی نمایند و بدین سبب، نیاز به پژوهشی جامع که مسایل مختلف مرتبط با سامانه، کاربر، و شرایط حاکم بر جستجو را در بررسی این رفتار لحاظ نماید، احساس می شود. به عنوان شکافهای پژوهشی این حوزه نیز می توان به لزوم پژوهش در تاثیر متغیرهایی چون تاثیر زبان جستجو، سختی وظایف، و تفاوتهای فردی بر رفتار توقف، تمایز مفصل نشانه های رفتار توقف خوب از بد، تفاوت های توقف در جستجو با رایانه شخصی و تلفن همراه، و نیز بهره گیری از فناوری ردیابی حرکات چشمی و ثبت فعالیت الکتریکی مغز (الکتروانسفالوگرافی) جهت شناخت بهتر رفتار توقف اشاره کرد.
کلید واژگان: توقف جستجو, قواعد توقف, توقف پرسش, فرمول بندی مجدد پرسش, مرور نظام مندPurposeThe purpose of this study was to systematically examine dimensions, aspects, and levels of search stopping in the literature in order to identify gaps in the field.
MethodsResearch reports on the subject published between 1961-2020 were identified in databases. The contents of 60 studies found were thematically analysed in terms of basic, organizing, and comprehensive concepts.
FindingsThe reviewed studies have identified two stopping levels, namely session-level stopping and query-level/ result- summary- level stopping. At the latter level, the search session does not stop permanently, but the user continues searching after refining the query. The studies also referred to another stopping method labeled as “search- engine- result- page- level stopping” in which the user leaves the result page without clicking on any result after making a general inference of the search results. Then, the user may or may not continue searching after refining the query. Here, we are not dealing with another level of stopping, but only the time of making decision to stop is changed. Most of the 60 studies we identified dealt with session-level stopping. Identifying stopping rules, examining the application of stopping rules in various contexts, identifying the factors affecting search stopping or query stopping, checking search- engine- result- page- level stopping, examining the depth of users' search, distinguishing between stopping due to satisfaction or frustration, and exploring search stopping signs were dimensions of search stopping studied in the literature. Stopping rules included satisfaction and frustration, magnitude threshold, difference threshold, representational stability, mental list, and single criterion. Also, factors affecting stopping search included time constraints, search task structure, information scent, user interface features, importance of the task to the users, motivation, domain knowledge, interest in the topic, need for closure and need for cognition.
ConclusionOur review showed that studies each dealt with some specific aspect(s) of search stopping behavior and sought to identify the rules or factors affecting it. Research gaps we identified include not investigating the impact of variables such as search language, task difficulty, and individual differences on stopping behavior, the detailed differentiation of the signs of good abandonment from bad ones, and the use of eye tracking technology and recording electrical activity of the brain (Electroencephalography) to better understand the stopping behavior.
Keywords: Stopping information search, Stopping rules, Query stopping, Query reformulation, Systematic review -
نشریه مطالعات کتابداری و سازماندهی اطلاعات، سال سی و یکم شماره 3 (پیاپی 123، پاییز 1399)، صص 110 -129هدف
مرور نظام مند پژوهش های حوزه معناشناسی در سامانه های برچسب گذاری اجتماعی، به منظور شناسایی شاخه های موضوعی قابل توجه پژوهشگران، مرور راهکارهای رفع یا کاهش اثرات مسایل معناشناسی بر بازیابی اطلاعات در این سامانه ها و شناسایی شکاف های پژوهشی این حوزه است.
روش پژوهش :
پژوهش به روش مرور نظام مند انجام گرفته است. به این منظور، با جستجو در پایگاه های اطلاعاتی، 101 مقاله پژوهشی به زبان انگلیسی در بازه زمانی 2003-2019 انتخاب و پس از پالایش، 44 پژوهش تحلیل شد.
یافته هامحورهای موضوعی مهم شامل طراحی یک سامانه برچسب گذاری معنایی، استفاده از وردنت برای تعیین رابطه معنایی میان برچسب ها، بهره گیری از بافت برای ابهام زدایی از معنای برچسب، تولید الگوریتم برچسب گذاری معنایی خودکار بودند. خلاهای پژوهشی برای انجام پژوهش های آتی عبارتند از: ابداع روشی برای شناسایی منابع حاوی معنایی خاص از یک برچسب بدون نیاز به بررسی همه منابع، بررسی امکان استفاده از روش های خوشه بندی برچسب ها برای خوشه بندی منابع.
نتیجه گیری:
با توجه به شکاف های پژوهشی همچنان مسئله معنا در سامانه های برچسب گذاری می تواند از حوزه های مهم مطالعات پژوهشی سازماندهی اطلاعات باشد.
کلید واژگان: فوکسونومی, برچسب گذاری اجتماعی, روابط معنایی, بازیابی اطلاعات, مرور نظام مندPurposeThe objective of the present study has been to systematically review semantic research studies on social tagging systems in order to identify the researchers’ areas of interest, to investigate the impact of semantic issues on information retrieval in such systems, and to identify research gaps in this area.
MethodologyNinety-eight studies were found by searching relevant databases. After initial investigation and consultation with two specialists in the field, 41 studies published in 2003-2018 were reviewed.
FindingsImportant topics of semantic research on social tagging systems include producing an automatic semantic tagging algorithm, designing a semantic tagging system, producing an algorithm, extracting hierarchical relationship from a set of tags, and using WordNet to determine semantic relationships among tags. In addition, research gaps identified include devising a method for identifying sources containing a specific meaning of a tag without having to review all sources, exploring the possibility of using clustering methods to cluster sources or users of folksonomies, and designing a semantic tagging system which is user-friendly. All of these issues should be taken into account in future research.
ConclusionGiven the gaps identified, the subject of semantics in tagging systems needs further investigation, as it has a direct impact on search and retrieval by these systems.
Keywords: Folksonomies, Social Tagging Systems, Semantic Relations, Information retrieval, Systematic review -
پژوهش حاضر که به هدف بررسی تازگی اطلاعات فارسی انجام شده است، می کوشد تا سرعت نمایه سازی روزنامه های فارسی را در سه موتور کاوش گوگل، یاهو و بینگ مطالعه و مقایسه کند. این پژوهش به روش وب سنجی انجام شده و جامعه آن را کلیه روزنامه های فارسی پیوسته تشکیل می دهد. نمونه پژوهش به روش هدفمند شناسایی شد و شامل آن دسته از روزنامه های فارسی زبان بود که فهرست آن ها در پایگاه «مگ ایران» آمده و نسخه الکترونیکی آن ها به طور منظم بر وب سایت مربوطه منتشر می شود. نتایج حاصل از پژوهش نشان داد موتور کاوش گوگل به لحاظ سرعت روزآمدسازی روزنامه های فارسی رتبه بالاتری نسبت به موتورهای کاوش یاهو و بینگ دارد. علاوه بر این، گوگل به طور کلی از الگوی روزآمدسازی منظم تری پیروی می کند. دو موتور کاوش یاهو و بینگ نه تنها از سرعت کمتری نسبت به گوگل برخوردارند، بلکه الگوی روزآمدسازی نامنظم تری دارند. دو موتور کاوش یاهو و بینگ به لحاظ سرعت روزآمدسازی تفاوتی با یکدیگر ندارند. این پژوهش برای نخستین بار وضعیت نمایه سازی روزنامه های فارسی زبان را در موتورهای کاوش وب مورد بررسی قرار داد و نشان داد که جستجوگرانی که به کمک موتورهای کاوش به این روزنامه ها دست می یابند، در گوگل از بخت بالاتری برای دستیابی به نسخه روزآمد این روزنامه ها برخوردارند.
کلید واژگان: روزنامه فارسی, گوگل, یاهو, بینگ, نرخ تازگی, سرعت روزآمدسازی, روزآمدسازی بی درنگAiming to study the freshness of Persian information، the study attempted to explore the indexing speed of Persian newspapers in Google، Yahoo and Bing. The present study was conducted using a webometric method. The population study comprised all the online newspapers published in Persian. The study sample was identified using a targeted method. It included those Persian newspapers listed on the Magiran database with their electronic versions regularly published on their respective websites. The results revealed that Google outperforms the two other search engines in terms of timely indexing the Persian newspapers. Furthermore، it generally enjoys a more consistent and stable indexing model. Yahoo and Bing are not only slower in indexing the newspapers، but also experience a comparably lower consistency level in their indexing models. Yahoo and Bing show to be comparable in their indexing speeds. In this study، the indexing status of Persian newspapers on different internet search engines was investigated for the first time. Results showed that those accessing these newspapers using internet search engines will have a higher chance of accessing their most updated versions using Google.Keywords: Persian newspapers, Google, Yahoo, Bing, Indexing speed, freshness rate, immediate indexing -
هدف
در سبک نگارش فارسی، برخی واژه ها را می توان با درج، حذف یا جایگزینی نویسه ای خاص نوشت و به این ترتیب، برای واژه ای واحد دو یا چند الگوی نگارشی متفاوت پدید آورد. این نایکدستی در الگوهای نگارش می تواند بر اثربخشی بازیابی اطلاعات فارسی تاثیر منفی داشته باشد. آشکار است که تلاش در جهت لحاظ کردن همه الگوها در الگوریتم های بازیابی اطلاعات فارسی، بر پیچیدگی آنها می افزاید و کارآیی سامانه های بازیابی اطلاعات را کاهش می دهد. از این رو، ضروری است با بررسی رفتارهای نگارندگان فارسی، میزان چندگانگی الگوها و تاثیر آن بر بازیابی اطلاعات در عمل و در نتیجه، ضرورت لحاظ کردن آنها در الگوریتم های فارسی آشکار گردد.
روش پژوهش: در پژوهش حاضر که به روش تحلیل محتوای مفهومی انجام گرفته است، 7 چالش از میان 43 چالش نگارشی که با مرور ادبیات مربوط، شناسایی شده بود انتخاب گردید و پس از محاسبه تنوع و فراوانی رویداد آنها در متون پیکره همشهری، میزان انطباق شیوه نگارش آنها با دستور خط مصوب فرهنگستان زبان و ادب فارسی بررسی شد.یافته هانتایج پژوهش نشان داد نگارندگان متون پیکره به طور کلی تمایل به حذف یا جایگزینی نویسه های چالشی دارند. بنابراین، به نظر می رسد دست کم درباره هفت چالش مورد بررسی در این پژوهش، با نادیده گرفتن این چالش ها در سامانه های بازیابی اطلاعات، اثربخشی بازیابی چندان متاثر نمی شود. مقدار کلی شاخص«ضریب درگیری» برابر با 0/033 به دست آمد که بیانگر انطباق نداشتن گسترده الگوی نگارشی نگارندگان با دستور خط مصوب فرهنگستان است. از دلایل این امر می توان به تمایل نگارندگان به ساده نگاری در اثر «اصل کمترین کوشش» و عدم احساس ضرورت رعایت رسم الخط مرسوم عربی توصیه شده در دستور خط مصوب فرهنگستان، اشاره کرد.
کلید واژگان: بازیابی اطلاعات, نگارش فارسی, چالش, پیکره همشهریPurposeIn its interactions with the digital environment, Persian language faces a variety of challenges, especially regarding its writing style, which can affect the effectiveness of Persian information retrieval (IR).Persian writers may either ignore some characters or replace them with other ones.
MethodologyUsing a conceptual content analysis method, the present research investigated seven challenging characters to explore the writing behaviors as reflected in the Hamshahri Corpus during 1996-2007. The degree of the writing behavior conformity to the standard Persian writing style was also investigated using "Engagement Index" (i.e. the arithmetic ratio of the words conformed to the standard writing style.
FindingsResults showed that the Corpus typists generally tend to omit the challenging characters or replace them with simplified characters. It seems, therefore, that ignoring the challenges in Persian IR systems would not largely affect IR effectiveness. The engagement index equals 0.033 demonstrating the least conformity of the writing behavior to the standard. This may have roots in the fact that Persian writers tend to simplify the writing style due to the “least effort” principle and feel no needs to adhere to the traditional Arabic writing style, as prescribed by the standard.
Keywords: Information Retrieval, Persian writing style, Hamshahri corpus, Persian character set -
هدفهای پژوهش: زبان فارسی، به سبب ویژگی های خاص آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواری هایی روبهروست که تاثیری بسزا بر اثربخشی بازیابی اطلاعات میگذارد. پژوهش حاضر میکوشد تا با بررسی متون و پیشینه های موجود، چالش های نگارش فارسی، تاثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهادهای ارائه شده در جهت رفع این دشواری ها را مورد بحث و بررسی قرار دهد.
اهمیت پژوهش: با تحلیل و مرور جامع متونی که درباره چالش های نگارش فارسی در محیطهای دیجیتال نگارش یافته است، میتوان دانشی را که تاکنون در این باره گرد آمده است به تصویر کشید و کاستی ها و پیشرفتهای به دست آمده در این زمینه را آشکار ساخت.
روش پژوهش: روش پژوهش حاضر، متنپژوهی با رویکرد تحلیل محتواست که از روش های پژوهش کیفی به شمار میآید. «پاراگراف»، «جمله» و «کلمه» به عنوان واحد تحلیل انتخاب شد، زیرا ممکن بود هر دشواری یا راهکار تنها در یک کلمه یا عبارت مورد اشاره قرار گرفته یا در جمله یا پاراگراف شرح داده شده باشد.
یافته ها: آثار مورد بررسی، بیش از 40 دشواری نگارشی را در رابطه با جستجو و بازیابی اطلاعات فارسی ذکر کردهاند. این گونهگونی نگارشی به نایکدستی و تطور بسیار در نگارش فارسی میانجامد که میتواند اثربخشی بازیابی را بویژه از منظر کاهش دقت یا ریزش کاذب و نیز کاهش جامعیت بازیابی، متاثر سازد. در نتیجه، ضروری است در طراحی الگوریتمهای سامانه های جستجو و بازیابی فارسی، بههنجارسازی تنوعات و چنددستی های نگارشی و دستوری مد نظر قرار گیرد. تدوین استاندارد نگارش فارسی، استفاده از سیاهه های از پیش تعیین شده، تجهیز پایگاه اطلاعاتی به اصطلاحنامه و فرهنگهای املایی، و تدوین دستنامه یا راهنمای جستجو، از جمله راهکارهای ارائه شده است. این راهکارها با وجود جامع نبودن، کم و بیش اثربخش به نظر میرسند.
نتیجه گیری: از آنجا که راهکارهای انسانی، نیازمند مشارکت فعالانه و آموزش نویسندگان متون (تایپیستها و کاربران) است و از روندی بلندمدت و هزینهبر برخوردار است، حرکت به سوی راهکارهای خودکارسازی پردازش متن و نمایهسازی، ضروری است.
کلید واژگان: زبان فارسی, بازیابی اطلاعات, نگارش, املاResearchPurposeDue to its special characteristics and lacking a standard writing style, Persian language faces with difficulties in coping with electronic media, seemingly affecting the effectiveness of the information retrieval. Reviewing previous literature on the subject, the present study attempts to study the challenges, their impact on the effective information retrieval and the solutions proposed to overcome them.Research Significance: A comprehensive review on the Persian Language challenges in digital environment may highlight the knowledge gathered so far on the subject and uncover its deficiencies and progress.ResearchMethodologyThe present study applies a documentary method with a text analysis approach, which is a qualitative method.FindingsThe reviewed studies report a large number of inconsistencies and variations in Persian writing, seeming to seriously affect the effectiveness of information retrieval regarding precision, false drop or recall. It is, therefore, required that Persian information retrieval systems normalize the morphological and grammatical inconsistencies and variations. The studies offer some solutions to eliminate or lessen the negative effects, namely standardizing Persian writing style, using pre-defined lists, equipping the databases with thesauri. Although failing to encompass all the challenges, they seem to be more or less effectual. Specially, preparing Persian writing style standards, spelling dictionaries and thesauri, search manuals or guides, and designing subject-specific information retrieval algorithms can be useful.ConclusionThe human-based solutions require serious training of and contribution from text writers (including typists and users) and are a long-term and expensive process. Consequently, it is vital to move toward automatic text processing and indexing techniques.Keywords: Persian language, information retrieval, writing style, spelling
- در این صفحه نام مورد نظر در اسامی نویسندگان مقالات جستجو میشود. ممکن است نتایج شامل مطالب نویسندگان هم نام و حتی در رشتههای مختلف باشد.
- همه مقالات ترجمه فارسی یا انگلیسی ندارند پس ممکن است مقالاتی باشند که نام نویسنده مورد نظر شما به صورت معادل فارسی یا انگلیسی آن درج شده باشد. در صفحه جستجوی پیشرفته میتوانید همزمان نام فارسی و انگلیسی نویسنده را درج نمایید.
- در صورتی که میخواهید جستجو را با شرایط متفاوت تکرار کنید به صفحه جستجوی پیشرفته مطالب نشریات مراجعه کنید.