دکتر هاجر ستوده
-
مقدمه
پزشکی مبتنی بر شواهد هدف متخصصان بالینی دستیابی به اطلاعات مرتبط و معتبر برای اتخاذ تصمیم بالینی مناسب است. بنابراین، در سامانه های بازیابی اطلاعات برای پاسخگویی به نیازهای اطلاعاتی متخصصان سلامت، دسترسی به مدارک مرتبط کفایت نمی کند و اعتبار روش شناختی آنها نیز می بایستی مد نظر قرار گیرد.
روش پژوهشپژوهش حاضر از روش شبه آزمایشی پیش آزمون - پس آزمون تک گروهی به منظور دست یابی به اهداف پژوهش بهره می برد. جامعه ی پژوهش را کلیه ی مقالات کارآزمایی بالینی موجود در پایگاه کاکرین تا پایان 2018 میلادی تشکیل داد.
یافته هانتایج پژوهش حاضر نشان داد در بین متغیرهای پژوهش کلمات نظر داور به همراه چکیده بیشترین تاثیر را بر رتبه بندی داشت. این نتایج نشان داد که نظر داور کاکرین می تواند ابزاری مناسب برای استفاده در سامانه های رتبه بندی بر اساس ربط و اعتبار باشد. همچنین نتایج این پژوهش نشان داد امکان رتبه بندی اعتبار روش شناختی و تلفیق آن با ربط با استفاده از عناصر درون و برون متنی مقالات وجود دارد.
نتیجه گیریاین پژوهش به تمایز انواع واژگان به کار رفته در متن مقالات علمی و تاثیر آن بر بهبود رتبه بندی بر پایه ربط و اعتبار روش شناختی پرداخت. در سامانه های بازیابی مبتنی بر زبان طبیعی، بیشتر بر کلیت متن تاکید بوده است و کمتر به سهم انواع واژگان در تبیین ربط مقالات توجه شده است. یافته های این پژوهش، بار دیگر، تفاوت انواع واژگان در تبیین ربط و اعتبار روش شناختی را برجسته ساخت و لزوم تعیین مجموعه واژگان هدف در انواع جستجوها را آشکار ساخت.
کلید واژگان: رتبه بندی, بازیابی اطلاعات, اعتبار روش شناسی, کاکرین, ربط, نظرات داورانIntroductionThe goal of evidence-based medicine is helping clinical professionals to obtain relevant and valid information to make appropriate clinical decisions. Therefore, to meet the information needs of health professionals, information retrieval systems should facilitate access relevant and also methodologically valid.
Research methodThe current research uses the quasi-experimental method of one group pre-test - post-test in order to achieve the research goals. The research community was made up all the clinical trial articles available in the Cochrane database until the end of 2018.
FindingsThe results of the present study showed that among the research variables, the words of the reviewers' comments along with the abstract had the greatest impact on the ranking. These results showed that the Cochrane reviewers' comments can be a suitable tool for use in ranking systems based on relevance and validity. Also, the results of this research showed that it is possible to rank the methodological validity and combine it with relevance by using the internal and external elements of the articles.
ConclusionThis research distinguished the types of words used in the text of scientific articles and its effect on improving the ranking based on relevance and methodological validity. In retrieval systems based on natural language, more emphasis has been placed on the totality of the text and less attention has been paid to the contribution of vocabulary types in explaining the relevance of articles. The findings of this research highlighted, once again, the difference of vocabulary types in explaining relevance and methodological validity and revealed the necessity of determining the target vocabulary set in all types of searches.
Keywords: Ranking, information retrieval, methodological validity, Cochrane, Relevance, reviewers' comments -
نشریه مدیریت سلامت، پیاپی 90 (زمستان 1401)، صص 125 -143مقدمه
اعتبار روش شناختی از جمله عوامل تاثیرگذار بر قضاوت ربط است. هدف این مطالعه، تعیین سهم و نوع تاثیر عناصر روش شناختی در تبیین ربط میان مدرک بوده و پرسش و تنها جنبه اثربخشی نظام بازیابی بدون ارزیابی کارایی بررسی شده است.
روش هاروش پژوهش نیمه تجربی (پیش آزمون-پس آزمون تک گروهی) و جامعه پژوهش مقالات کارآزمایی بالینی موجود در فراتحلیل مقالات مرور نظام مند نمایه شده در کاکرین و نمونه گیری هدفمند بود. مقالات کارآزمایی بالینی موجود در فراتحلیل دارای شماره پابمد موجود در مقالات مرور نظام مند دسترسی آزاد پایگاه کاکرین از ابتدا تا پایان سال 2018 (به عنوان پرسش نظام بازیابی) با حداقل 50 مقالات کارآزمایی بالینی دانلود شد. پیش پردازش متن و تعیین نمره «فراوانی اصطلاح- معکوس فراوانی متن» و شباهت سرعنوان های موضوعی پزشکی بین این مقادیر با نرم افزار نایم انجام شده و میانگین نمره «سودمندی تجمعی نزولی نرمالیزه» در گروه های با رتبه بندی مدارک در سطح چکیده به تنهایی مقایسه شد.
یافته هانتایج آزمون تی زوجی نشان داد تفاوت میانگین ان دی سی جی چکیده در هر چهار گروه در تمامی نقاط دقت مدرک منفی است. بیشترین تفاوت میانگین مربوط به عناصر روش شناختی پایه و استاندارد در چکیده (064/ 0-) در نقطه دقت 10 (دهمین مدرک در نتایج بازیابی شده)، و کمترین تفاوت میانگین مربوط عناصر روش شناختی پایه در چکیده (0/021-) در نقطه دقت 50 و 70 بود.
نتیجه گیرییافته های این پژوهش نشان داد که رویداد عناصر روش شناختی در متن یا وزن دهی به آن ها می تواند نتایج مرتبط را کاهش دهد و می تواند بر اثربخشی نظام بازیابی بر پایه ربط و اعتبار تاثیر منفی داشته باشد.
کلید واژگان: عناصر روش شناختی, مقالات مرور نظام مندکاکرین, ربط, بازیابی اطلاعات, اعتبار روش شناسی, نظرات ارزیابان کاکرین, پایگاه کاکرین, کارآزمایی بالینیIntroductionMethodological validity is one of the aspects of quality. Methodological elements are parts of the text of articles that deal with research methodology. The purpose of this study was to determine the contribution and role of methodological elements in explaining the relationship between evidence and questions.
MethodsThis semi-experimental study employed a one-group pretest–posttest design. The research population consisted of clinical trial articles included in the meta-analysis of Cochrane systematic review articles. The sampling method employed was purposeful, whereby systematic review articles containing at least 50 related clinical trial articles retrieved by the retrieval system were selected as the research sample.
ResultsThe results of the paired t-test showed that the difference in the average nDCG score across all four groups was negative at all points of accuracy. The highest average difference (−0.064) was observed for the basic and standard methodological elements in the abstract at accuracy point 10 (the tenth document in the retrieved results), while the lowest average difference (−0.021) was observed for the basic methodological elements in the abstract at the 50th and 70th accuracy points.
ConclusionThe findings of this research showed that methodological elements, whether independently or to expand the abstract, do not affect the ranking of relevance results or may even have a negative effect. In other words, the occurrence of methodological elements in the text or their weighting can reduce relevant results.
Keywords: Methodological elements, Cochrane system review articles, Relevance, Information retrieval, Methodological validity Reviewers' opinions, Cochrane Database, Clinical Trial -
نشریه مطالعات کتابداری و سازماندهی اطلاعات، سال سی و سوم شماره 4 (پیاپی 132، زمستان 1401)، صص 17 -37هدف
هدف پژوهش حاضر، مرور نظام مند پژوهش های حوزه توقف جستجو، به منظور تعیین ابعاد و جنبه ها و نیز سطوح توقف بررسی شده در متون و شناسایی شکافهای پژوهشی این حوزه است.
روشپژوهش حاضر، به روش مرور نظام مند و در دو بخش تحلیل توصیفی و محتوایی انجام شده است. بدین منظور، پژوهش های مرتبط با توقف جستجو در بازه زمانی 1961-2020 در پایگاه های اطلاعاتی جستجو شده، پس از پالایش نتایج، در نهایت محتوای 60 پژوهش به روش تحلیل مضمون و در قالب مفاهیم پایه، سازمان دهنده، و فراگیر تحلیل شد.
یافته ها:
متون مرور شده در این پژوهش، دو سطح از توقف را شناسایی کرده اند که عبارت است از توقف نشست جستجو و توقف پرسش/ توقف در سطح خلاصه نتایج. در سطح دوم، نشست جستجو به طور کامل متوقف نمی شود، بلکه کاربر پس از پالایش پرسش به جستجو ادامه می دهد. همچنین متون از شیوه دیگری از توقف با عنوان «توقف در سطح صفحه نتایج» نیز نام می برند که طی آن، کاربر پس از استنباطی کلی از نتایج جستجو، صفحه را بدون کلیک بر نتایج ترک می کند. پس از این توقف، ممکن است کاربر با پالایش پرسش، جستجو را ادامه دهد یا آنکه به طور کلی دست از جستجو بکشد. بنابراین در اینجا با سطح دیگری از توقف مواجه نیستیم، بلکه تنها زمان تصمیم گیری درباره توقف تغییر کرده است. عمده پژوهش های موجود، به توقف نشست جستجو پرداخته اند.شناسایی قواعد متوقف جستجو، بررسی کاربست قواعد توقف جستجو در شرایط گوناگون، شناسایی عوامل موثر بر توقف جستجو و توقف پرسش، بررسی توقف در سطح صفحه نتایج، بررسی عمق جستجوی کاربران، تمایز میان نشانه های توقف ناشی از رضایت و نارضایتی از جستجو، و کاوش نشانه های توقف جستجو، ابعادی از موضوع توقف جستجو هستند که در متون بررسی شده اند. قواعد شناسایی شده برای توقف جستجو نیز شامل «رضایت دهی و ناکامی»، «آستانه اندازه»، «آستانه تفاوت»، «تثبیت بازنمون»، «فهرست ذهنی»، و «تک معیار» است و عواملی که توقف جستجو را تحت تاثیر قرار می دهند مشتمل بر محدودیت زمانی، ساختار وظایف جستجو، ردپای اطلاعات، ویژگی های رابط کاربری سامانه، اهمیت کار در نظر کاربر، انگیزه، دانش موضوعی، علاقه به موضوع، و ویژگی های «نیاز به خاتمه» و «نیاز به شناخت» در افراد است.
نتیجه گیری:
پژوهش های موجود، هریک با پرداختن به جنبه(های) خاصی از رفتار توقف جستجو، کوشیده اند قواعد حاکم یا شماری از عوامل موثر بر آن را شناسایی نمایند و بدین سبب، نیاز به پژوهشی جامع که مسایل مختلف مرتبط با سامانه، کاربر، و شرایط حاکم بر جستجو را در بررسی این رفتار لحاظ نماید، احساس می شود. به عنوان شکافهای پژوهشی این حوزه نیز می توان به لزوم پژوهش در تاثیر متغیرهایی چون تاثیر زبان جستجو، سختی وظایف، و تفاوتهای فردی بر رفتار توقف، تمایز مفصل نشانه های رفتار توقف خوب از بد، تفاوت های توقف در جستجو با رایانه شخصی و تلفن همراه، و نیز بهره گیری از فناوری ردیابی حرکات چشمی و ثبت فعالیت الکتریکی مغز (الکتروانسفالوگرافی) جهت شناخت بهتر رفتار توقف اشاره کرد.
کلید واژگان: توقف جستجو, قواعد توقف, توقف پرسش, فرمول بندی مجدد پرسش, مرور نظام مندPurposeThe purpose of this study was to systematically examine dimensions, aspects, and levels of search stopping in the literature in order to identify gaps in the field.
MethodsResearch reports on the subject published between 1961-2020 were identified in databases. The contents of 60 studies found were thematically analysed in terms of basic, organizing, and comprehensive concepts.
FindingsThe reviewed studies have identified two stopping levels, namely session-level stopping and query-level/ result- summary- level stopping. At the latter level, the search session does not stop permanently, but the user continues searching after refining the query. The studies also referred to another stopping method labeled as “search- engine- result- page- level stopping” in which the user leaves the result page without clicking on any result after making a general inference of the search results. Then, the user may or may not continue searching after refining the query. Here, we are not dealing with another level of stopping, but only the time of making decision to stop is changed. Most of the 60 studies we identified dealt with session-level stopping. Identifying stopping rules, examining the application of stopping rules in various contexts, identifying the factors affecting search stopping or query stopping, checking search- engine- result- page- level stopping, examining the depth of users' search, distinguishing between stopping due to satisfaction or frustration, and exploring search stopping signs were dimensions of search stopping studied in the literature. Stopping rules included satisfaction and frustration, magnitude threshold, difference threshold, representational stability, mental list, and single criterion. Also, factors affecting stopping search included time constraints, search task structure, information scent, user interface features, importance of the task to the users, motivation, domain knowledge, interest in the topic, need for closure and need for cognition.
ConclusionOur review showed that studies each dealt with some specific aspect(s) of search stopping behavior and sought to identify the rules or factors affecting it. Research gaps we identified include not investigating the impact of variables such as search language, task difficulty, and individual differences on stopping behavior, the detailed differentiation of the signs of good abandonment from bad ones, and the use of eye tracking technology and recording electrical activity of the brain (Electroencephalography) to better understand the stopping behavior.
Keywords: Stopping information search, Stopping rules, Query stopping, Query reformulation, Systematic review -
هدف
تحلیل استنادی محتوامحور، از جمله عقیده کاوی بافتارهای استنادی، می تواند به بخشی از چالش های تحلیل استنادی کمی پاسخ گوید. برای دستیابی به شواهد پژوهشی بیشتر، همبستگی میان نتایج دو رویکرد تحلیل استنادی کمی و عقیده کاوانه بررسی شده است.
روش شناسی:
نمونه ای از مقالات پزشکی به روش تحلیل استنادی با رویکرد کمی و عقیده کاوی مطالعه شد. اطلاعات کتابشناختی و بافتارهای استنادی از پایگاه پابمد و «کولیل» استخراج و در نرم افزار «نایم» پردازش شدند. نمره های عقیده به کمک «سنتی وردز» تعیین شد. داده ها با کمک همبستگی اسپیرمن تحلیل شدند.
یافته هابافتارهای استنادی دارای واژه های عقیده ای بسیاری هستند. شمار استناد با فراوانی مطلق بافتارهای استنادی عقیده مند رابطه ای قوی و مستقیم، اما با فراوانی نسبی آنها همبستگی متوسط و معکوس دارد. با افزایش استناد، فراوانی نسبی بافتارهای مثبت ثابت می ماند، اما بر فراوانی نسبی بافتارهای منفی یا خنثی افزوده می شود. همچنین، شاخص استناد رابطه ای معکوس با میانگین نمرات عقیده ای دارد.
نتیجه گیریبا افزایش شمار استنادها، شمار نسبی بافتارهای عقیده مند کاسته می شود. در قطبیت ها، بر شمار نسبی بافتارهای عقیده ای منفی و خنثی افزوده می شود. این یافته، لزوم تحلیل های محتوا محور برای تصحیح رویکرد کمی را تایید می کند.
کلید واژگان: بافتار استناد, تحلیل احساس, تحلیل استنادی, عقیدهPurposeQuantitative citation analysis fails to take into account different citation motivations which may be neutral, confirmative, or negational. It necessitates devising new methods or techniques to evaluate cited documents based on the attitudes of their citing articles, to increase the accuracy of the results of the quantitative approach. The challenge is believed to be partially answered by content analysis of citations, including citation opinion mining. It is based on extracting and analyzing the sentiment words occurring in citations, or citation contexts, i.e., a word window surrounding any given citation within a citing paper. However, there exist few pieces of evidence on the degree of divergence or convergence of the results of the quantitative and content-based approaches. To provide further research evidence, the present study investigated the correlation between the results of these two citation-analysis approaches.
MethodologyUsing a citation analysis method with the quantitative and opinion-mining approaches, this communication explored a sample consisting of 524 medical papers. Their bibliographic information and citations were extracted from PubMed and CoLil, respectively. 3663 citations were identified, of which 3639 contexts were available through CoLil. The citations were processed using the KNIME data mining platform. The opinion scores of the words were extracted from SentiWords. The citations opinions were measured in terms of the polarity and strength of the average opinion scores of their words. The data were then analyzed by Spearman Correlation.
FindingsThe citations were revealed to carry numerous sentiment words. They were mostly positive in their polarity, however, the number of citations with negative polarity was also considerable. The citation counts were found to be directly and strongly correlated to the absolute count of the opinionated citations. However, they were revealed to be indirectly and weakly correlated to the relative count of opinionated citations, i.e., the number of opinionated citations normalized by the total count of the citations. Furthermore, the citation counts had an insignificant correlation with the relative frequency of positive citations, while displaying significant direct relationships with negative and neutral ones. Moreover, they were indirectly associated with the average opinion scores.
ConclusionIn general, the findings of this research showed that as the number of citations increases, the relative number of opinionated contexts decreases. They were dominated by a positive polarity which is in line with previous studies revealing a confirmative motivation in citation behavior. The predominance of positive opinions implied explicit and implicit confirmation motives of researchers reflected in the citing works: the citer may explicitly express her opinion about the cited article and its features, or implicitly express her approval by citing it (i.e., using algorithms, methods, tools, findings and etc.).According to the findings, as citation counts increase, the cited papers witness a reduction in their opinionated contexts’ relative numbers, while experiencing an increase in their negative and neutral ones. Consequently, the content-based citation analysis with an opinion-mining approach may be able to adjust the results of the quantitative approach. However, this finding and its generalizability should be treated with caution. Because the sample of the current research was not selected randomly. Given the differences between disciplines and scientific communities in their citation behavior, it is necessary to replicate the research in various contexts to support the results. Moreover, in the dictionary-based opinion mining method applied in the present study, the big challenge is precisely detecting negative opinions. As in negative citations, the negative opinions of citers may be mingled with their reports of negative objective findings. In other words, the method cannot precisely distinguish these two types of opinion contexts, i.e., the negative attitudes of the citers and their narration of negative findings. Moreover, citations are of social nature. Therefore, negative citations are mostly hidden and indirect, and their lexical identification is hence quite difficult. Thus, advanced methods using, for example, machine learning algorithms, are required to detect and analyze any possible implicit and indirect negative opinions which the direct natural language method may fail to capture.
Keywords: Citation Contexts, Citances, Sentiment Analysis, Citation analysis, Opinion Mining -
مطالعه ی رفتار اطلاع جویی کاربران از طریق ثبت امواج مغزی با کمک الکتروآنسفالوگرافی: یک مرور نظام مند
مطالعه ی رفتارکاربر بر اساس رویدادهایی که در مغز انسان و در مراحل مختلف رفتار اطلاع جویی رخ می دهد؛ علی رغم نوپایی روش شناختی، مورد استقبال پژوهشگران حوزه ی اطلاعات واقع شده است. در پژوهش حاضر تلاش شده است تا با روش مرور نظام مند، وضعیت پژوهش های انجام گرفته در عرصه ی رفتار اطلاع جویی از طریق مطالعه ی امواج مغزی بررسی شود و با شناسایی خلاء های پژوهشی، پیشنهادهایی برای پژوهش های پیش رو ارایه گردد. در این راستا، از ساختار مرور نظام مند کیتچنهام و چارترز (Kitchenham & Charters 2007) استفاده شده است. با اجرای جستجو در پایگاه های اطلاعاتی علمی به زبان انگلیسی و فارسی، در نهایت 22 منبع انگلیسی و یک منبع فارسی در بازه ی زمانی سال های 2007 تا 2020 یافت شد. در بررسی متون، برخی از مفاهیمی که فصل مشترک پژوهش ها بودند، گروه بندی شده و مبنای دسته بندی موضوعی قرارگرفتند. با مرور پژوهش ها، مشخص شد که بررسی «وضعیت ذهنی کاربر» (10 پژوهش) و «فعالیت امواج مغزی در مراحل مختلف رفتار اطلاع جویی» (12 پژوهش)، رویکردهای غالب موضوعی می باشند. دو مولفه ی «بار شناختی» و «سبک شناختی» به عنوان عوامل تاثیرگذار بر وضعیت کاربر شناسایی شدند. «نوع رسانه ی جستجو»، «قالب نمایش اطلاعات» و «شیوه ی خواندن متن» به عنوان سه عامل تاثیرگذار بر ایجاد بار شناختی در هنگام جستجو و پردازش اطلاعات تعیین شدند. ازآنجایی که روش مورد بررسی در این پژوهش، امواج مغزی بود؛ با مطالعه ی پژوهش ها مشخص شد که به دلیل اهمیت حرکات چشم در زمان خواندن، و نقش جدایی ناپذیر آن در فرآیند جستجوی اطلاعات، داده های چشمی نیز دارای اهمیت می باشند. تحلیل امواج مغزی و اتساع مردمک چشم، از مهم ترین سنجه های مورد استفاده در مطالعه ی وضعیت کاربر هنگام جستجو، و «امواج آلفا و تتا» به عنوان شاخص اندازه گیری سطح بار شناختی در فرآیند اطلاع جویی شناخته شدند. همچنین، داده های حاصل از حرکات چشم در هنگام رفتارهای جستجو، و به موازات آن میزان دشواری تکالیف که کاربر در حین جستجو احساس می کند؛ با سبک شناختی کاربران دارای همبستگی بود و درنتیجه ی آن، مشخص شد که انواع مختلفی از رفتارهای اطلاع جویی قابل طبقه بندی و شناسایی است. مراحلی که فعالیت مغزی کاربران در فرآیند اطلاع جویی مورد مطالعه قرار گرفته اند؛ به ترتیب عبارت بودند از «کاوش و فرمول بندی پرسش»، «فرمول بندی دوباره پرسش و انتخاب آن»، «تصمیم گیری و قضاوت درباره ی ربط». نتایج پژوهش ها نشان از تفاوت فعالیت نواحی مختلف مغزی، تغییر سطح اتساع مردمک چشم و تغییر در بسامد «امواج آلفا و بتا» در این سه مرحله از جستجو داشت. پیشنهادهای مطرح برای پژوهش های آتی با کمک مطالعه ی امواج مغزی و دستگاه الکتروآنسفالوگرافی، عبارت بودند از: بررسی رابطه همبستگی میان سبک شناختی با ویژگی های مربوط به تکلیف و دانش زمینه ای در فرآیند رفتار اطلاع جویی، توسعه ی سامانه های شخصی سازی بازیابی اطلاعات با همکاری بیشتر میان متخصصان حوزه اطلاعات و علوم اعصاب، پژوهش در احساسات، خشم و خستگی هنگام رفتار اطلاع جویی با رویکرد مطالعه ی مغزی، استفاده از روش های اقتصادی و ابزارهای قابل حمل برای کاهش هزینه های پژوهشی، ایجاد زیرساخت هایی با هدف افزایش تعداد جامعه ی آماری، و طراحی تکالیف استاندارد در زمینه ی پژوهش های مغزی. از خلاءهای پژوهشی مطرح شده، می توان به نیاز به پژوهش بیشتر برای درک مفاهیم پیچیده ای مانند ربط از طریق تحلیل امواج مغزی در فرآیند اطلاع جویی، و مطالعه ی احساسات کاربر با رویکردهای تلفیقی اشاره نمود.
کلید واژگان: رفتار اطلاع جویی, امواج مغزی, الکتروآنسفالوگرافی (EEG), مولفه های شناختی, مرور نظام مندDespite the novelty in methodologies, User behavior study based on brain activity during information-seeking stages has become popular among information science researchers. This paper reviews scientific publications in which information-seeking behavior has been studied along with recorded brain activity to shed light on research status, challenges, and suggestions for future studies. Based on Kitchenham & Charters (2007) framework, a complete web search was performed in English and Persian scientific databases, and 22 publications in English were found as the final result, from 2007 to 2020. Review results demonstrate that exploring the user status (10 papers) and brain wave activity during information-seeking episodes (12 papers) were the most dominant subjective approaches in the field of user behavior studies. Cognitive load was found as an effective cognitive component on user status. With eye movement measurement and brain waves frequency study, 3 factors were found effective on cognitive load level generated during information searching and processing: searching media type, information representation, and text reading style. Brain wave activity and pupil dilation analysis were the most important measures in user status during search stages, and alpha and theta band waves were demonstrated as an index for cognitive load measurement during the information searching process. A correlation among eye data, search behavior, task complexity based on user experience, and cognitive style – as another effective factor on user status- led to results in different information searching behavior demonstrations. Also, 3 main stages were analyzed in the information-seeking process, based on brain wave activity: information exploring and query formulation, query reformulation and selection, relevance judgment, and decision making. Results showed a difference between brain activity areas, and differences in pupil dilation change level and alpha/beta frequency level during different search episodes. For future research, some suggestions were offered based on reviews. Finding relations between correlations among cognitive styles, task features, and domain knowledge during information searching process, personalized information retrieval improvement, more collaboration between information science and neurocognitive specialists, research in more user affective status like aggression and fatigue during the search process, using more economic methods and portable devices aiming to reduce research costs and expenses, facilitating larger sample studies and designing standard tasks were considered as a suggestion. Finally, some challenges were found based on reviewed studies. Some concepts like relevance feedback in information retrieval need more investigation. Also, it is necessary to investigate and explore user affections during the search process with multiple approaches.
Keywords: Information-seeking behavior, Brain waves, Electroencephalography (EEG), cognitive components, systematic review -
هدف :
هدف پژوهش حاضر تحلیل رفتارهای اطلاع جویی مشارکتی دانشجویان تحصیلات تکمیلی دانشگاه شیراز است.
روش شناسی:
پژوهش حاضر، پژوهشی کمی از نوع پیمایشی است. جامعه آماری شامل کلیه دانشجویان تحصیلات تکمیلی دانشگاه شیراز در سال 1399 بود. نمونه پژوهش شامل 302 نفر دانشجویان دانشکده های مختلف بود که برمبنای جدول مورگان انتخاب شدند. گردآوری داده ها از طریق پرسش نامه محقق ساخته انجام شد. بدین منظور متون مرتبط با حوزه رفتار اطلاع جویی مشارکتی بررسی و سوالات مرتبط استخراج شد. برای سنجش روایی صوری و محتوایی، پرسش نامه برای هفت متخصص علم اطلاعات و دانش شناسی فرستاده شد و با توجه به نظریات آن ها، نسخه نهایی به دست آمد. پایایی ابزار پژوهش با استفاده از ضریب آلفای کرونباخ با مقدار 91/0 به دست آمد.
یافته هانتایج این پژوهش نشان داد که میانگین رفتار اطلاع جویی مشارکتی در نمونه مطالعه شده بیش از میانگین مورد انتظار (70 درصد) است؛ براین اساس گفتنی است تمایل دانشجویان تحصیلات تکمیلی دانشگاه شیراز به اطلاع جویی مشارکتی زیاد است. همچنین نتایج پژوهش پیرامون تجربیات آزمودنی ها نشان داد که از میان انواع متغیرهای پژوهش، فقط بین فراوانی مشاهده شده و مورد انتظار «تجربه جست وجوی اطلاعات در وب به صورت جداگانه و سپس بحث با هم گروهی در رابطه با نتایج» و «تجربه جست وجوی اطلاعات در وب به طور جداگانه با رایانه یا تلفن همراه جداگانه» تفاوت معناداری وجود ندارد و برای سایر تجربیات جست وجوی گروهی در وب میان فراوانی مشاهده شده و مورد انتظار تفاوت معناداری وجود دارد؛ بدین معنی که فراوانی دانشجویانی که تجربه جست وجوی گروهی در وب را داشته اند (2/71 %) و نیز دانشجویانی که تجربه اطلاع جویی مشارکتی در انجام تکالیف و پروژه های درسی (2/74 %) را داشته اند، به طور معناداری بیش از کسانی است که تاکنون این نوع جست وجو را تجربه نکرده اند. همچنین فراوانی دانشجویانی که کار گروهی آن ها بین یک هفته تا یک ماه (4/35 %) به طول انجامیده است و دانشجویانی که به منابع اطلاعاتی مختلفی (8/82 %) نیاز داشته اند، به طور معناداری بیش از دانشجویان دیگر است. همچنین فراوانی دانشجویانی که تجربه جست وجوی اطلاعات در وب به صورت گروهی در مکانی مشترک، در مکان های متفاوت، برقراری ارتباط از طریق گفت وگوی برخط یا مکالمه تلفنی، برقراری ارتباط با رایانه یا تلفن همراه مشترک و استفاده از نرم افزارهای اطلاع جویی مشارکتی را داشته اند، به طور معناداری کمتر از کسانی است که تاکنون این نوع جست وجو را تجربه نکرده اند.
نتیجه گیرینتایج پژوهش نشان داد که تمایل به اطلاع جویی مشارکتی دانشجویان تحصیلات تکمیلی دانشگاه شیراز از سطح بالایی برخوردار است. شناخت تمایل این گروه به رفتارهای اطلاع جویی مشارکتی می تواند به مسیولان نظام آموزش عالی کمک کند تا با توجه به اهمیت این نوع رفتار، نسبت به رفع مشکلات احتمالی موجود (مثل استفاده بسیار کم دانشجویان از ابزارهای جست وجوی مشارکتی و وجود بسترهای لازم برای انجام کارهای مشارکتی دانشجویان در مراکز آموزشی و پژوهشی)، و تقویت این رفتارها برنامه ریزی کنند.
کلید واژگان: تجربه اطلاع جویی مشارکتی, تمایل به اطلاع جویی مشارکتی, دانشجویان تحصیلات تکمیلی, اطلاع یابی مشارکتی, جست وجوی مشارکتیPurposeThe level of desired and objective experiences of students during the collaborative information seeking is explored.
MethodThe statistical population in this survey research included all graduate students of Shiraz University in 2020. The sample consisted of 302 students from different faculties, selected according to the Morgan table. Data gatherin too was a researcher-made questionnaire designed by reviewing the literature and extracting relevant items. extracted. To assess the face and the content validity of the questionnaire. The draft of the questionnaire was sent to seven LIS experts, and finalized according to their recommendations. The reliability of the instrument attained Cronbach's alpha coefficient with a value of 0.91.
FindingsThe sample t-test and comparison of means showed that the average of collaborative information seeking behavior in the study is more than the expected average (70%). So it can be said that the tendency of postgraduate students towards collaborative information seeking is high. Also, the results on the subjects' experiences showed that there was no significant difference between the observed and expected frequencies "experience of searching information on the web separately and then discussing with a group about the results" and "Experience searching the web separately with a separate computer or mobile phone". This means that students who had group web search experience (71.2%) as well as students with collaborative information seeking experience in homework and projects (74.2%) were more than those without such experience. Also, the number of students whose group work lasted between one week to one month (35.4%) and students who needed different sources of information (82.8) was higher. On the other hand, significantly more students experience searching the web as a group in a common place, in different places, communicating through online chat or telephone conversation. Those communicate with a shared computer or mobile phone and use collaborative information software less than those who had never experienced this type of search.
ConclusionThe results showed that the tendency for collaborative information seeking is high. Paying attention to this segment of the scientific community can lead to more knowledge of collaborative information seeking experience. Also, recognizing the tendency of this group to participate in collaborative information seeking behavior can help the policy makers of the higher education system to plan, considering solving possible problems such as little use of students 'collaborative search tools and the existence of the necessary platforms for students' collaborative work in educational and research center and strengthen these behaviors.
Keywords: Collaborative Information Seeking Experience, Tendency to Collaborative Information Seeking, graduate students, Collaborative Searching -
هدف
برخی رتبهبندیهای دانشگاهی مانند چارچوب تعالی پژوهش (رف)، برای دستیابی به کیفیت بالاتر، از روش داوری استفاده میکنند. بااینحال، کارایی این روش پایین است. پژوهش حاضر بهمنظور بررسی میزان همگرایی نتایج رتبهبندیهای دارای رویکرد متفاوت به داوری، همبستگی نمرههای دانشگاههای انگلیس را در «رف» و سامانههای رتبهبندی معتبر لایدن، شانگهای، کیو-اس و تایمز بررسی میکند.
روششناسی:
پژوهش حاضر، به روش اسنادی با رویکرد تحلیل محتوای کمی انجام شده است. دادهها به روش سرشماری گردآوری و با تحلیل همبستگی و رگرسیون تحلیل شدهاند.
یافتهها:
قوت همبستگی نمره دانشگاهها در «رف» با «تایمز» و «کیو-اس» قوی، با «شانگهای» متوسط و با ابعاد «لایدن» از ضعیف تا قوی است. نمره کل در «کیو-اس» متاثر از گرایش پزشکی است. تاثیر گرایش موضوعی بر نمره در برخی ابعاد سامانه لایدن مشاهده میشود.
نتیجهگیری:
رتبهبندی مبتنی بر داوری غنیشده با کتابسنجی، همگرایی قوی و درنتیجه مشابهت بالایی را با روش مبتنی بر تلفیق کتابسنجی با آمار عملکردی و نظرسنجی نشان میدهد. اما تلفیق کتابسنجی با آمار عملکردی صرف مشابهت متوسطی با آن دارد و نمیتواند جایگزین آن شود. تاثیر گرایش موضوعی بر نتایج رتبهبندی، کاربرد این نتایج برای مقایسه دانشگاههای دارای پوشش موضوعی متفاوت را به چالش میکشد.
کلید واژگان: ارزیابی پژوهش, نظام رتبه بندی, رف, تایمز, کیو-اس, شانگهای, لایدنPurposeInformed peer-review university ranking systems like REF involve peer review to achieve high-quality university performance evaluations while considering bibliometric facts. Despite its advantages and methodological success, it is not possible to implement the review-based exercise in all countries due to unaffordable costs, vulnerability to bias, and differences in cultural, economic, managerial, and infrastructural conditions. As an alternative, some science systems prefer to consider using the results of international university rankings to gauge the academic performance of their higher education institutions. Using a different methodology, the international ranking systems tend to maintain their efficiency by heavily relying on the bibliometric information extracted from databases, the performance data gathered from official authorities, and academic and employer surveys. This gives rise to the question of to what extent these two types of systems are convergent in their results. If their different methodologies lead to similar results, they could be interpreted to have similar effectiveness in their evaluation of academic performance. Therefore, by relying on the results of the international ranking systems, one can avoid the shortcomings of the review-based method, and maintain both the efficiency and effectiveness of the evaluation systems. To reveal the convergence of the results obtained from the methods, the present study explores a sample of British universities evaluated by REF (2014) to investigate the correlation between their scores in REF and the world’s prestigious university rankings.
MethodologyUsing a quantitative content analysis method, the present study concentrates on a collection of 150 British universities evaluated simultaneously by REF (2014) and at least one of the world's prestigious ranking systems including QS, THE, Leiden and ARWU. Due to the small size of the population, all REF members are examined without sampling. The evaluation results of these universities are extracted from these systems and entered into a checklist. Also, the subject fields and disciplines covered by the universities are collected to investigate their probable effects on the results. The universities’ subject coverage similarity is calculated using the Cosine similarity measure and K Nearest Neighbor technique in the KNIME data mining platform. Finally, correlation and regression analyses are applied to analyze the data.
FindingsUK universities’ scores in REF are found to be significantly correlated to theirs in international ranking systems. They are highly correlated to QS and THE’s, while being moderately associated with ARWU’s, and weakly-to-strongly correlated to Leiden’s. The regression analyses show no significant effects of subject coverage on the overall scores, except for medical tendency’s effect on QS. However, the subject coverage affects some dimension scores. While it does not significantly predict any of the dimensions of ARWU, it partially predicts the Citations and Industry Income dimensions in THE, with medical and technical, and engineering subjects respectively having the highest positive predicting power. In QS, the subject coverage partially predicts the dimensions of Academic reputation, Faculty/student ratio, International faculty ratio, International student ratio, and Citation Per faculty. Medical science has the highest positive effect on the dimensions of Academic reputation, Faculty/student ratio, and Citations per faculty. Moreover, basic sciences have the highest negative effect on the International student ratio and International faculty ratio. Also, the subject coverage can predict Leiden scores for the dimensions PP (top 10%) (i.e. the proportion of a university’s publications that, compared with other publications in the same field and the same year, belong to the top 10% most frequently cited), MCS (i.e. the average number of citations of the publications of a university), MNCS (i.e. the average number of citations of the publications of a university, normalized for field and publication year), PP(collab) (i.e. the proportion of a university’s publications that have been co-authored with one or more other organizations), PP(int collab) (i.e. the proportion of a university’s publications that have been co-authored by two or more countries), PP(industry) (i.e. the proportion of a university’s publications that have been co-authored with one or more industrial organizations) and PP(>1000 km) (i.e. the proportion of a university’s publications with a geographical collaboration distance of more than 1000 km). Medical science has the highest positive predictive power for the scores in all the mentioned dimensions except for PP(industry).
ConclusionThe results of REF, as a peer-review-based university ranking informed with bibliometric data, are highly correlated to those of the international evaluations based on performance statistics and enriched by surveys, while being moderately correlated to those performed by just performance statistics. The subject coverage impact on the rankings challenges the application of the results in comparing universities with different subject coverages.
Keywords: Research Evaluation, University Rankings, REF, THE, QS, ARWU, Leiden -
هدف
هدف پژوهش حاضر شناخت تاثیر اعتماد بر رفتارهای اطلاع جویی مشارکتی دانشجویان تحصیلات تکمیلی دانشگاه شیراز است.
روش شناسیپژوهش حاضر به لحاظ هدف، بنیادی، از حیث ماهیت داده ها، کمی و به لحاظ نحوه گردآوری داده ها از نوع توصیفی همبستگی است. جامعه آماری شامل کلیه دانشجویان تحصیلات تکمیلی دانشگاه شیراز در سال 1399 و نمونه پژوهش شامل 302 نفر دانشجویان دانشکده های مختلف بر مبنای جدول مورگان بود.
یافتهنتایج نشان داد تمایل به رفتار اطلاع جویی مشارکتی می تواند توسط متغیر اعتماد (5/40 درصد) پیش بینی شود. از بین زیرمولفه های اعتماد، زیرمولفه قابلیت اعتماد ادراک شده بیشترین تاثیر (9/32 درصد) را بر تمایل به رفتار اطلاع جویی مشارکتی داشت و بعد از آن رفتارهای همیارانه (8/31 درصد) و تمایل به اعتماد (9 درصد)، قرار می گیرند.
اصالتبا توجه به اهمیت نقش اعتماد در فعالیت های مشارکتی، تاکنون پژوهشی که نقش این مهم را در ارتباط با رفتارهای اطلاع جویی مشارکتی بررسی کرده باشد مشاهده نشد. نتایج پژوهش می تواند منجر به شناخت بیشتر عوامل تاثیرگذار بر رفتارهای اطلاع جویی مشارکتی شود.
کلید واژگان: اطلاع جویی مشارکتی, قابلیت اعتماد ادراک شده, رفتارهای همیارانه, رفتارهای نظارتی, تمایل به اعتمادPurposeThe purpose of this study is to identify the impact of trust on collaborative information seeking behaviors of postgraduate students of Shiraz University.
MethodologyA quantitive approach was applied and survey method was used to analyze the the impact of trust on collaborative information seeking behaviors. The statistical population included all graduate students of Shiraz University in 1399. The sample of this research was randomly calculated from 302 students of different faculties based on Morgan table.
ResultsThe results showed that the tendency to collaborative information seeking behavior can be predicted by the variable of trust (40. 5%). Among the sub-components of trust, the perceived trustworthiness sub-component had the greatest effect (32. 9%) on the tendency to collaborative information seeking behavior, followed by cooperative behaviors (31.8 percent) and the propensity to trust (9 percent), are placed.
OriginalityDespite the potential for trust in predicting collaborative activities, no research has been conducted that has examined the role of this in relation to collaborative information seeking behaviors. The results of the research can lead to a better understanding of the factors affecting collaborative information seeking behaviors.
Keywords: Collaborative information seeking, Perceived trustworthiness, Cooperative behaviors, Monitoring behaviours, Propensity to trust -
عوامل متعددی از مجموعه عناصر تشکیل دهنده سامانه های پیشنهاددهنده در تولید و ارایه پیشنهاد دخیل هستند. مطالعه حاضر، با هدف شناخت تاثیر دو چالش کمبود و پراکندگی داده بر اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست انجام شده است. بدین منظور بیش از 15000 مقاله از نشریه های فنی و مهندسی در بازه زمانی 1392 تا 1396 از وب سایت نشریه ها گرداوری شد. در مرحله بعد عناصر متنی این مقاله ها شامل عنوان، چکیده و واژه های کلیدی استخراج، نرمال سازی و پردازش شد و پایگاه داده پیکره پژوهش ایجاد گردید. بر اساس تعداد مقاله های گردآوری شده، با استفاده از فرمول کوکران تعداد 400 مقاله پایه که پیش از این در نشریه های مرتبط با موضوع منتشر شده بودند، به روش تصادفی- تناسبی، انتخاب شد. عنوان و چکیده این مقاله ها، به منظور دریافت نشریه های پیشنهادی سامانه، جهت چاپ مقاله در دو مرحله پیش و پس از بهبود دو چالش کمبود و پراکندگی داده به عنوان پرسمان وارد سامانه شد. سپس نتایج پیشنهادی در هر مرحله در قالب فایل اکسل ذخیره گردید. در نهایت میزان اثربخشی نتایج سامانه در هر مرحله، به روش اعتبارسنجی یک طرفه و بر اساس معیار دقت در k تعیین شد. فراوانی نسبی رده ها نشان داد در وضعیت موجود، نشریه هدف تنها در 26 درصد از پرسمان ها در 3 رتبه نخست پیشنهاد شده است. در راستای بهبود چالش کمبود داده با غنی سازی، نرمال سازی و پردازش داده ها اثربخشی نتایج در 3 رتبه نخست به میزان 15 درصد افزایش یافت. اما همچنان در بیش از 30 درصد پرسمان ها، نشریه هدف در رتبه 10 و بالاتر پیشنهاد شده بود. بنابراین در مرحله بعد به منظور بهبود چالش پراکندگی، دسته بندی موضوعی داده ها انجام و افزایش 30 درصدی اثربخشی نتایج نسبت به مرحله پیشین در 3 رتبه نخست حاصل گردید. بر این اساس یکی از عواملی که منجر به کاهش اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست می گردد، کمبود و پراکندگی داده ها است؛ که با غنی سازی پایگاه داده، بهبود فرآیند پردازش و دسته بندی موضوعی داده ها می توان به میزان قابل توجهی با این دو چالش مقابله و اثربخشی نتایج پیشنهادی سامانه را بهبود بخشید.
کلید واژگان: اثربخشی, سامانه پیشنهاد دهنده نشریه, کمبود داده, پراکندگی داده, سامانه ژورنال یاب رایسستSeveral factors are involved in the production and presentation of recommender systems.The aim of this study was to investigate the effect of the two challenges lack and sparsity of data on the effectiveness of the proposed results of the RICeST Journal Finder. The corpus includes more than 15,000 articles from technical and engineering publications in the period 2013 to 2017, which have been collected from their website. Textual elements of these articles were extracted, normalized and processed, and a research body database was created. Based on the number of collected articles, by using Cochran's formula, 400 basic articles that previously published in related to the topic of each journal were selected in a random-proportional method. Title and abstract of these articles as a query, in order to receive the system Journals suggested, to print the article in two stages of before and after improving the two challenges of lack and sparsity of data in the test corpus. The suggested results in each step were saved in Excel. Finally, the effectiveness of the system results in each stage was determined by Leave-one-out Cross-Validation method and based on the accuracy criterion in k.The relative abundance of categories showed that, in the current situation, the target journal was suggested in only 26% of searches in the first 3 ranks. After enriching, normalizing and processing the data and thus improving the lack of data challenge, although 30% of the results were still rated above 10; But the accuracy of the results in the first 3 ranks increased by 15%. Also, after thematically categorizing the data with the aim of improving the sparsity challenge, 30% increase in the accuracy of the system results in the first 3 ranks compared to the previous step was achieved. The results of this study showed that enriching the database, improving the processing process and thematic classification of data in RICeST journal finder can reduce the two challengs lack and sparsity of data and increase the effectiveness of the proposed results of this systems.
Keywords: Efficiency, Journal Finder, lack of Data, Data Sparsity, RICeST Journal Finder -
نشریه مطالعات کتابداری و سازماندهی اطلاعات، سال سی و سوم شماره 2 (پیاپی 130، تابستان 1401)، صص 37 -53هدف
شناسایی مهم ترین عوامل موثر در فرمول بندی عبارت جست وجو از طریق مرور نظام مند متون و سپس دسته بندی آن هاست.
روشپژوهش حاضر به شیوه کیفی و به روش فراترکیب تحلیلی در شش گام انجام شد که عبارت اند از: تعیین واژه های کلیدی، ایجاد معیارهای شمول و حذف مقالات، جست وجو در پیشینه، استخراج فهرست الف، ب و ج، تحلیل توصیفی و تحلیل مضمون. در این راستا، براساس چرخه جست وجو و با به کارگیری تعدادی کلیدواژه، که متخصصان تایید کرده اند، پژوهش های مرتبط با عوامل موثر در فرمول بندی عبارت جست وجو مطالعه و بررسی شد. پس از تحلیل توصیفی این منابع، مفاهیم متناسب با موضوع استخراج شد. جامعه آماری این پژوهش شامل 102 مقاله بود که در زمینه شناسایی عوامل موثر در فرمول بندی عبارت جست وجو و در بازه زمانی 1991 تا 2021 نگاشته شده بودند. جست وجوی این منابع در پایگاه های معتبر نظیر وب آو ساینس، اسکوپس، اشپرینگر، امرالد، الزویر، اریک، پروکویست، ابسکو، سایت سیر، اینفورمیشن ریسرچ، لیزا، لیستا و وایلی انجام شد. پس از استخراج مقالات و گردآوری و تحلیل داده های کیفی آن ها، از این تحلیل ها برای تعیین عوامل موثر در فرمول بندی عبارت جست وجو استفاده شد.
یافته هاعوامل موثر در فرمول بندی عبارت جست وجو خود از زمینه های متعددی همچون کاربر و وظیفه بازیابی نشیت می گیرد که می توان آن ها را به دو دسته کلی عوامل مرتبط با کاربر و عوامل مرتبط با وظیفه دسته بندی کرد. دسته اول شامل دانش موضوعی، دانش نحوه کار با سامانه جست وجو، تجربه جست وجو، زبان، ویژگی های جمعیت شناختی، عوامل بافتی، سبک شناختی، بار شناختی و دسته دوم شامل نوع وظیفه جست وجو و دشواری وظیفه بودند. این عوامل به صورت های مختلف فرایند فرمول بندی را متغیر می سازند. تاثیر ناشی از این عوامل را می توان به صورت مثبت و منفی در نظر گرفت؛ برخی از آن ها ممکن است به ارتقای کیفیت فرمول بندی کمک کنند. در مقابل، برخی دیگر ممکن است مانع انجام صحیح این مرحله از بازیابی شوند.
نتیجه گیریازآنجاکه فرمول بندی بخش مهمی از رفتارهای اطلاع یابی است، شناخت عوامل موثر در این فرایند می تواند در کشف الگوهای اطلاع یابی موثر واقع شود. همچنین شناخت عوامل موثر در فرمول بندی عبارت جست وجو سبب بهبود کیفیت آموزش سواد اطلاعاتی از طریق متخصصان این حوزه می شود. از طرفی به طراحان و توسعه دهندگان وب نیز کمک می کند تا ابزارهای جست وجوی متناسب با نیاز کاربر را ایجاد کنند. ضمن اینکه درک چگونگی فرمول بندی عبارت جست وجو تحت تاثیر عوامل گوناگون و شناخت این عوامل، می تواند به افزایش کیفیت جست وجو و بازیابی نتایج مرتبط تر کمک کند و تعامل انسان رایانه را بهبود بخشد.
کلید واژگان: رفتار اطلاع یابی, فرایند جست وجو, فرمول بندی عبارت جست وجو, مرور نظام مند, وظیفه جست وجوPurposeTo identify the most important factors affecting query formulation.
MethodThe design of this study was qualitative. The factors were extracted and categorized through a systematic review and an analytical meta-analysis in six steps. The steps included: determining keywords, creating inclusion criteria and deleting articles, background search, extracting lists A, B and C, descriptive analysis, and thematic analysis. In this regard, based on a search cycle and using a number of keywords approved by experts, articles related to the factors affecting the query formulation were studied. After descriptive analysis of these resources, contents were extracted according to the topic. The research population included all published articles on the factors affecting the query formulation in the period from 1991 to 2021. These resources were searched in reliable databases such as Scopus, Springer, Emerald, Web of Science, Elsevier, Eric, ProQuest, Ebsco, Cite Seer, Information Research, LISA, LISTA and Wiley. After extracting articles, collecting and analysing qualitative data, these analyses were used to determine the factors affecting the query formulation.
ResultsFindings showed that the factors affecting the query formulation itself originate from several fields such as user and retrieval task, which can be classified into two general categories of user-related factors and task-related factors. User-related factors included subject knowledge, knowledge of how to use the search system, search experience, language, demographic features, contextual factors, cognitive style, and cognitive load. Task-related factors included the type of search task and task difficulty. These factors change the formulation process in different ways that can be considered both positive and negative, as some of them may help to improve the quality of the formulation, others may prevent retrieval to be performed correctly.
ConclusionIdentifying factors affecting the query formulation and analysing the relationships between them can improve the quality of information literacy training by experts in this field. Also, it helps web designers create search tools tailored to the user's needs. Since formulation is an important part of information retrieval behaviours, recognizing the influencing factors can help discovering information retrieval patterns. Understanding how to formulate a query under the influence of various factors and recognizing these factors, can help increase the quality of search and retrieve more relevant results and improve human-computer interaction.
Keywords: Query formulation, Information Searching Behaviours, Search process, Search task, Systematic review -
هدف
این مطالعه با هدف مقایسه دیدگاه پژوهشگران حوزه فنی- مهندسی و علوم انسانی در ارتباط با اهمیت معیارهای ارسال مقاله به نشریه و میزان ربط موضوعی نتایج پیشنهادی سامانه ژورنال یاب رایسست انجام شده است.
روش پژوهشپژوهش حاضر به لحاظ هدف کاربردی و روش گردآوری داده ها پیمایشی است. گام اول مطالعه، مبتنی بر پرسشنامه محقق ساخته و دیدگاه پژوهشگران و گام دوم بر اساس سیاهه وارسی مشتمل بر عناصر متنی مقالات و نظر متخصصان موضوعی/ داوران انجام شده است.
نتایجیافته ها نشان داد معیارهای بررسی کارشناسانه/ داوری، ربط موضوعی مقاله با دامنه موضوعی نشریه و داشتن ضریب تاثیر، از دیدگاه پژوهشگران در هر دو حوزه مورد بررسی، دارای بیشترین میزان اهمیت و قدمت نشریه در رتبه آخر قرار داشت. همچنین سنجش میزان ربط موضوعی نتایج پیشنهادی سامانه، بر اساس نظر متخصصان نشان داد در بیش از 85 درصد پرس-وجوها، نشریه پیشنهادی برای مقاله مورد نظر کاملا مرتبط است و تفاوت معنی دار آماری بین نظر متخصصان/داوران در این دو حوزه وجود ندارد.
نتیجه گیریبا توجه به امکان پالایش نتایج پیشنهادی بر اساس معیارهای دارای اولویت، بنظر میرسد استفاده از این سامانه می-تواند به عنوان ابزار کمکی برای پژوهشگران مفید واقع شود.
کلید واژگان: انتشار مقاله, پژوهشگران, رایسست, ژورنال یاب, معیارهای انتخاب نشریه, نشریه مرتبطAimThis study aims to compare the researchers' views in two fields about the importance of criteria for submitting an article to the journal and the degree of thematic relevance of the proposed results of the RICeST Journal Finder.
MethodologyThe research is a survey in terms of applied purpose and the data collection method and was done in two steps; First, due to the lack of a standard questionnaire, while studying the literature, important and common criteria for the researchers of the two fields were extracted and a researcher-made questionnaire consisting of 13 criteria was prepared. The face and content validity of the questionnaire was done by 10 experts in information science and epistemology. Then, in order to identify the importance of the criteria as well as the thematic relevance of the system's proposed results, subject matter experts (reviewers) in two fields from all over Iran were used.
FindingsCriteria of Peer review, thematic relevance of the article with the thematic scope of the journal, and having an impact factor from the perspective of researchers in both groups, were the most important and the age of the journal was the least. Measuring the thematic relevance of the results suggested by the system using the opinions of experts showed that in more than 85% of the queries, the proposed publication for the article is completely relevant. There is no statistically significant difference between the opinions of experts in these two areas. It is necessary to explain that the evaluation of the thematic relevance of the results was done after improving the existing challenges in the RICeST journal finder.
ConclusionThere are many Journals in various scientific fields, so authors are facing challenges to find the most appropriate journal to publish their research findings. The results showed that the importance of the criteria of selecting the journal, from the viewpoint of national researchers, is consistent with the findings of international studies. However, considering the mental variables of researchers in different conditions, it is not possible to consider a single factor category to choose a journal to publish a manuscript; However, the possibility of refining the results, based on the priority criteria of the researchers has been introduced the use of Journal finder systems as an auxiliary tool that can be found more quickly and easily to a list of related publications. Among the other factors that can be examined objectively and are important, regardless of the author's priorities and limitations, is the thematic connection of the manuscript with the journal to which the manuscript is to be sent and published, which is the basis of the performance of the Journal finder systems. In general, according to the obtained results, the authors can use the RICeST journal finder at the national level to obtain relevant journals to publish the manuscript.
Keywords: Related Journal, Article Publishing, Journal Selection Criteria, Researchers, RICeST, Journal Finder -
مقدمه
در زمان بحران های سلامت مانند همه گیری کووید 19، افزایش اخبار نادرست و شایعات، تشخیص اخبار صحیح را دشوار می کند. همچنین، با وجود خطرات موجود، برخی با نپذیرفتن واکسن، ایمنی جامعه را به خطر می اندازند. در تلاش برای روشن ساختن علل این رفتار مخاطره آمیز، در تلاش برای روشن ساختن علل این رفتار مخاطره آمیز، پژوهش حاضر با هدف تعیین توانایی تشخیص اخبار جعلی بر پذیرش واکسن کووید 19 در دانشجویان دانشگاه شیراز انجام شد.
روش بررسیایاین مطالعه به روش پیمایشی انجام گردید. ابزار تحقیق، پرسش نامه الکترونیکی ترکیبی شامل پرسش نامه پذیرش واکسن Montagni و همکاران، مقیاس تشخیص اخبار جعلی طراحی شده توسط محقق و پرسش نامه درک خطر Champion بود. نمونه گیری به روش داوطلبانه انجام شد. 382 دانشجوی دانشگاه شیراز (در سال تحصیلی 1401-1400) به پرسش نامه پاسخ دادند. داده ها با استفاده از آزمون های 2c و Binary Logistic Regression مورد تجزیه و تحلیل قرار گرفت.
یافته ها72 درصد از دانشجویان پذیرای واکسن بودند و 8/62 درصد درک متوسطی از خطر این بیماری داشتند. رابطه مثبت و معنی داری بین متغیر توان تشخیص اخبار جعلی با پذیرش واکسن مشاهده گردید. به عبارت دیگر، هرچه افراد در تشخیص اخبار جعلی توانمندتر بودند، احتمال قرارگیری آن ها در گروه «مردد در واکسیناسیون» نسبت به گروه «پذیرای واکسن» نزدیک به 8/0 برابر کمتر بود.
نتیجه گیریپذیرش اخبار جعلی درباره واکسن کووید 19 می تواند به کاهش پذیرش واکسن بینجامد. این یافته دلالت بر نقش سواد تشخیص اخبار جعلی در کنترل رفتار افراد و در نتیجه، ارتقای سلامت جامعه دارد.
کلید واژگان: واکسن کووید 19, اطلاعات نادرست, دانشجویانIntroductionDuring health crises, such as Coronavirus disease 2019 (COVID-19) pandemic, the spread of fake news and rumors makes it difficult to distinguish real news. Besides, despite dangers, some endanger public safety by avoiding vaccination. It is not clear to what extent the individuals understand the dangers, and are influenced by the fake news. To elucidate the causes of this risky behavior, this study examined the role of fake news detection and risk perception in vaccine acceptance among students of Shiraz University, Shiraz, Iran.
MethodsResearch method was survey, and research tool was a combined electronic questionnaire, including vaccine acceptance questionnaire of Montagni et al., fake news detection, developed by the researcher, and the risk perception questionnaire of Champion. The sampling method was voluntary. 382 students from Shiraz University (academic year of 2021-2022) answered the questionnaire. Data were analyzed through chi-square and binary logistic regression tests.
Results72.0% of students were vaccine acceptant, and 62.8% had a moderate risk perception regarding the disease. Although the students' demographic characteristics and risk perception showed no significant correlation with the vaccine acceptance, their ability to detect fake news had a significant positive correlation. In effect, the participants with higher fake news detection scores were 0.8 times less likely to be classed in the vaccine hesitant group, compared to the vaccine acceptance ones.
ConclusionAcceptance of fake news about COVID-19 vaccine may reduce the vaccine acceptance. This finding highlights the key role of fake news detection literacy in controlling the behavior of individuals, and thus the safety of society.
Keywords: COVID-19 vaccines, Disinformation, Students -
پژوهش حاضر با هدف شناخت جنبه های دسترسی آزاد مورد توجه کاربران شبکه اجتماعی «توییتر» و تحلیل عقاید آنان در این باره انجام شد. نمونه ای از توییت های انگلیسی درباره دسترسی آزاد شناسایی و به روش تحلیل محتوای کمی با رویکرد تحلیل عقاید مطالعه شد. بدین منظور، نخست جنبه های مختلف دسترسی آزاد با مرور ادبیات حوزه شناسایی و در قالب فرمول های جست وجو تدوین شد. این گام به بازیابی 874270 توییت انجامید. داده ها با کمک جست وجوی انطباق دقیق در «اکسل» پاکسازی و نمونه ای مشتمل بر 165320 توییت مرتبط به دست آمد و سپس، نمونه به چهار گروه موضوعی «هزینه و منابع مالی»، «نشر و منابع»، «مدل ها» و «اعتبار و کیفیت» دسترسی آزاد دسته بندی شد. پردازش متن و محاسبه نمره عقیده توییت ها به ترتیب با نرم افزار «نایم» و «سنتی استرینگث» انجام شد. تحلیل داده ها با آمار توصیفی و استنباطی در «اکسل» و «اس پی اس اس» صورت گرفت. نتایج نشان داد که مفاهیم مرتبط با «نشر و انواع منابع دسترسی آزاد» از بیشترین توییت برخوردارند. چنانچه این گروه به دلیل کلیت و عمومیت آن نادیده گرفته شود، «اعتبار و کیفیت» و «هزینه ها و منابع مالی» دو موضوع اصلی مورد توجه کاربران «توییتر» است. بر اساس نتایح عقیده کاوی، بیش از نیمی از توییت ها خنثی بوده و فراوانی عقاید مثبت با اختلاف کمی از عقاید منفی بیشتر است. با این حال، دو موضوع «اعتبار و کیفیت» و «هزینه ها و منابع مالی» بیش از همه توییت های منفی گرفته اند. به این ترتیب، همسو با نتایج پیمایش های پیشین، که با هدف کشف دغدغه های محققان و ذی نفعان دسترسی آزاد انجام شده، پژوهش حاضر تصویری کم وبیش یکسان را برای فضای اجتماعی به دست داد. از آنجا که دسترسی آزاد به اطلاعات علمی در جهت توسعه جوامع دانش بنیان یک ضرورت محسوب می شود، نتایج تحقیق حاضر لزوم برداشتن گام هایی جدی برای تقویت نقاط مثبت و اندیشیدن راهکارهایی برای رفع مسایل و چالش هایی که به عقاید منفی منجر شده است، برجسته می سازد.
کلید واژگان: دسترسی آزاد, تحلیل احساس, عقیدهکاوی, شبکه اجتماعی, توییترThis study aimed to identify the main features of Open Access tweeted by Twitter users and to analyze their opinions about them. A sample of English tweets about Open Access was identified and analyzed using a quantitative content analysis method with opinion mining approach. To do so, based on a wide literature review, the main features of Open Access discussed in the literature were identified and used to compose the search formula. This step retrieved 874270 tweets. The data were, then, cleaned using exact match search in Excel, resulting in a sample consisting of 165320 relevant tweets. The sample was, then, classified into four thematic groups including “costs and financial resources”, “publication and resources”, “models” and “validity and quality”. To analyze the tweets’ contents and calculate their opinion scores, the KNIME and SentiStrength applications were used, respectively. The data were analyzed using descriptive and inferential statistics in Excel and SPSS. The results showed that the concepts related to the Open Access “publication and resources” have been tweeted the most. The group being set aside given its all-inclusive nature, the “credibility and quality” as well as the “costs and financial resources” are the two main issues discussed by Twitter users. According to the opinion mining results, more than half of the tweets were neutral and the positive opinions are of slightly higher frequency compared to the negative ones. The “credibility and quality” and the “costs and financial resources” received more negative tweets. Thus, in line with previous surveys conducted to explore the concerns of researchers and stakeholders about Open Access, the present study provided an almost similar picture for the social space. Since Open Access to scientific information is a necessity for the development of knowledge-based societies, the results highlight the need to take serious steps to strengthen its positive points and devise solutions to the problems and challenges leading to the negative feedbacks.
Keywords: Open Access, Sentiment Analysis, Opinion Mining, Social Networks, Twitter -
هدف
هدف از پژوهش حاضر، مطالعه همبستگی میان نمرات دانشگاه ها در نمایه نیچر و لایدن به عنوان دو سامانه رتبه بندی ساده مبتنی بر کتاب سنجی با دو سامانه پیچیده تایمز و کیو-اس است.
روش شناسی:
این پژوهش با روش مطالعه اسنادی انجام شده است. نمونه ای در دسترس از دانشگاه های برتر که به طور مشترک در سامانه های رتبه بندی نمایه نیچر، لایدن، تایمز و کیو-اس در سال های 2017-2012 رتبه بندی شده بودند انتخاب و از روش همبستگی اسپیرمن برای شناسایی رابطه آماری بین نتایج سامانه های مزبور استفاده شد.
یافته ها:
یافته های پژوهش نشان داد که رابطه آماری معنادار و مثبتی بین نمره دانشگاه ها در رتبه بندی نمایه نیچر و لایدن با تایمز و کیو-اس وجود دارد. اما همبستگی بین رتبه بندی نمایه نیچر و لایدن با تایمز به مراتب قوی تر از همبستگی بین نمرات آن دو رتبه بندی با کیو-اس است.
نتیجه گیری:
به طور کلی، نوعی همسویی متاثر از تشابه در ابعاد و شاخص ها به ویژه ابعاد مرتبط با بهره وری پژوهشی در بین سامانه های رتبه بندی ساده و پیچیده وجود دارد. بااین حال این هم پوشانی ها به انداز ه ای چشمگیر نیست که بتوان گفت نتایج حاصل از سامانه های رتبه بندی کاملا مشابه است.
کلید واژگان: رتبه بندی دانشگاه ها, لایدن, نمایه نیچر, تایمز, کیو-اسPurposeThe present study aimed to investigate the correlation between universities scores in Leiden and Nature index as two simple ranking systems based on bibliometrics with two complex systems, Times and QS.
MethodologyUsing a documentary research method, the present study investigates an available sample consisted of the top universities commonly ranked in Leiden, Nature index, Times and QS university ranking systems during 2012-2017. Spearman's correlation analysis was used to identify the statistical relationship between the results of these systems.
FindingsThe findings showed significant and positive statistical correlations between university scores in Leiden and Nature index on the one hand and those of Times and QS ranking systems on the other hand. However, the results of the Nature Index and Leiden ranking system showed to be more strongly correlated with Times’ than with QS’.
Conclustion:
There exist degrees of alignment between the results of the simple and complex university ranking systems, brought about by their similarities in dimensions and indicators, especially in those related to research productivity. However, the associations are not so strong to lead to identical ranking results.
Keywords: University ranking, Leiden, Nature Index, Times, QS -
مقدمه
اعتبارسنجی مقالات دسترسی آزاد، همواره از جمله دغدغههای جامعه علمی بوده است. از آنجا که تحلیل استنادی کمی در ارزیابی مقالات علمی با چالش روبهرو است، تحلیل استنادی محتوامحور از جمله عقیدهکاوی بافتار استناد، میتواند تصویر روشنتری از اعتبار آنها ارایه دهد. هدف از انجام پژوهش حاضر، بررسی عقاید استنادگران درباره مقالات پزشکی دسترسی آزاد و مقایسه آنها با مقالات دسترسی غیر آزاد مشابه بود.
روش بررسیاین مطالعه به روش تحلیل محتوای کمی با رویکرد تحلیل استنادی عقیدهکاوانه انجام شد. اطلاعات مقالات از پایگاههای PubMed، بافتارهای استناد از پایگاه Colil و نمره عقیدهای بافتارهای استناد از SentiWords استخراج گردید. پس از پردازش زبان طبیعی متن چکیدهها، عناوین و بافتارهای استناد، شباهت کسینوسی مقادیر TF-IDF (Term Frequency-Inverse Document Frequency) محاسبه و مقالات دسترسی آزاد و غیر آزاد مشابه زوج شدند. دادهها با استفاده از آزمون Friedman و همبستگی مورد تجزیه و تحلیل قرار گرفت.
یافتهها:
اختلاف معنیداری در نمره میانگین عقیده مقالات دسترسی آزاد با مقالات دسترسی غیر آزاد مشابه وجود نداشت؛ اگرچه اختلاف استنادات آنها معنیدار بود. همچنین، همبستگی معنیداری بین فاصله عقیدهای مقالات دسترسی آزاد و غیر آزاد با شباهت متنی و بافتار استناد آنها مشاهده نشد.
نتیجهگیری:
اگرچه مقالات دسترسی آزاد بیشتر از مقالات دسترسی غیر آزاد، استناد دریافت کردهاند، اما عقاید استنادگران درباره این دو گروه مقاله تفاوت معنیداری ندارد. همچنین، آثاری که به لحاظ موضوعی با هم شباهت دارند، لزوما وضعیت عقیدهای مشابهی را نشان نمیدهند. از اینرو، لزوم تحلیلهای محتوامحور برای تکمیل نتایج تحلیل استنادی کمی تایید میشود.
کلید واژگان: بافتار استناد, تحلیل استنادی, دسترسی آزاد به اطلاعات, عقیده کاویIntroductionScientific communities have always been concerned about validity of open-access articles. Given the challenges of quantitative citation analysis in evaluating scientific articles, content-based citation analysis, including opinion mining of citances, can bring about more transparent results about their validity. In view of this, the present study compared the opinions contained in citances about open-access and non-open-access articles.
MethodsWe used a quantitative content analysis method with citation and opinion analysis approaches. The citances, bibliographic, and bibliometric data were extracted from Colil and PubMed databases. Opinion scores were assigned to the citances through SentiWords. After processing the titles, abstracts, and citances, Cosine similarity of Term Frequency-Inverse Document Frequency (TF-IDF) values were calculated. The open-access and non-open-access articles were then paired by their similarities in abstracts, titles, and citances. The data were analyzed using Friedman test and Spearman correlation.
ResultsThere was no significant difference between the open-access and non-open-access articles in terms of their opinion scores, despite a significant difference in citation advantages. The pairs’ citance and textual similarities had no significant correlation with their opinion distance.
ConclusionAlthough the open-access studies had citation advantage over their similar non-open-access peers, they showed no significant opinion distance. Besides, similar texts did not necessarily follow the same opinion patterns. Consequently, to complete the results of quantitative citation analysis, the content-based citation analysis is emphasized
Keywords: Citances, Citation Analysis, Open Access to Information, Opinion Mining -
استخراج کلمات/ عبارات کلیدی متن، پیشنیاز بسیاری دیگر از وظایف حوزه پردازش زبان طبیعی است. اما بررسی متون فارسی و انگلیسی این حوزه نشان می دهد، تلاشهای انگشتشماری برای استخراج کلمات/ عبارات کلیدی از متون فارسی صورت گرفته است. لذا، این مقاله، با هدف تعیین موقعیت کنونی پردازش زبان طبیعی فارسی و بهطور خاص استخراج کلمات/ عبارات کلیدی از متون فارسی، به مرور خلاصهای از مقالات فارسی و انگلیسی منتشرشده در این حوزه که از متون فارسی برای آزمودن ایدههایشان استفاده کردهاند، میپردازد؛ سپس هر مقاله را از نظر روششناسی، نحوه اجرا و پیادهسازی، روش ارزیابی و معیارهای آن مورد تعمق قرار داده و به چالش میکشد.در مجموع 14 مقاله فارسی و 6 مقاله انگلیسی به استخراج کلمات و عبارات کلیدی از متون فارسی پرداخته اند. روش بیشتر این مقالات، استفاده از اطلاعات آماری و زبانشناختی بوده است. اکثر این مقالات یا در روششناسی انتخاب شده ایراد دارند و یا نویسندگان نتوانسته اند ایده پیشنهادیشان را به وضوح برای خواننده تبیین نمایند. در بسیاری از مقالات، از مجموعه داده استانداردی برای ارزیابی سیستم استفاده نشده و نحوه محاسبه معیارهای ارزیابی مبهم یا دارای اشکال است.در مجموع، به جز 3 مقاله که روش اجراشده را به نحو نسبتا قابلقبولی گزارش کردهاند، سایر مقالات قابلیت تکرارپذیری و تعمیم ندارند. لذا نمیتوان از آنها به عنوان معیار پایهای برای ارزیابی سیستمهای آینده استفاده کرد یا از ایده مطرح شده در آنها با اطمینان در ساخت و توسعه نرمافزارهای کاربردی و عملی در حوزه استخراج کلمات کلیدی استفاده نمود.
کلید واژگان: استخراج کلمات کلیدی, استخراج عبارات کلیدی, پردازش زبان طبیعی, زبان فارسی, بررسی مروریKeyword and phrase extraction is a prerequisite of many natural language processing tasks. However, a review on the related Persian and English literature showed that a few studies have already been done on how to extract keywords and phrases from Persian texts. Thus, Aiming to shed light on the research status of Keyword and phrase extraction from Persian texts, the present study reviews the Persian and English publications which have assessed their research ideas over Persian texts. We also focus on each of the studies to challenge their methodologies, implementations and evaluation methods and measures.To our knowledge, a total number of 14 Persian and 6 English papers exist which have worked on the extraction of Persian keywords and phrases. Investigating on the papers revealed that they were mostly based on statistical and linguistic information. A majority of the papers suffered from the lack of either appropriate methodologies or lucid explanation of their research ideas. They generally used non-standard datasets and vague or problematic metrics to evaluate the experimental systems. Generally speaking, except for 3 papers that appropriately reported their proposed methods, the other papers lacked reproducibility and generalizability. Hence, their results cannot be confidently used as a benchmark in evaluating future works, and their proposed ideas cannot be employed in developing applications for extraction of key words and phrases from Persian texts.
Keywords: extraction, key words, key phrases, natural language processing, Persian language, review -
بررسی مقاله های نوسانات اقلیمی و میزان انعکاس آن در رسانه های اجتماعی: تحلیلی علم سنجانه و دگرسنجانه
با توجه به گسترش وب اجتماعی و قابلیت های آن در انتشار یافته های علمی و استقبال پژوهشگران برای بهره مندی از پتانسیل وب اجتماعی در راستای افزایش رویت پذیری بروندادهای علمی و کسب اعتبار و از سوی دیگر اهمیت توجه به تاثیر پژوهش ها و تعیین مطالعات اثرگذار، پژوهش حاضر با هدف توجه جامعه علمی به مسایل مرتبط با نوسانات اقلیمی و پتانسیل شبکه های اجتماعی در انعکاس یافته های علمی این حوزه و ارایه تصویری از وضعیت پژوهش های این حوزه انجام گرفته است. پژوهش حاضر از نوع کاربردی، با رویکرد علم سنجی و استفاده از روش دگرسنجی در کنار استفاده از تحلیل هم واژگانی است که در آن تمامی مقاله های مرتبط با نوسانات اقلیمی از پایگاه وب علوم استخراج و میزان انعکاس آنها در رسانه های اجتماعی از طریق سایت آلتمتریک استخراج و با استفاده از نرم افزارهای اکسل، ووس ویویر و SPSS ویرایش 20 مورد تحلیل قرار گرفتند. نتایج نشان داد که تعداد 2755 مقاله این حوزه، تعداد 89129 استناد طی 41 سال گذشته در پایگاه وب علوم دریافت کرده اند، بیشترین میزان استناد با 1458 استناد به مقاله ای در سال 2000 مربوط است. نرخ رشد انتشارات این حوزه، 2366 درصد با بیشترین میزان انتشار مقاله در سال 2017 می باشد. کشورهای آمریکا، چین و آلمان رتبه های اول تا سوم بیشترین تولیدکنندگان مقاله های این حوزه و کشور ایران رتبه 43 ام را دارد.از تعداد 2556 مقاله که دارای نشانگر رقومی بودند، تعداد 1447 مدرک در سایت آلتمتریک بازیابی که در مجموع تعداد 8832 استناد اجتماعی از رسانه های مختلف دریافت کرده اند. بیشترین میزان انعکاس و استفاده از مقاله های مربوط به نرم افزار مدیریت مراجع مندلی و خوانندگان آن با 92358 بار مطالعه و توییت کاربران با 6480 توییت می باشد. رتبه های سوم تا پنجم به رسانه های خبری، وبلاگ ها و اسناد سیاست گذاری تعلق داشت. کاربران کشور آمریکا فعال ترین کاربران اجتماعی در این حوزه بوده اند. بیشینه نمره آلتمتریک 651 و 82 مربوط به اثرگذارترین مقاله های خارجی و داخلی (ایرانی) منتشر شده است که در سال 2016 و 2015 به چاپ رسیده اند. نتایج آزمون همبستگی اسپیرمن نشان داد که رابطه معنی دار اما ضعیفی میان استنادهای دریافتی در وب علوم و اغلب دگرسنجه های تحت پوشش آلتمتریک وجود دارد.حوزه موضوعی علوم چند رشته ای جزو پرانتشارترین و پراستنادترین موضوعات این حوزه می باشد.مصورسازی مقاله های این حوزه نشان داد که واژگانی چون دمای سطح آب دریا، گرمایش جهانی، نوسانات جنوبی، پدیده ال نینو و... از جمله مهمترین و پربسامدترین واژگان مطرح در میان مقاله های حوزه نوسانات اقلیم هستند. ارزش پژوهش حاضر در ارایه تصویری از چهار دهه تولیدات علمی این رشته و شفاف سازی میزان توجه کاربران رسانه های مختلف اجتماعی به مقوله نوسانات آب و هوایی و امکان استفاده از دگرسنجه ها، در ارزیابی پژوهش است.
کلید واژگان: نوسانات اقلیمی, علم سنجی, دگرسنجی, رسانه های اجتماعی, تحلیل هم واژگانیIntroductionConsidering the development of social web, its capacities in publishing research findings, researchers’ tendency in utilizing social web to increase their visibility, beside the importance to answer the question of how to measure the research social impact, the present study attempts to provide new insights into the amount of scientific and social users' attention to climate variability articles and do co-occurrence analysis of the key terms. This is to provide scholars with a knowledge visualization in the field and help them identify central or neglected issues.
Materials and methodsThe current applied research was conducted through altmetrics method along with the use of co-word analysis. The climate variability articles analyzed using descriptive and analytic statistics in Excel, VoS viewer and SPSS version 20.
Results and discussionThe results showed that a number of 2755 articles in the field received 89129 citations over the past 41 years. The most cited article published in 2000, received 1458 citations. The growth rate of the publications in the field was 2366 percent with the largest number of annual publications in 2017. The United States, China and Germany contributed the largest number of articles, respectively, while Iran ranked 43. From among 2556 articles with DOIs, a number of 1447 items were available from Altmetric explorer and received a total of 8832 social citations in 14 social Medias. Mendeley (92358 reads) and Twitter (6480 tweets) were the most used social media, respectively, followed by news outlet, blogs, and policy documents. The most active users of Twitter, Facebook, news media and policy documents are from the US. The altmetrics attention score of the most influential papers is 651 and for an Iranian paper was 82, published in 2016 and 2015 respectively. Spearman test showed that there was a significant though weak relationship between citation and altmetric score. The most productive, most socially and academic cited subject categories was multidisciplinary sciences. Visualizing climate variability articles revealed that sea surface temperature, global warming, southern oscillation, and El Niño were the most frequently used key terms in the articles.
ConclusionThe value of this research lies in providing a picture of four decades of research in the field and in the clarification of the extent to which social network users pay attention to climate variability issues and how much is the power of altmetrics in showing the impact of science on society and research evaluation.
Keywords: Climate Variability, Scientometric, Altmetrics, Social Media, Co-word Analysis -
مسئله پژوهش حاضر، مطالعه متون علمی و متون اجتماعی نظیر آنها، با هدف بررسی نفوذ استنادی و نفوذ اصطلاحات متون علمی در متون اجتماعی است. انتظار میرود، متن اجتماعی به وسیله استناد به متون علمی پلی باشد بین دانشمندان و کاربران فضای اجتماعی تا بتوان به کمک پردازش واژگان هر یک از متون علمی و اجتماعی و سنجش شباهت آنها به کمک شاخص دربردارندگی، میزان نفوذ واژگانی یا نفوذ علم در اجتماع را، مشاهده نمود. اساس داده های آماری پژوهش حاضر را، مقالات علمی حوزه موضوعی تغییرات آب و هوا منتشر شده در مجلات تحت پوشش پایگاه وب علوم تشکیل می دهد، که نقش جامعه پژوهش را دارند. اعضای نمونه شامل 9876 متن علمی و اجتماعی (7912 متن اجتماعی استناد کننده به 1964 متن علمی) که به کمک کد پایتون و بسته سوپ زیبا از محیط وب، استخراج و در قالب فایل های .txt ذخیره گردید. فایل های pdf به صورت دستی استخراج و به فایل txt تبدیل شدند. با استفاده از مدل نمایه سازی خودکار شکاف و زبان عبارات الگودار، اصطلاحات نمایه سازی شده متون علمی و اجتماعی و اصطلاحات مشترک میان آنها، مشخص و بر اساس طول آنها و به تفکیک نوع مدارک اجتماعی، دسته بندی شدند. سنجش میزان نفوذ با استفاده از شاخص دربردارندگی، نشان داد که میانگین شدت نفوذ برابر با 27 درصد است. همبستگی مثبت، معنادار و قوی (76/0) بین تعداد اصطلاحات مشترک و شدت نفوذ علمی وجود دارد. نتایج آزمون مجذور کا نیز، نشان داد که رابطه معناداری در سطح 1% بین تعداد واژگان اصطلاح (طول اصطلاح) و شدت نفوذ، وجود دارد. همچنین بین سطح شدت نفوذ و نوع مدارک اجتماعی اعم از خبر، وبلاگ، اسناد سیاست گذاری، ویکی پدیا و متن داوری ها، تفاوت وجود دارد. بیشترین درصد نفوذپذیری مربوط به اسناد سیاست گذاری و سپس ویکی پدیا است. کسب 22 استناد علمی و 40 استناد اجتماعی به طور میانگین برای هر مقاله، و همبستگی قوی میان استناد و نمره آلتمتریک، نشان دهنده نفوذ استنادی مقالات در میان جامعه دانشگاهی و غیردانشگاهی است. در مجموع می توان از قدرت دگرسنجه هایی چون اسناد سیاست گذاری، ویکی پدیا و وبلاگ ها و نفوذپذیری واژگانی آنها، جهت ترویج هرچه بیشتر و بهتر یافته های علمی استفاده نمود و با نشر علم در این منابع حتی با زبانی متفاوت از زبان نگارش نویسندگان، به آگاهی بیشتر جامعه و عموم مردم، کمک نمود.
کلید واژگان: نفوذ علمی, شباهت واژگانی, شاخص دربرداردگی, آلتمتریک, استنادThe present survey aims to study the scientific texts and social texts linked each other by citations in order to investigate the influence of scientific terms on social texts. The social text is expected to be a bridge between scholars and users by citing scientific texts. By indexing scientific and social text and measuring its similarity by means of an inclusion index, it is possible to see the influence of scientific terms on social texts. The basis of the statistical data of the present study is the scientific papers on climate change issues published in the journals covered by the Web of Science, which have the role of the research community. Sample members consisted of 9876 scientific and social texts (7912 social texts cited 1964 scientific texts) that were extracted and stored in .txt files with the help of Python web scraping using beautiful soup package. The pdf files were extracted manually and converted to a txt file. The indexed terms of the scientific and social texts and the common terms between them, were identified and categorized according to their length and document types separately using the automatic negative indexing model and regular expressions. Measuring the penetration of scientific terms on social texts using the inclusion index, showed that the average penetration rate was 27%. There was a positive, significant and strong correlation (0.76) between the number of common terms and academic penetration. The results of chi-square test showed that there is a significant relationship at 1% level between the term length and the average penetration rate. There is also a difference between the level of penetration and the type of social documents type, including news, blogs, policy documents, Wikipedia, and peer reviews. The highest percentage of penetration is related to policy documents and then Wikipedia. Obtaining 22 citations and 40 social citations on average per paper, and the strong correlation between citation and altmetric score, indicates the citation influence among the academic and non-academic community. Collectively, with the power of altmetrics like policy documents, Wikipedia and blogs and their permeability, they can be used to further promote scientific findings. Publishing scientific findings in these sources, even in a different language from scientific authors, can contributed to greater awareness of society and the general public.
Keywords: Altmetrics, Citation, Inclusion Index, Scientific Influence, Lexical similarity -
هدف پژوهش حاضر، شناخت چالش های برگردان نام های فارسی به انگلیسی و فراوانی این چالشها در پایگاه وب آف ساینس است. این پژوهش به لحاظ هدف کاربردی و از نظر نحوه گردآوری داده ها کمی از نوع پیمایشی است. جامعه ی پژوهش شامل نام های نویسندگان ایرانی در پایگاه وب آف ساینس می باشد که در بازه ی زمانی هفت ساله ی 2010 تا 2017 مقاله ی انگلیسی نگاشته اند. تعداد 3110873 نام در ابتدا بازیابی شد که پس از پالایش و یکدست سازی اسامی به 11242 نام تقلیل یافت. به منظور پالایش، آماده سازی و تحلیل داده ها از نرم افزار بیب اکسل، اکسل و پایگاه وب آف ساینس استفاده شد. یافته های پژوهش نشان داد در برگردان نام ها از فارسی به انگلیسی چهار گروه چالش های مربوط به "همخوان ها"، چالش های مربوط به "واکه ها" ، چالش های مربوط به "حذف یا تکرار حروف" و چالش های "تلفظی" وجود دارد. در دسته ی اول، چالش های همخوان ها، نویسندگان و نگارندگان در برگردان نام ها در یازده حرف (8 واج)، شامل حروف ق، غ، ژ، ع، و، ک، ج، ک، ث، س، ص، صورت های مختلف نگارشی داشته اند. در دسته ی دوم (چالش واکه ها)، صورت های نگارشی مختلفی در برگردان واکه های (/ i/ ، /u/، توالی واج های /e / و / j/ ،/ o/) و پایانه (ه) از فارسی به انگلیسی مشاهده شد. در دسته ی سوم، وجود حروف مشدد و حروف (ال) در برخی نام ها موجب به وجود آمدن چندگانگی در نگارش نام ها شده است.و در نهایت در در دسته آخر، آواهای ا و ا، و همچنین حذف برخی حروف به علت تفاوت در تلفظ نام ها در گویش ها و زبان های مختلف دچار چندگانگی شده اند. با توجه به اهمیت بازیابی اسامی در جستجوی نویسندگان و همچنین در ارزیابی پژوهش، راهکارهایی همچون استفاده از عملگر های بولی و نویسه جایگزین بین صورت های نگارشی غالب، ایجاد ساندکس زبان فارسی، مجهز کردن پایگاه به ابزارهای دانشی ویژه نام، جهت یکدستی در برگردان نام ها ضرورت دارد.
کلید واژگان: بازیابی اطلاعات, پایگاه وب آوساینس, برگردان انگلیسی به فارسی, چالش های برگردان نام هاThe present study investigated the challenges of transliteration of Persian names to English ones, and the impact of these challenges on the recall of web of science’s retrieved results. This study is applied in terms of objectives and quantitative (i.e., survey) in terms of data collection procedure. The population included the names of Iranian authors who had published an English article in Web of Science between 2010 and 2017. First of all, 3110873 names were retrieved. It reduced to 11,242 after homogenization process. Data was collected through Bibexcel and Excel software and Web of Science database. The findings showed that there were three types of challenges (i.e., vowels, consonants, and omitted or double consonants) in transliteration of Persian names to English ones; they resulted in non-homogenous and different written forms. In addition, the results of Chi-square test showed that the frequency of all forms of the mentioned challenges had a significant effect on the recall of the retrieved results. Considering the importance of retrieving the names in retrieval studies as well as research studies’ evaluation, some solutions, such as the using Boolean operators and wildcards between the prevailing typographical forms, creating Persian soundex, and equipping the database with the thesaurus, are suggested
Keywords: Recall, Information Retrieval, Studies’ Evaluation, Transliteration of Persian Names to English, Names Transliteration Challenges -
نشریه مطالعات کتابداری و سازماندهی اطلاعات، سال سی و یکم شماره 2 (پیاپی 122، تابستان 1399)، صص 86 -103هدف
شناسایی قابلیت داوری های آزاد در بازشناخت مقالات پزشکی براساس شباهت آنها به مقالات مربوط.
روش شناسیآزمونی متشکل از 2212 مقاله اف هزار ریسرچ و نظرات داوری آنها ساخته شد. 100 مقاله به عنوان مدرک پایه به صورت تصادفی انتخاب شد. شباهت نظرات داوری و محتواهای مدارک براساس سنجه شباهت کسینوسی مقادیر TF-IDF در سطح تک واژه ها و دوواژه ها محاسبه شد. شباهت محتوا و نظرات با تحلیل همبستگی اسپیرمن تحلیل شد. صحت پیش بینی شباهت محتوای مقالات براساس شباهت نظرات دریافت شده به کمک منحنی مشخصه عملکرد سامانه آزمون شد.
یافته هاتوان نظرات داوران در بازشناخت مقالات مشابه تایید شد. میان محتوا و نظرات، همبستگی معنادار وجود دارد. منحنی های تحلیل عملکرد سامانه نیز نشان داد شباهت نظرات داوری، خواه در سطح تک واژه ها و خواه دوواژه ای ها توانایی شناسایی مقالات با محتوای مشابه را دارد.
نتیجه گیریاعتبار نظرات داوران ریشه در توان تخصصی و شناختی آنان دارد. بنابراین، نظرات می توانند در شبکه مدارک، در زمره منابع مرتبط اثربخش در بازشناخت مدارک به شمار آیند. این یافته راه را برای پژوهش در کاربرد نظرات کاربران در حوزه های بازیابی، ارزیابی، یا طبقه بندی متون هموار می کند که شباهت محتوایی در آنها اهمیت دارد.
کلید واژگان: نظرات کاربران, داوری آزاد, پردازش زبان طبیعی, شباهت, منحنی تحلیل عملکرد سامانهPurposeThe social web provides a platform for publicizing open peer review reports. In this sphere, journal readers, authors, editors, and reviewers can involve in multilateral discussions on the reviewed papers and share their comments and viewpoints on the merits and probable pitfalls of papers. Open peer review comments may, hence, reflect the features of their mother articles. To identify this potential, the present study investigates to what extent similar comments accurately predict similar papers.
MethodologyApplying natural language processing techniques, it analyzes the contents of a sample of papers in medicine and life sciences and the comments received by them. To do so, a test collection is built from the papers openly published on F1000Research, an open access publishing platform that adheres to an open peer reviewing process by transparently providing the public with peer review reports, authors’ responses, and users’ comments. The test collection consists of 2212 papers and their comments. 100 papers are randomly selected as seed documents that serve as queries. The similarities between the comments and the contents of the papers are calculated using Cosine similarity of TF-IDF values. The TF-IDF values are calculated for both unigrams and bigrams extracted from the contents and comments. The correlation between the content and comment similarities is analyzed using Spearman correlation, given the non-normality of the data distributions. The accuracy of prediction of the papers’ content similarity by the similarity of their comments is tested using Receiver Operating Characteristic (ROC) curves.
FindingsThe results of the Spearman correlation revealed a significant correlation between the content and comment similarities. This signifies that similar papers are more likely to receive similar comments and vice versa. The ROC curves show that similar comments can significantly identify similar papers, either at unigram or bigram level. The prediction is highly accurate.
ConclusionSimilar comments are effective in representing similar papers. In other words, similar comments are expected to present similar papers. This finding has implications for interactive information retrieval systems, where users are interested in reading experts’ comments on a given paper before viewing or downloading the paper itself. The findings also may pave the path towards new studies about the application of the comments in such spheres as information retrieval, evaluation or classification, where content similarity is of importance.
Keywords: comments, peer reviewing, Natural Language Processing, similarity, ROC curve analysis -
هدف
کتاب ها از جمله تولیدات مهم دانشگاهی هستند که نقش مهمی در اشاعه یافته های علمی و ارتقای دانش عمومی دارند. هدف اصلی این پژوهش تعیین رابطه میان رتبه آموزشی کتاب های درسی دانشگاه های برتر جهان با شاخص های استناد، پیج رنک و هیتس (اعتبار و میانجی) است.
روش شناسیپژوهش حاضر از نظر هدف کاربردی و به جهت روش تحلیل داده ها توصیفی همبستگی است؛ همچنین، از حیث روش پژوهش، از نوع تحلیل استنادی است. جامعه آماری شامل 1869 کتاب از مجموعه کتاب های دانشگاهی نمایه شده در اسکوپوس بود که در سرفصل درسی دانشگاه های برتر جهان وجود داشت. رتبه آموزشی کتاب های درسی از پروژه باز سرفصل درسی استخراج گردید و در سه سطح کلی، رده های اصلی و زیررده های موضوعی کنگره به دست آمد. میزان استناد به هر کتاب درسی از پایگاه اسکوپوس استخراج شد. همچنین رتبه پیج و هیتس (اعتبار و میانجی) با استفاده از نرم افزار سای2تول و با تحلیل ارتباطات استنادی میان کتاب ها محاسبه شد.
یافته هایافته ها نشان دادند بین رتبه آموزشی کتاب ها در هر سه سطح با سنجه استناد رابطه معنادار ضعیفی وجود داشت؛ همچنین، بین هر سه سطح رتبه آموزشی کتاب ها با رتبه پیج ارتباط معنادار متوسطی وجود داشت. از دو رتبه مرتبط با هیتس، رتبه اعتبار با هر سه سطح رتبه آموزشی کتاب ها ارتباط معنادار ضعیفی داشت؛ اما رتبه میانجی فقط در سطح زیررده های کنگره با رتبه آموزشی کتاب ها رابطه معنادار ضعیفی داشت؛ علاوه براین، میان رتبه آموزشی کتاب ها و رتبه پیج و اعتبار در رده های موضوعی علوم اجتماعی، فلسفه، روانشناسی و دین، علوم سیاسی، حقوق و تاریخ جهان همبستگی متوسط و معنادار بود.,
نتیجه گیریمی توان از رتبه پیج و اعتبار که مستخرج از شبکه استنادی میان کتاب ها هستند برای تعیین ارزش یا اثرگذاری آموزشی کتاب ها استفاده کرد؛ بنابراین، پیشنهاد می شود که نظام های استنادی بین المللی رتبه پیج و اعتبار را برای کتاب ها ارایه کنند و یا حداقل امکان محاسبه آنها را برای کاربرانشان فراهم کنند. این پژوهش اولین پژوهشی است که رابطه بین رتبه آموزشی کتاب ها با شاخص های استناد، پیجرنک و هیتس را مورد بررسی قرار داده است
کلید واژگان: رتبه آموزشی, کتاب های درسی, پیج رنک, هیتس, استنادPurposeBooks are significant scholarly publications which contribute a large part to the diffusion of scholarly findings and aid general knowledge promotion. The major goal of this research was to determine the relationship between teaching ranks of textbooks used in World Top Rank Universities according to Times Higher Education and indicators extracted from the citation, PageRank, and HITS.
MethodologyThe current study is applied research and utilizes descriptive correlation method. This research was conducted using citation analysis. The population involved 1869 textbooks from the collections of indexed books in Scopus. The books were identified through matching 168,866 book titles published between 1953- 2017 which were indexed in Scopus and recorded in Open Syllabus Project as teaching resources of World Top Rank Universities. The Library of Congress Classification was used to determine book subjects. The citations count of each book was exported from Scopus. PageRank and HITS algorithms were calculated by books citation networks using the Sci2Tool program.
FindingsThe results showed that there was a weak relationship among all three levels of teaching ranks with citation counts. Besides, The correlation between teaching ranks and PageRank were moderate and significant. Of the two ranking scores associated with the HITS algorithm, the correlations between teaching ranks and authority scores were significantly weak, but they were only significant at sub-classification levels with Hub scores. Furthermore, teaching ranks had a significantly moderate correlation with both PageRank and Authority scores in Social Sciences (H), Philosophy, Psychology, Religion (B), Politics (J), Law (K) and World History (D).
ConclustionPagerank and authority scores of books calculated based upon the book citation network can be used in determining the teaching impact of books in some fields. Hence, this research suggests international citation indexes to utilize these indicators for books or to make the calculation of such indicators feasible for users. This is the first research conducted to examine the relationship between teaching rank of books with citation network indicators calculated by PageRank and HITS algorithms.
Keywords: teaching rank, textbooks, PageRank, HITS, Citation -
Background and ObjectivesThe present study aimed to investigate the impact of users’ verbal, imagery and bimodal cognitive style, and browsing experience on their disorientation level during web browsing.MethodologyIn order to extract the data obtained from users’ transaction files, a hybrid approach, including the content analysis method and the think-aloud technique, was utilized. The statistical population in this study included all of the undergraduate students at Shiraz University, and the sample consisted of 90 voluntary undergraduate students.FindingsAccording to the results, no significant difference was observed among the cognitive styles as far as disorientation level was concerned. However, novice users experienced higher levels of disorientation in comparison with experienced users. In addition, it was observed that there is a significant difference between the users who had different levels of experience and cognitive styles in terms of disorientation in browsing. The verbal and novice users also experienced higher levels of disorientation compared to the verbal and experienced users.DiscussionDue to the limited understanding of the role which cognitive style plays in guiding users during web browsing, the results of the present study appeared to be useful in providing a better understanding of the factors influencing the users’ performance in browsing process and thereby the need to consider them in user modeling and training.Keywords: cognitive style, Imagery, disorientation level, users’ experience, Verbal
-
هدف
هدف از انجام پژوهش حاضر، بررسی وضعیت رقابت استنادی مقالات پژوهشگران ایرانی در مجموعه مجلات ملی و شناسایی مجلات هسته ایران در گروه های سه گانه مجلات هسته استنادی، مجلات هسته انتشاراتی و مجلات هسته متیو می باشد.
روشپژوهش حاضر با استفاده از روش تحلیل استنادی انجام شده است. تحلیل داده ها به کمک اکسل و نرم افزار آماری SPSS انجام شده است. نمونه ی پژوهش حاضر را مقالات علمی پنج دانشگاه برتر ایران که در فاصله ی سال های 2011 تا 2014 در پایگاه استنادی اسکوپوس نمایه شده اند تشکیل می دهد.
یافته ها:
یافته های پژوهش حاضر نشان داد که مجموعه مجلات ملی ایران، جمعا 994 عنوان را دربرمی گیرد که از میان آن ها 182 عنوان به گروه مجلات هسته انتشاراتی، 107 عنوان به گروه مجلات هسته استنادی، 193 عنوان به گروه مجلات هسته متیو منفی و 14 عنوان به گروه مجلات هسته متیو مثبت تعلق داشته اند. در مجموع، کل مجلات ایرانی در بازه ی زمانی مورد بررسی، به ترتیب تعداد 942 و 73 استناد متیوی منفی و مثبت داشته اند، به این معنا که 942 استناد بالقوه را از دست داده اند و در مقابل تنها 73 استناد فراتر از حد انتظار را جذب کرده اند.
نتیجه گیرییافته های این پژوهش نشان داد که مقالات ایرانی در بازه ی زمانی مورد بررسی تعداد زیادی از استنادهای مورد انتظار خود را واگذار کرده و عملکرد مناسبی در مجموعه مجلات نداشته اند.
کلید واژگان: اثر متیو, استناد متیو, مجلات هسته متیو, مجموعه مجلات ملی (NJS)PurposeThe purpose of this study is to investigate the citation status of Iranian publication in the National Journal Set (NJS) and the identification of Core journals in groups of Citation Core Journals, Publishing core journals, and Mathew core journals.
MethodThe present study conducted using citation analysis method. Data analysis was performed using Excel and SPSS software. The sample consists of scientific articles from five top universities of Iran, which are indexed during the years 2011 through 2014 at the Scopus Citation Database.
FindingsThe results showed that the National Journal Set Includes 994 titles, of which 182 were headed to the Publishing core journals, 107 titles for the group of Citation Core Journals, 193 titles were Negative Mathew Core journals and 14 titles belong to Positive Mathew Core journals. All Iranian journals during the time period of the study had 942 negative matthew citations and 73 positive matthew citations, meaning that they lost 942 potential citations.
ConclusionThe findings of this study showed that the Iranian articles in the period of study loss many of their expected citations and did not have proper performance in the National Journal Set.
Keywords: Matthew effect, Matthew Citation, Matthew Core Journals, National Journal Set -
International Journal of Information Science and Management, Volume:17 Issue: 2, Jul-Dec 2019, PP 19 -31Co-citation forms a relational document network. Co-citation-based measures are found to be effective in retrieving relevant documents. However, they are far from ideal and need further enhancements. Co-opinion concept was proposed and tested in previous research and found to be effective in retrieving relevant documents. The present study endeavors to explore the correlation between opinion (dis)similarity measures and the traditional co-citation-based ones including Citation Proximity Index (CPI), co-citedness and co-citation context similarity. The results show significant, though weak to medium, correlations between the variables. The correlations are direct for co-opinion measure, while being inverse for the opinion distance. Accordingly, the two groups of measures are revealed to represent some similar aspects of the document relation. Moreover, the weakness of the correlations implies that there are different dimensions represented by the two groupsKeywords: Opinion, Co-opinion, Co-citation, Correlation, Citation Proximity Index, Similarity
-
International Journal of Information Science and Management, Volume:17 Issue: 1, Jan-Jun 2019, PP 17 -31This article presents an empirical evaluation to investigate the distributional semantic power of abstract, body and full-text, as different text levels, in predicting the semantic similarity using a collection of open access articles from PubMed. The semantic similarity is measured based on two criteria namely, linear MeSH terms intersection and hierarchical MeSH terms distance. As such, a random sample of 200 queries and 20000 documents are selected from a test collection built on CITREC open source code. Sim Pack Java Library is used to calculate the textual and semantic similarities. The nDCG value corresponding to two of the semantic similarity criteria is calculated at three precision points. Finally, the nDCG values are compared by using the Friedman test to determine the power of each text level in predicting the semantic similarity. The results showed the effectiveness of the text in representing the semantic similarity in such a way that texts with maximum textual similarity are also shown to be 77% and 67% semantically similar in terms of linear and hierarchical criteria, respectively. Furthermore, the text length is found to be more effective in representing the hierarchical semantic compared to the linear one. Based on the findings, it is concluded that when the subjects are homogenous in the tree of knowledge, abstracts provide effective semantic capabilities, while in heterogeneous milieus, full-texts processing or knowledge bases is needed to acquire IR effectiveness.Keywords: distributional semantics, semantic similarity, textual similarity, effectiveness, information retrieval, MeSH
- این فهرست شامل مطالبی از ایشان است که در سایت مگیران نمایه شده و توسط نویسنده تایید شدهاست.
- مگیران تنها مقالات مجلات ایرانی عضو خود را نمایه میکند. بدیهی است مقالات منتشر شده نگارنده/پژوهشگر در مجلات خارجی، همایشها و مجلاتی که با مگیران همکاری ندارند در این فهرست نیامدهاست.
- اسامی نویسندگان همکار در صورت عضویت در مگیران و تایید مقالات نمایش داده می شود.