-
شوری یکی از اصلی ترین تنش های اسمزی است که رشد و تولید گیاه را از طریق تغییر در تعادل یونی و اسمزی محدود می کند. به منظور بررسی آثار تنش شوری بر جوانه زنی، رشد رویشی و برخی شاخص های جوانه زنی، آزمایشی به صورت فاکتوریل در قالب طرح بلوک های کامل تصادفی با 4 تکرار در سال 1389 در آزمایشگاه کشاورزی دانشگاه پیام نور ارومیه به اجرا در آمد. فاکتورهای آزمایش شامل 8 ژنوتیپ شهریار، سرداری، سرداری 39، سرداری 101، زرین، اروند، fgs و آذر 2 و 6 سطوح شوری شامل 0، 2، 4، 8، 12 و 16 دسی زیمنس بر متر محلول کلرید سدیم بودند. نتایج تجزیه واریانس نشان داد که سطوح مختلف شوری اثر بسیار معنی داری را بر درصد جوانه زنی، وزن خشک ریشه چه، وزن خشک ساقه چه، وزن خشک گیاهچه، یکنواختی جوانه زنی، طول ساقه چه، شاخص مقاومت به شوری و طول ریشه چه داشتند. با افزایش شوری کلیه صفات فوق کاهش یافتند به طوری که بالاترین مقدار هریک از صفات فوق از تیمار شاهد و کمترین مقدار از سطح شوری ds/m 16 بدست آمد. ژنوتیپ مختلف نیز در سطوح شوری مختلف، پاسخ های متفاوتی از خود نشان دادند و مقاومت های متفاوتی داشتند. ژنوتیپ زرین، اروند و سرداری نسبت به شوری تحمل بیشتری داشته و شوری حداکثر ds/m 12 را تحمل می کنند و در شوری ds/m 16 کاهش مقدار صفات این ژنوتیپ بیش از 60 درصد بود و ژنوتیپ آذر 2 و سرداری 101 ژنوتیپ حساس به شوری می باشند.
کلید واژگان: کلمات کلیدی: گندم, ژنوتیپ, تنش شوری, جوانه زنیSalinity stress is the most important osmotic stress that limits growth and production of crop via changing ion and osmotic balance. In order to investigation of salinity stress effects on germination، vegetative and some germination indices an experiment conducted by factorial based on randomized completely block designs with 4 replications in 2010 in department of agriculture of Urmia Payame Nor. The factors were 8 genotypes (Shahriar، Sardari، Sardari 39، Sardari 101، Zarin، Arvand، fgs and Azar 2 and 6 level of salinity (0 -2-4-8-12-16) ds/m from Nacl. The results showed that different levels of salinity had significantly effects on germination percent، root dry weight، seedling dry weight، plantlet dry weight، germination rate، germination uniformity، stem length، stress tolerance index and root length. With increasing salinity stress all of traits decreased، so the highest obtained from control treatment and the lowest obtained from salinity level of 16 ds/m. The genotypes respond differently to salinity levels. It seems genotypes of Zarin، Arvand and Sardari have more tolerance to salinity conditions. Genotypes of Sardari 101 and Azar 2 were sensitive to salinity stress.Keywords: Wheat, Genotype, Salinity Stress, Germination -
هدف از پژوهش حاضر تعیین شبکه معنایی واژگانی برای کلمات منتخب فارسی و طراحی مقیاس حافظه کاذب (محک) مبتنی بر آن بود. روش پژوهش حاضر از نوع تحقیقات مقطعی است. پژوهش حاضر از دو مطالعه مجزا تشکیل شده است. در مطالعه نخست با ارائه واژه های منتخب به30 نفر، کلمات تداعی شده با هر واژه تعیین شد. کلمات منتخب (کلمات کلیدی) لیست کلمات دیس، رودیگرز و مک درموت (1995) در آزمایش خطاهای حافظه بودند. در مطالعه دوم که بر روی 80 نفر اجرا شد لیست های کلمات بدون کلمات کلیدی به افراد ارائه شد و میزان یادآوری و بازشناسی لیست ها مورد سنجش قرار گرفت. برای تحلیل داده ها از آمار توصیفی و نیز آزمون همبستگی پیرسون استفاده شد. نتایج نشان داد که بین میزان یادآوری با بازشناسی در سطح (001/0p<) رابطه معناداری وجود داشت. همچنین بین میزان بازشناسی با بازشناسی کلمات کلیدی رابطه معناداری وجود داشت (66%r=)، بین یادآوری کلمات کلیدی با بازشناسی کلمات کلیدی نیز رابطه معناداری بدست آمد (41%r=). از طرفی دیگر، نتایج تحلیل آماری بیانگر آن بود که آزمودنی ها در لیست کلمات یادآوری 19% از کلمات کلیدی را یادآوری و در لیست کلمات بازشناسی 51% از کلمات کلیدی را بازشناسی کردند. مطالعه حاضر لیستی را برای آزمون حافظه کاذب بدست داده است که از آن می توان برای مطالعه حافظه کاذب در فارسی زبانان استفاده کرد.کلید واژگان: شبکه معنایی, حافظه, حافظه کاذب, زبان فارسیThe purpose of present study is determining semantic network for selected Persian words and designing false memory scale (examination) based on it. This present research is cross sectional studies. In this research, two studies were designed. In the first study, selected word presented to 30 individuals and they should write down related word with free association. Key words (Critical Lure) selected from Roediger Mc Dermot (1995) in false memory scale. In the second study, list of words presented Without key words to 80 participants and recall and recognition of words were measured. Descriptive statistics and Pearson correlation test was used for analysis. Findings show that recall and recognition were significantly correlated (PKeywords: Semantic Network, Memory, False Memory, Persian Language
-
امروزه وب، اصلی ترین ابزار دسترسی و اشاعه اطلاعات به شمار می رود، به گونه ای که کتابخانه ها و مراکز اطلاع رسانی، بسیاری از خدمات خود را از طریق وب به کاربران ارائه می دهند. بررسی ها حاکی از آن است که توانایی وب سایتها در تبلیغ و بازاریابی خدمات کتابخانه ها و مراکز اطلاع رسانی به اثبات رسیده است. از دلایل اصلی موفقیت در بازاریابی، امکان بازیابی سریع و دقیق اطلاعات از وب سایت کتابخانه ها و مراکز اطلاع رسانی است. همچنین، شواهد حاکی از آن است که به منظور بازیابی موفق اطلاعات در وب سایتها بررسی میزان تراکم کلمات کلیدی از عوامل اصلی به شمار می آید. تراکم کلمات کلیدی، مقیاسی از میزان کلمات کلیدی موجود در محتوای صفحه به نسبت کل کلمات موجود در همان صفحه است. هدف پژوهش حاضر، بررسی نقش کلمات کلیدی در طراحی وب سایتهای برتر کتابخانه های مرکزی دانشگاه های علوم پزشکی با رویکرد بازاریابی موفق در کتابخانه های دانشگاهی است. جامعه پژوهش 5 وب سایت منتخب کتابخانه های مرکزی دانشگاه های علوم پزشکی ایران را شامل است که بر اساس میزان تاثیرگذاری کل وبی رتبه بندی شده اند. گردآوری داده ها توسط نرم افزار تحلیلگر تراکم کلمات کلیدی، انجام گرفته است. یافته های پژوهش نشان می دهد هیچ کدام از دانشگاه ها در وب سایت خود از کلمات کلیدی مناسب استفاده نکرده اند. در این میان، وب سایت کتابخانه مرکزی دانشگاه علوم پزشکی اصفهان به دلیل استفاده از کلمات کلیدی در ابر برچسبهای اصلی، توانسته است میزان تاثیرگذاری بالایی را کسب نماید. همچنین، در رتبه بندی وب سایتهای کتابخانه های مرکزی، دانشگاه علوم پزشکی مشهد در موتور جستجوی گوگل رتبه بالایی را به خود اختصاص داده است. نتایج پژوهش حاکی از آن است که استفاده از تراکم کلمات کلیدی، می تواند نقش مهمی را در بالا بردن رتبه سایت و افزایش رویت سایت ایفا نماید که باعث تحقق بازاریابی موفق در کتابخانه های دانشگاهی می شود.
کلید واژگان: تراکم کلمات کلیدی, طراحی وب سایت, کتابخانه مرکزی دانشگاهی, بازاریابی, ایرانKeyword density is one of the main factors to the successful information retrieval in websites. Keyword density is a measure of the amount of keywords in the content to the total words in the same page. The main aim of this study is to investigate the role of keywords in top Universities of Medical Science's library websites with a successful marketing approach. Five top five Universities of Medical Science's libraries websites are the research cases. We selected them on the basis of their WIF ranking. Keyword density analyzer software was used for data gathering. Findings showed that none of the Universities of Medical Science's libraries have appropriate keywords in their website. Isfahan Universities of Medical Sciences Central Library website has used keywords in the main metatag, accordingly this website has obtained the high impact. Other results indicated that Mashhad University of Medical Sciences Central Library website has gained a high rank in Google search engine. Results also showed that the use of keyword density in websites has an important role in improving the rank and the visibility of websites; keyword density also caused successful marketing in Medical University Libraries websites.Keywords: Universities of Medical Sciences, University Libraries, keywords density, Library websites -
در زبان فارسی کلمات دارای صورت های نگارشی متنوعی هستند و پوشش کلیه حالات دستوری کلمات با به کارگیری یک سری قواعد معین ناممکن است به همین دلیل استخراج کلمات کلیدی به طور خودکار از متون فارسی دشوار و پیچیده است. در این مقاله سعی شده است با استفاده از اطلاعات زبان شناختی و اصطلاح نامه ، کلمات کلیدی بامعناتری ارائه شود. با استفاده از اصطلاح نامه که از نظامی ساختارمند برخوردار است می توان شبکه کلمات کلیدی، شامل کلمات هم ارز، کلمات سلسله مراتبی و وابسته را تکمیل کرده و افزایش داد. بنابراین می توان توافق بین جستجوی کاربران و کلمات کلیدی متنی را بیشتر نمود و جامعیت جستجو را افزایش داد. در مرحله اول کلمات غیر مهم و عمومی حذف می شوند. سپس کلمات متن ریشه یابی می شوند و در ادامه برای مشخص شدن اهمیت نسبی کلمات با استفاده از روش های وزن دهی یک وزن عددی به هر کلمه منسوب می گردد که بیانگر میزان تاثیر کلمه در ارتباط با موضوع متن و درمقایسه با سایر کلمات بکار رفته در متن است . مجموعه عملیات فوق خصوصا استفاده از اصطلاح نامه باعث می شود که دسته بندی متون دقیق تر انجام گیرد و به نوعی رده علمی سلسله مراتبی متون در حوزه بازیابی اطلاعات نیز مشخص می شود. نتایج آزمایش ها روی چندین متن در موضوعات مختلف نشان دهنده دقت و توانایی روش پیشنهادی در استخراج کلمات کلیدی منطبق با خواست کاربر است و در نتیجه خوشه بندی دقیق تر متون می باشد.کلید واژگان: استخراج کلمات کلیدی, اصطلاح نامه, زبان شناختی, بازیابی اطلاعاتPersian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, including the exchange of words, words and words with hierarchical relationships complete the package has increased. Therefore the agreement between users and search keywords text search and recall is increased. In the first stage non-important words are removed and the public. Supervision in the text are words and more words to clarify the relative importance of using a blower numerical weight is assigned to each word that indicates the effectiveness of the word in connection with the subject and compared with the other words used in the text. Particularly complex operation that makes use of thesaurus keywords are extracted Mnytry that kind of hierarchical category scientific literature in the field of information retrieval is indicated. Test results on different topics several text accurately represents the proposed method and the ability to extract the keywords in accordance with user demand.Keywords: Keyword Extraction, Thesaurus, Computational Linguistic, Information Retrieval
-
بررسی وضعیت تراکم کلمات کلیدی در ساختار وب سایت های واحدهای آموزش مجازی دانشگاه های علوم پزشکی ایرانمقدمهشواهد حاکی از آن است که به منظور بازیابی موفق اطلاعات در وب سایت ها بررسی میزان تراکم کلمات کلیدی از عوامل اصلی به شمار می آید. تراکم کلمات کلیدی، مقیاسی از میزان کلمات کلیدی موجود در محتوای صفحه به نسبت کل کلمات موجود در همان صفحه است. هدف پژوهش حاضر، بررسی نقش کلمات کلیدی در طراحی وب سایت های برتر واحدهای مجازی دانشگاه های علوم پزشکی با رویکرد بازاریابی موفق می باشد.مواد و روش هاروش پژوهش حاضر تحلیل محتوا می باشد. جامعه پژوهش حاضر 5 وب سایت منتخب واحد مجازی دانشگاه های علوم پزشکی ایران را شامل است که بر اساس میزان تاثیرگذاری کل وبی رتبه بندی شده اند. گردآوری داده ها توسط نرم افزار تحلیلگر تراکم کلمات کلیدی، انجام گرفته است.نتایجهیچ کدام از دانشگاه ها در وب سایت خود از کلمات کلیدی مناسب استفاده نکرده اند. در این میان، وب سایت واحد مجازی دانشگاه علوم پزشکی مشهد به دلیل استفاده از کلمات کلیدی در ابر برچسب های اصلی، توانسته است میزان تاثیرگذاری بالایی را کسب نماید. همچنین، در رتبه بندی وب سایت های واحدهای مجازی، دانشگاه علوم پزشکی مشهد در موتور جستجوی گوگل رتبه بالایی را به خود اختصاص داده است.نتیجه گیریتحلیل نتایج بیانگر این امر است که مدیران و طراحان وب سایت های دانشگاه های مورد مطالعه باید با شناخت عواملی که بر جذب پیوند توسط وب سایت تاثیر دارند، برای ارتقاء کیفی و محتوایی وبسایت خود برنامه ریزی نمایند. به هر حال، موفقیت نهایی یک وب سایت به عواملی چون کیفیت، اندازه، زبان، قدمت، شمول و برخی عوامل دیگر بستگی دارد و نمی توان یک یا دو عامل محدود را به عنوان تنها دلایل موفقیت یک وب سایت قلمداد کرد.
کلید واژگان: آموزش از دور, دانشگاه های علوم پزشکی, فناوری, وب سنجی, تراکم کلمات کلیدی, کتابخانه هاInterdisciplinary Journal of Virtual Learning in Medical Sciences, Volume:4 Issue: 1, 2013, PP 28 -37IntroductionKeywords density is one of the main factors for successful retrieval of information from websites. Keywords density is a measure showing the proportion of the number of keywords in the content to the total words in the same page. The main aim of this study was to investigate the role of keywords in top virtual websites of the universities of medical sciences in Iran with a successful marketing approach.Material And MethodsThe methodology adoted for this study was content analysis. Five top virtual websites of the five universities of medical sciences were selected on the basis of their in their websites. Virtual branch of Mashhad University of Medical Sciences، of course، used WIF ranking. Keywords density analyzer software was used for data collection.ResultsThe findings showed that none of the virtual websites had appropriate keywords keywords in the main metatag، so this website was of superior efficiency. It was also found that this website has gained a high rank in Google search engine.ConclusionThe findings imply that web designers and managers in assessed universities must incorporate proper and relevant links in order to promote the quality and content of their websites. In fact، the ultimate success of a website is dependent upon factors such as quality، size، language، and being up-to-date، etc. One or two factors cannot determine the success of a website.Keywords: Distance Education, Universities of Medical Sciences, Technology, Webometric, Keywords Density, Libraries -
با توجه به گسترش روزافزون اطلاعات و وجود حجم انبوه متون غیرساخت یافته، استفاده از کلمات کلیدی نقش مهمی در بازیابی اطلاعات دارد. این درحالی است که استخراج کلمات کلیدی به صورت دستی مشکلات زیادی دارد. بنابرین استخراج کلمات کلیدی به صورت خودکار از نیازهای ضروری فناوری امروزه است. در این پژوهش سعی شده با استفاده از اصطلاح نامه که از نظامی ساختارمند برخوردار است، کلمات کلیدی بامعناتری از متون استخراج کرد و با آن ها طبقه بندی متون فارسی را بهبود بخشید. مراحلی که برای افزایش جامعیت جستجو باید سپری شود به این صورت است که در مرحله نخست کلمات زائد حذف و باقی کلمات ریشه یابی می شود؛ سپس به کمک اصطلاح نامه کلمات هم معنی، اعم ها و اخص ها و همچنین وابسته ها پیدا و در ادامه برای مشخص شدن اهمیت نسبی کلمات یک وزن عددی به هر کلمه منسوب می شود که بیان گر میزان تاثیر کلمه در ارتباط با موضوع متن و درمقایسه با سایر کلمات به کار رفته در متن است . با توجه به مراحل بالا و به کمک اصطلاح نامه، طبقه بندی متون دقیق تر انجام می گیرد. در این روش از الگوریتم نزدیکترین همسایه (KNN) برای طبقه بندی استفاده می شود. الگوریتم KNN به خاطر سادگی و موثر بودن آن در طبقه بندی متون بسیار به کار برده می شود. مبنای کار این الگوریتم، مقایسه متن آزمایش داده شده با متون آموزشی داده شده و به دست آوردن میزان شباهت بین آن ها است. نتایج آزمایش ها برروی چندین متن در موضوع های مختلف، نشان دهنده دقت و توانایی روش پیشنهادی در استخراج کلمات کلیدی منطبق با خواست کاربر و در نتیجه طبقه بندی دقیق تر متون است.کلید واژگان: اصطلاح نامه, بازیابی اطلاعات, استخراج کلمات کلیدی, وزن دهیDue to ever-increasing information expansion and existing huge amount of unstructured documents, usage of keywords plays a very important role in information retrieval. Because of a manually-extraction of keywords faces various challenges, their automated extraction seems inevitable. In this research, it has been tried to use a thesaurus, (a structured word-net) to automatically extract them. Authors claim that extraction of more meaningful keywords out of documents can be attained via employment of a thesaurus. The keywords extracted by applying thesaurus, can improve the document classification. The steps to be taken to increase the comprehensiveness of search should be such that in the first step the stop words are removed and the remaining words are stemmed. Then, with the help of a thesaurus are found words equivalent, hierarchical and dependent. Then, to determine the relative importance of words, a numerical weight is assigned to each word, which represents effect of the word on the subject matter and in comparison with other words used in the text. According to the steps above and with the help of a thesaurus, an accurate text classification is performed. In this method, the KNN algorithm is used for the classification. Due to the simplicity and effectiveness of this algorithm (KNN), there is a great deal of use in the classification of texts. The cornerstone of KNN is to compare with the text trained and text tested to determine their similarity between. The empirical results show the quality and accuracy of extracted keywords are satisfiable for users. They also confirm that the document classification has been enhanced. In this research, it has been tried to extract more meaningful keywords out of texts using thesaurus (which is a structured word-net) rather than not using it.Keywords: thesaurus, information retrieval, extraction of keywords, weight
-
کلمات کلیدی زیر مجموعه ای از کلمات یا عبارات یک سند هستند که می توانند معنای سند را توصیف کنند و در فرایند بازیابی اطلاعات نقش مهمی ایفا کنند. از آنجا که عملیات استخراج کلیدواژه یا عبارات کلیدی از متون تخصصی و علمی کاری تخصصی و زمان بر بوده و حجم اسناد علمی که نیاز به کلیدواژه دارند روزافزون است، الگوریتم های مختلفی برای استخراج تخصصی و خودکار کلیدواژه و عبارات کلیدی به اسناد طراحی و پیاده سازی شده اند. RAKE یک الگوریتم پرکاربرد برای استخراج کلمات کلیدی از متون است. اساس کار الگوریتم RAKE، کلمات کلیدی و عموما حاوی چندین کلمه (یعنی عبارت کلیدی) هستند، ولی علایم نگارشی یا کلمات بی معنا یا ایست واژه ها را شامل نمی شوند. در این الگوریتم از برچسب گذاری دستوری کلمات به عنوان ابزاری برای تعیین ضریب اهمیت آن ها در جملات استفاده می شود. کلید واژه ها مجموعه ای از توالی های چندکلمه ای یا تک کلمه ای هستند که طبق معیار های خاصی امتیاز دهی می شوند. در این پژوهش، یک نسخه بهبود یافته از الگوریتم استخراج خودکار کلیدواژه (RAKE) ارایه شده است. در نسخه بهبودیافته سعی شده با ایجاد تغییراتی در معیارهای امتیازدهی عبارات کاندید، دقت و بازخوانی عبارات کلیدی استخراج شده افزایش یابد. راهکار ارایه شده برای بهبود الگوریتم RAKE با در نظر گرفتن ضعف های موجود در رویکرد های وزن دهی دراین الگوریتم به ویژه برای زبان فارسی و مستندات علمی پیشنهاد شده است. برای بررسی نقاط ضعف الگوریتم RAKE و ارایه راهکار پیشنهادی از مجموعه ای از فراداده های پایان نامه و رساله های فارسی استفاده شده است. راهکار پیشنهادی روی این داده ها آزمایش و ارزیابی شده و باعث افزایش دقت، بازخوانی و معیار F شده است.
کلید واژگان: استخراج کلید واژه, الگوریتم RAKE, برچسب گذاری دستوری, پردازش زبان طبیعی, مستندات علمی فارسیKeywords and key phrases are subsets of most relevant words or phrases that summarize contents of a document while they play a critical role in information and document retrieval. Keyword extraction from scientific text is challenging and time-consuming due to the technical and multi-subject nature of the text, while the number of documents requiring keywords is increasing. There are various algorithms and methods developed for automatic keyword extraction. Rapid Automatic Keyword Extraction (RAKE) is a popular algorithm in this domain. RAKE’s decisions are based on the observation that keywords generally contain multiple words and they rarely include stopwords and words with minimum lexical meanings. Candidate keywords are a set of single-word or multi-word sequences selected based on the scores assigned to them by some scoring criteria in RAKE.In this research, a new modified version of RAKE algorithm is proposed in which candidate keyword scoring scheme is improved to increase precision and recall in the keyword extraction process. The proposed algorithm is to cover some of the main weaknesses of RAKE algorithm, especially in Persian scientific documents. To study the weaknesses of RAKE algorithm and evaluating the proposed modified version of RAKE, a set of metadata of Persian theses and dissertations are used. The result of test and evaluation of the proposed algorithm confirm improvement in precision, recall and F-measure.We study effectiveness of RAKE in extracting keywords from Persian texts. We find that RAKE algorithm often extracts long phrases with redundant words on Persian texts, leading to low accuracy. In this paper, we study sources of scoring inefficiency of RAKE algorithm and propose an improved version of RAKE algorithm with a novel scoring mechanism. Our scoring mechanism overcomes some of the weaknesses in RAKE’s original scoring for Persian texts and yields better results. Our evaluations on Persian corpus demonstrate that our improved RAKE algorithm outperforms original RAKE algorithm by extracting more accurate keyword. Our results show that improved RAKE achieves more than 20% higher precision and recall on average compared to original RAKE.
Keywords: Keyword Extraction, RAKE Algorithm, Part of Speech Tagging, Natural Language Processing, Persian Scientific Document -
با رشد روز افزون اسناد و متون الکترونیکی به زبان فارسی، به کارگیری روش هایی سریع و ارزان برای دسترسی به متون مورد نظر از میان مجموعه وسیع این مستندات، اهمیت بیشتری می یابد. برای رسیدن به این هدف، استخراج کلمات کلیدی که بیانگر مضمون اصلی متن باشند، روشی بسیار موثر است. تعداد تکرار یک کلمه در متن نمی تواند نشان دهنده اهمیت یک کلمه و کلیدی بودن آن باشد. همچنین در اکثر روش های استخراج کلمات کلیدی مفهوم و معنای متن نادیده گرفته می شوند. از طرفی دیگر بدون ساختار بودن متون جدید در اخبار و اسناد الکترونیکی، استخراج این کلمات را مشکل می سازد. در این مقاله روشی بدون نظارت و خودکار برای استخراج این کلمات در زبان فارسی که دارای ساختار مناسبی نمی باشد، پیشنهاد شده است که نه تنها احتمال رخ دادن کلمه در متن و تعداد تکرار آن را در نظر می گیرد، بلکه با آموزش مدل word2vec روی متن، مفهوم و معنای متن را نیز درک می کند. در روش پیشنهادی که روشی ترکیبی از دو مدل آماری و یادگیری ماشین می باشد، پس از آموزش word2vec روی متن، کلماتی که با سایر کلمات دارای فاصله کمی بوده استخراج شده و سپس با استفاده از هم رخدادی و فرکانس رابطه ای آماری برای محاسبه امتیاز پیشنهاد شده است. درنهایت با استفاده از حدآستانه کلمات با امتیاز بالاتر به عنوان کلمه کلیدی در نظر گرفته می شوند. ارزیابی ها بیانگر کارایی روش با معیار F برابر 53.92% و با 11% افزایش نسبت به دیگر روش های استخراج کلمات کلیدی می باشد.
کلید واژگان: استخراج کلمات کلیدی, زبان فارسی, متن کاوی, شباهت کلمات, word2vecWith the growing number of Persian electronic documents and texts, the use of quick and inexpensive methods to access desired texts from the extensive collection of these documents becomes more important. One of the effective techniques to achieve this goal is the extraction of the keywords which represent the main concept of the text. For this purpose, the frequency of a word in the text can not be a proper indication of its significance and its crucial role. Also, most of the keyword extraction methods ignore the concept and semantic of the text. On the other hand, the unstructured nature of new texts in news and electronic documents makes it difficult to extract these words. In this paper, an automated, unsupervised method for keywords extraction in the Persian language that does not have a proper structure is proposed. This method not only takes into account the probability of occurrence of a word and its frequency in the text, but it also understands the concept and semantic of the text by learning word2vec model on the text. In the proposed method, which is a combination of statistical and machine learning methods, after learning word2vec on the text, the words that have the smallest distance with other words are extracted. Then, a statistical equation is proposed to calculate the score of each extracted word using co-occurence and frequency. Finally, words which have the highest scores are selected as the keywords. The evaluations indicate that the efficiency of the method by the F-measure is 53.92% which is 11% superior to other methods.
Keywords: Keyword Extraction, Persian Language, Text Mining, Word Similarity, word2vec -
هدفامروزه وب، اصلی ترین ابزار دسترسی و اشاعه اطلاعات به شمارمی رود و کتابخانه های دانشگاهی با عرضه خدمات خود از طریق وبگاه کتابخانه، موجبات رشد هر چه بیشتر خود و کاربران را فراهم می سازند؛ ازسوی دیگر، یکی از اولین دغدغه های ناشران وب سایت ها دستیابی به رتبه های برتر در میان وب سایت های مشابه و هم موضوع است؛ بدین منظور، همواره سیاهه ای از عناوین، کلیدواژه ها و توصیف هایی که احتمال دارد رتبه های برتر را کسب کنند، تهیه و در طراحی صفحات لحاظ می شوند. به منظور بازیابی موفق اطلاعات در وب سایت ها بررسی میزان تراکم کلمات کلیدی، یکی از عوامل اصلی به شمارمی آید. این پژوهش به دنبال پاسخ دادن به این مسئله است که «کتابخانه های دانشگاه های ایران تا چه اندازه و چگونه از کلمات کلیدی در طراحی وبگاه های خود استفاده می کنند؟».
روش شناسی: پژوهش حاضر به شیوه تحلیل محتوا انجام شده است. جامعه پژوهش، پانزده وب سایت کتابخانه های مرکزی دانشگاه های تابع وزرات علوم، تحقیقات و فناوری شهر تهران را شامل می شود. نرم افزار تحلیل گر تراکم کلمات کلیدی، گردآوری داده ها را انجام داده است.یافته هانتایج تحقیق نشان می دهند که درمجموع، هیچ یک از کتابخانه های دانشگاهی مورد مطالعه، در وب سایت خود از کلمات کلیدی مناسب استفاده نکرده اند؛ دراین میان، وب سایت کتابخانه مرکزی دانشگاه تهران به دلیل استفاده از کلمات کلیدی پربسامد و مرتبط در ابربرچسب های اصلی، توانسته است میزان رویت پذیری بالایی را کسب کند؛ همچنین در رتبه بندی وب سایت های کتابخانه های مرکزی، دانشگاه تهران در موتور جستجوی گوگل، رتبه ای بالا را به خود اختصاص داده است.نتیجه گیریتحلیل نتایج، بیانگر این امر است که استفاده از تراکم کلمات کلیدی و همچنین، توجه به اهمیت برچسب ها در وب سایت ها، می تواند نقشی مهم را در بالابردن رتبه سایت و افزایش رویت سایت ایفاکند که [این امر]، باعث تحقق بازیابی موفق کتابخانه های دانشگاهی می شود.کلید واژگان: تراکم کلمات کلیدی, طراحی وب سایت, کتابخانه مرکزی دانشگاهی, ابربرچسبPurposeWeb is the most important medium for access and dissemination of information and therefore, academic libraries have developed websites for communication. Having a website with the highest ranking is a target for each university. As a result, they provide a list of titles, keywords and descriptions likely to promote their rank. Density keywords enhance the quality of information retrieval. This research aims to investigate the quantity and quality of keyword density on Iranian university websites.MethodologyThis research was done with a content analysis approach. Research population consisted of fifteen websites related to the central libraries of MSRT universities in Tehran. Data analysis was done using a keyword density analyzing application software.
Findings: the survey indicated that none of the studied libraries had used proper keywords in their websites. The central library of the University of Tehran scored the highest visibility because it used more relevant keywords in its website tags. This library also ranked high in Google search results.ConclusionThe research revealed that using keywords density and proper tag content on library websites can remarkably enhance library website rank and visibility which leads to better retrieval.
=matnechekideenglishboldChar>Keywords: keyword Density, Web Design, University Central Library, Meta Tag.Keywords: Keyword density, Web Design, University Central Library, meta tag -
حوزه کیفیت داده از جمله حوزه های رو به رشد و مهم در حوزه سیستم های اطلاعاتی است. شناخت دقیق این حوزه از یک سو و شناخت ویژگی های زیرحوزه های نوین این حوزه برای محققان از اهمیت بالایی برخوردار خواهد بود. شناخت ویژگی این حوزه و میزان بین رشته ای بودن آن ها به محققات برای تصمیم گیری در مورد روند تحقیقات و انتخاب حوزه فعالیت کمک بسزایی خواهد کرد. برای شناسایی حوزه ها و بررسی میزان بین رشته ای بودن آن ها، در این مطالعه با استفاده از گراف همرخدادی کلمات و تحلیل 9000 مقاله، ویژگی های حوزه های نوین مطالعاتی مورد بررسی قرار گرفته است. بر اساس این مطالعه مشخص شده است که این حوزه ها بیشتر بین رشته ای بوده است و تمرکز آن بر روی ارتباط بین چندین حوزه مطالعاتی است. به بیان دیگر این کلمات کلیدی بیشتر با کلمات کلیدی موجود در خوشه های دیگر ارتباط داشته اند تا با کلمات کلیدی که با آن ها در یک خوشه قرار گرفته است. بر اساس این مطالعه جدیدترین حوزه مرتبط با کلان داه است که مباحث یکپارچه سازی و داذه گمشده در این حوزه از اولویت بالاتری نسبت به مابقی حوزه ها برخوردار است.کلید واژگان: کیفیت داده, داده کاوی, علم داده, تحلیل شبکهInformation management, Volume:3 Issue: 2, 2018, PP 121 -138The domain of data quality is one of the growing and important areas in the field of information systems. The exact recognition of this field on the one hand and the recognition of the features of the new sub-fields of this field and its interdisciplinary of it will be of great importance to researchers. This knowledge is important for them to decide on the research process and the choice of the field of activity. For this purpose, in this study, using the graph of keyword co-occurrence is conducted on more than 9000 papers. Based on this study, it has been found that these domains have been more interdisciplinary and focus on the relationship between several fields of study. In other words, these keywords are more closely associated with the keywords in the other clusters than with the keywords they are in the same cluster. According to this study, the latest are is big data that focused on integration issues and missing data in this area.Keywords: Data quality, Data Mining, data science, social network analysis
-
از آنجا که گزینه «جستجوی دقیق» غیرفعال است همه کلمات به تنهایی جستجو و سپس با الگوهای استاندارد، رتبهای بر حسب کلمات مورد نظر شما به هر نتیجه اختصاص داده شدهاست.
- نتایج بر اساس میزان ارتباط مرتب شدهاند و انتظار میرود نتایج اولیه به موضوع مورد نظر شما بیشتر نزدیک باشند. تغییر ترتیب نمایش به تاریخ در جستجوی چندکلمه چندان کاربردی نیست!
- جستجوی عادی ابزار سادهای است تا با درج هر کلمه یا عبارت، مرتبط ترین مطلب به شما نمایش دادهشود. اگر هر شرطی برای جستجوی خود در نظر دارید لازم است از جستجوی پیشرفته استفاده کنید. برای نمونه اگر به دنبال نوشتههای نویسنده خاصی هستید، یا میخواهید کلمات فقط در عنوان مطلب جستجو شود یا دوره زمانی خاصی مدنظر شماست حتما از جستجوی پیشرفته استفاده کنید تا نتایج مطلوب را ببینید.
* ممکن است برخی از فیلترهای زیر دربردارنده هیچ نتیجهای نباشند.
-
معتبرحذف فیلتر