جستجوی مقالات مرتبط با کلیدواژه « کنترل کیفیت » در نشریات گروه « کتابداری و مدیریت اطلاعات »

تکرار جستجوی کلیدواژه «کنترل کیفیت» در نشریات گروه «علوم انسانی»
  • آزاده فخرزاده*، محمدجواد ارشادی، محمدمهدی ارشادی

    پایگاه های اطلاعات علمی و موتورهای جستجو از ابزارهای اصلی کار پژوهشگران است. برای بازیابی دقیق و صحیح اطلاعات از این پایگاه ها نیاز است که اطلاعات با کیفیت مناسب وبا کمترین خطا ذخیره شوند. کنترل دستی اطلاعات زمانبر و پر هزینه است، در این مقاله، روش های داده کاوی برای کنترل کیفیت یک پایگاه اطلاعات پژوهشی معرفی می شود. برای این منظور ابتدا باید اطلاعاتی از خطاهای مرسوم را در کنار سایر اطلاعات هر رکورد جمع آوری کرد. سپس با استفاده از روش های داده کاوی الگوهای پنهان و روابط بین خطاها را کشف کرد و بر این اساس راه های بهبود کیفیت داده را ارایه داد. در این مقاله پایگاه اطلاعات علمی ایران (گنج)، به عنوان مطالعه موردی در نظر گرفته شد. 59 کد خطا توسط خبرگان تعریف شد.  سپس اطلاعات فراداده هر رکورد مثل نام دانشگاه، نام رشته،گرایش و حوزه تخصصی مدرک به همراه کدهای خطای آن در یک مجموعه داده  ذخیره شد. این مجموعه داده شامل 41021  رکورد  در حوزه های مختلف است. با استفاده از روش های آماری و قوانین انجمنی رابطه بین خطاها و الگوی تکرار آنها را درهرحوزه بررسی شد. نتایج نشان داد  به طور میانگین با در نظر گرفتن 25 درصد از خطاها در هر حوزه، می توان تا 80 درصد از خطاهای همه رکوردهای یک حوزه را کاهش داد. این خطاها شامل خطاهای پر تکرار در هر حوزه و همچنین خطاهایی است که با آن ها رابطه قوی دارند. با استفاده از روش خو شه بندی k-means رکوردها خوشه بندی شدند. نتایج نشان داد اگر چه شباهت هایی بین رکوردها از حوزه های مختلف وجود دارد، اما رابطه معناداری بین حوزه رکوردها و الگوی تکرار خطاها وجود ندارد.

    کلید واژگان: کیفیت داده, کیفیت اطلاعات پژوهشی, کنترل کیفیت, داده کاوی}
    Azadeh Fakhrzdaeh *, Mohammad Javad Ershadi, Mohammad Mahdi Ershadi

    Research information databases and search engines are one of the main resources used by researchers every day. To accurately retrieve information from these databases, data need to be stored correctly. Manual controlling of data quality is costly and time-consuming. Here we suggest data mining methods for controlling the quality of a research database. To this end, common errors that are seen in a database should be collected. Metadata of every record in addition to its error codes is saved in a dataset. Statistics and data mining methods are applied to this dataset and patterns of errors and their relationships are discovered. Here we considered Iran's scientific information database (Ganj) as a case study. Experts defined 59 errors. Intimate features of every record, such as its subject, authors' names and name of the university, with its error codes were saved in a dataset. The dataset containing 41021 records was formed.  Statistics methods and association rules were applied to the dataset and the relationship between errors and their pattern of repetition was discovered. Based on our results, in average by considering 25 % of errors in every subject, up to 80%  of errors of all the records in a subject are covered. All the records were also clustered using K-means clustering. Although there was some similarity between records of different subjects, there was not seen any evident relationship between the pattern of repetition of the errors and the subject of records.

    Keywords: Data quality, Research information quality, quality control, Clustering}
  • محمدجواد ارشادی*

    در مدارک علمی، نمایه سازی و کنترل کیفیت، فرایندهایی کلیدی وجود دارد که در صورت انجام درست آنها، امکان بازیابی مناسب در موتورهای جست وجو فراهم می آید. در منابع علمی، به روش های نمونه برداری در محصولات فیزیکی به اندازه کافی پرداخته شده است؛ اما در حوزه داده ها، به ویژه داده های پژوهشی، کارهای اندکی انجام شده است. در این پژوهش، چارچوبی برای نمونه برداری فرایندهای کنترل کیفیت داده فراهم شده است. به عنوان مطالعه موردی، داده های پژوهشی پایگاه اشاعه اطلاعات پایان نامه ها/ رساله (پارسا) های دانش آموختگان کل کشور (گنج) انتخاب شده است. بر اساس نتایج، با توجه به کیفیت پذیرفتنی بسیاری از اقلام اطلاعاتی پارسا، پس از ثبت، نمونه برداری کاری حیاتی برای ارتقای کارایی واحد سازمان دهی و تحلیل اطلاعات است. منحنی OC برای طرح های گوناگون نشان می دهد که طرح های ارایه شده برای ارزیابی سطح کیفیت داده های پژوهشی، از کارایی مناسبی برخوردارند. چارچوب ارایه شده در این پژوهش، برای سازمان های گوناگون داده محور، به‎ویژه کسب وکارهای مبتنی بر داده، قابلیت بومی سازی دارد.

    کلید واژگان: کیفیت داده, نمونه برداری, کنترل کیفیت, منحنی OCOC, سازمان دهی, تحلیل اطلاعات}
    MohammadJavad Ershadi *

    In the scientific literature, indexing and quality control are key processes that, if done correctly, can be properly retrieved by search engines by researchers. On the other hand, the use of mechanisms such as infallibility and empowerment of users has made research organizations 100% free from quality control. Also, the restriction on the use of specialized organizational human resources has doubled the importance of paying attention to sampling methods. Although in scientific sources, sampling methods in physical and tangible products have been well and adequately addressed, but in the field of data, especially research data, little work has been done. In this research, a framework for sampling in data quality control processes is provided. Also, an algorithm has been developed for statistical design to minimize type I and II errors. As a case study of research data, the information dissemination database of dissertations / dissertations (pious) of graduates of the whole country (Ganj) has been selected and the research method has been implemented in this database. The results of this study showed that, considering the acceptable quality of many pious information items after registration, sampling is a vital task in improving the efficiency of the information organization and analysis unit. The classification of information items into three categories is critical, main and partial, and determining the number and method of sampling for each category is another result of this research. The framework presented in this research can be localized for various data-driven organizations, especially businesses based on research data. Since any revision of AQL and LTPD values affects type I and II errors, it is necessary to apply the algorithms developed in this research to new AQL and LTPD values as well. Obviously, the results of the algorithm implementation such as number of samples, acceptance number and rejection number will be updated in this process.

    Keywords: Data quality, Sampling, Quality Control, OC curve, Organize, Analyze information}
  • محمدجواد ارشادی*، معصومه نبی زاده

    امروزه اندازه گیری کیفیت داده یکی از مهم ترین راهبردها در بهبود فرایندهای کسب و کارهای داده محور به حساب می آید. هرگونه تصمیم درست برای بهبود سیستم ها در این دسته از سازمان ها به یک تحلیل مناسب از کیفیت داده ها وابسته است. داده های پژوهشی و به ویژه پایان نامه/رساله ها (پارساها)ی دانش آموختگان کل کشور برپایه همین اصل از جنبه های گوناگون کیفیت داده نیازمند بررسی و ارزیابی است. در فرایند ثبت پارساها کنترل کیفیت فراداده ها یکی از مهم ترین بخش هاست که به بررسی قلم های اطلاعاتی مدارک (مانند نام پژوهشگر، استادان راهنما و مشاور، چکیده، فهرست و...) می پردازد. در وضعیت موجود، مدارک ناهمخوان در حین فرایند کنترل کیفیت شناسایی شده و پس از درج در سامانه (بصورت متن) مدرک مربوطه به صورت سیستمی به پژوهشگر برگردانده می شود. استاندارد نبودن ناهمخوان های شناسایی شده و نبود دسته بندی مناسب برای مدارک ناهمخوان، به اطلاع رسانی سلیقه ای به پژوهشگران منجر شده، تحلیل های آماری از مشکلات کیفی فراداده ها را بادشواری روبرو ساخته و همچنین تحلیل ریشه ای خطاهای مشاهده شده را ناممکن می سازد. از این رو، در این پژوهش ساختار ناهمخوان های مشاهده شده پس از استاندارد شدن به صورت آزمایشی در دورهای دوماهه استفاده شده و نتایج آن ارایه شده است. ناهمخوانی در تاریخ دفاع، صفحه عنوان (فارسی و انگلیسی) و وجود صفحه های سفید در فایل پارسا از جمله مهم ترین دلایل بازگرداندن مدارک به کاربران بوده است. همچنین تحلیل همه داده ها نشان داد 59 درصد از ناهمخوانی ها به فایل های ضمیمه شده و 41 درصد به اطلاعات ثبت شده در سامانه مربوط می شود. در نهایت برپایه تحلیل های انجام شده رهنمودهایی برای کاربران سامانه بمنظور بهبود کیفیت داده ها، به تفکیک حوزه های تخصصی، ارایه شده است.

    کلید واژگان: کیفیت داده, کیفیت اطلاعات, کنترل کیفیت, پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک), سامانه ثبت پایان نامه, رساله, تحلیل ناهمخوان}
    Mohammad Javad Ershadi*, Masoumeh Nabizadeh

    Today, measuring data quality is one of the most important strategies in improving data-driven business processes. Any correct decision to improve systems in this category of organizations depends on an appropriate analysis of data quality. Research data and especially theses / dissertations  of graduates of the whole country based on this principle from various aspects of data quality need to be reviewed and evaluated. In the process of registering, the quality control of metadata is one of the most important parts that examines the information items of documents (such as the name of the researcher, supervisors and advisors, abstract, index, etc.).In the current situation, incompatible documents are identified during the quality control process and after entering in the system (as text), the relevant document is systematically returned to the researcher. Non-standard incompatible identified and the lack of proper classification for incompatible documents leading to informing tastes to researchers, making statistical analysis of metadata quality problems difficult, and also make it impossible to analyze the root of observed errors. Therefore, in this study, the incompatible structure observed after standardization has been used experimentally in two-month periods and the results have been presented. Incompatible in thesis defense date, the title page (Persian and English) and the existence of white pages in the file have been among the most important reasons for returning documents to users.  Also, the analysis of all data showed that 59% of the incompatibles were related to the attached files and 41% to the information recorded in the system. Finally, based on the performed analyzes, guidelines have been provided for the users of the system in order to improve the quality of data, according to specialized areas

    Keywords: Data quality, Information quality, Quality Control, Iranian Research Institute for Information Science, Technology (IranDoc), Thesis, Thesis Registration System, incompatible analysis}
  • محمد جواد ارشادی*، عمار جلالی منش، جلال الدین نصیری

    پژوهش های اخیر نشان می دهد داده بعنوان یکی از ارزشمندترین منابع هر سازمان شناخته می شود. ازسوی دیگر امروزه داده های علم و فناوری در رشد و توسعه هر کشور به پایه و عنصری کلیدی تبدیل شده است. سامانه گنج نقشی کلیدی در اشاعه علم و فناوری در کشور و ارائه خدمات به پژوهشگران در راستای انجام پژوهش های اثربخش و کارا برعهده دارد. بر این اساس، کیفیت عملکرد این سامانه یکی از عوامل تاثیرگذار در این ماموریت محسوب می گردد. از سوی دیگر، بخش عمده مشکلات کیفی مشاهده شده در حوزه اشاعه اطلاعات از سوی این سامانه، بصورت ریشه ای به خروجی سامانه دیگری  با عنوان سامانه ثبت برمی گردد که در مرحله آغازین کلان فرایند ثبت، سازماندهی و اشاعه اطلاعات قرار دارد. تعیین وضعیت (یا سطح کیفیت) مطلوب در هر فیلد از فراداده از جنبه های کیفی مختلف مانند دقت، صحت، نامتناقض بودن، کامل بودن و... یکی از حیاتی ترین اقدامات در حوزه کیفیت سامانه ثبت به حساب می آید. در پژوهش حاضر پس از بررسی مدل های استاندارد مدیریت کیفیت داده، چارچوبی جامع به منظور تعیین ابعاد کیفیت سامانه ثبت ایجاد شد. مدل مدیریت کیفیت جامع داده  (TDQM) بعنوان یکی از پرکاربردترین مدل های کیفیت داده به منظور ارزیابی اجزاء سامانه از چهاربعد اصلی ذاتی، دسترس پذیری، زمینه ای و نمایشگری انتخاب شد. سپس در قالب طرح کیفیت سامانه ثبت عوامل کلیدی در کنترل کیفیت سامانه ثبت تعیین خواهد شد. طرح کیفیت داده ارائه شده پس از اعتبارسنجی توسط کارگروه خبرگان بعنوان مرجع تعیین عدم انطباق های آتی داده ها قرار گرفت.  در انتهای پژوهش حاضر اقدامات کاربردی به منظور ارتقاء کیفیت این سامانه نیز ارائه شد.

    کلید واژگان: فراداده, کنترل کیفیت, طرح کیفیت, سامانه های اطلاعاتی تحقیقاتی, سامانه ثبت پایان نامه, رساله}
    Mohammad Javad Ershadi*

    Recent researches suggest that data is known as one of the most valuable resources of any organization. On the other hand, today science and technology data have become a key to the growth and development of each country. Treasure system plays a key role in advancing science and technology in the country and providing researchers with the services of effective and efficient research. Accordingly, the performance of this system is one of the factors influencing this mission. On the other hand, the major part of the observed quality problems in the area of information dissemination by the system is rooted radically in the output of another system called the registration system, which is at the very beginning of the process of recording, organizing and disseminating information. Determining the desirable status (or level of quality) in each field of the metadata from a variety of quality aspects such as accuracy, inconsistency, completeness, etc. is one of the most vital steps in the field of quality of the registration system. In this study, after reviewing the standard
    data quality management models, a comprehensive framework was developed to determine the quality dimensions of the registration system The TDQM model was selected as one of the most widely used data quality model to evaluate the components of the system from its main four-dimensional core, accessibility, terrain and display. Then, in the form of a Quality Management System, key factors will be determined in the quality control system of the registration system. The data quality plan presented after the validation by the team of experts as the reference point for determining the non-conformities of the data. At the end of the present study, practical steps were taken to improve the quality of this system.

    Keywords: Metadata, Quality Control, Quality Design, Research Information Systems, Thesis, Dissertation Registration System}
  • محمد جواد ارشادی*، تقی رجبی، فرهاد شیرانی، نسا رضایی
    سامانه های اطلاعاتی امروزه به یک بخش کلیدی در هر سازمانی مبدل شده اند. این سامانه ها از یک سو مبنای تصمیم گیری های مدیریتی و کارشناسی محسوب شده و از سوی دیگر به کاربران و مشتریان درون و برون سازمانی خدمت رسانی می نمایند. لذا عملکرد مطلوب این سامانه ها می تواند به یکی از اهداف اصلی مدیران ارشد در هر سازمانی تبدیل گردد. سامانه های اطلاعاتی تحقیقاتی از قاعده فوق مستثنی نبوده و به منظور بهبود مستمر این سامانه ها مشکلات کیفی آن ها بایستی با رویکردهای مناسبی تجزیه تحلیل شده تا عملکرد آنها ارتقاء یابد. مقاله حاضر در قالب یک مطالعه موردی رویکردهای تحلیل ریشه در حل مشکلات سامانه های اطلاعاتی تحقیقاتی مورد توجه قرار داده و نتایج عملیاتی استفاده از این رویکرد در سامانه اشاعه اطلاعات پایان نامه ها/ رساله های دانش آموختگان داخل کشور (گنج) ارائه شده است. یافته ها نشان میدهد به کمک تکنیک های مناسب تحلیل ریشه می توان مشکلات کیفی سامانه های اطلاعاتی را شناسایی ، دسته بندی و ریشه یابی نمود و اقدامات عملیاتی مناسبی در خصوص بهبود عملکرد این سامانه ها را ارائه کرد.
    کلید واژگان: تحلیل ریشه, سامانه های اطلاعاتی تحقیقاتی, کنترل کیفیت, مطالعه موردی, سامانه گنج}
    Mohammad Javad Ershadi*, Tagi Rajabi, Farhad Shirani, Nesa Rezaee
    Information systems have main role in any organization. These systems beside their effect on decision making of managers and organizational experts provide their services for internal or external customers of organizations. Along this approach appropriate performance of information systems could be introduced as main goal of chief managers. Research information systems work based on this framework then for their augmentation quality problems should well analyzed to lead their better performance. In this paper based on a case study root-cause approaches of quality problem solving of dissemination system of theses and dissertations called GANJ are investigated. Results show that identification and categorization of quality problems could be achieved by root-cause analysis. Furthermore corrective actions for improvement of these systems effectively could be defined.
    Keywords: Root-Cause Analysis, Research Information Systems, Quality Control, Case Study, GANJ System}
