فهرست مطالب

Statistical Research of Iran - Volume:16 Issue: 2, 2020

Journal of Statistical Research of Iran
Volume:16 Issue: 2, 2020

  • تاریخ انتشار: 1398/12/11
  • تعداد عناوین: 11
|
  • عیسی محمودی*، آمنه رستمی، رسول روزگار صفحات 287-317

    در این مقاله، ما فرایند خودوایاز صحیح مقدار مرتبه ی اول با نوآوری های پواسون-لیندلی بر اساس عملگر رقیق کننده ی جدید، به نام عملگر رقیق کننده ی سری توانی را معرفی می کنیم. این فرایند برای مدل بندی سری های زمانی شمارشی بیش پراکنده مناسب است. برخی از ویژگی های آماری فرایند آورده شده است. پارامترهای نامعلوم مدل توسط سه روش کمترین توان های دوم شرطی، یول واکر، بیشینه درستنمایی شرطی براورد می شوند. همچنین عملکرد این براوردگرها با استفاده از مطالعه ی شبیه سازی مورد ارزیابی قرار می گیرند. همچنین سه حالت خاص مدل با جزییات بررسی شده است. سرانجام، این مدل به چهار مجموعه داده های واقعی از جمله تعداد سالانه زمین لرزه ها، تعداد ماهانه ی موارد سرخک، تعداد سری های مرگ ناگهانی و شمارش هفتگی موارد بروز سندرم گره ی لنفاوی مخاط پوستی حاد تب دار اعمال می شود. سپس پتانسیل مدل را نشان می دهیم.

    کلیدواژگان: فرایند خودوایاز صحیح مقدار، خانواده ی توزیع های سری توانی، توزیع پواسون-لیندلی، عملگر رقیق کننده، معادله های یول واکر
  • غلامحسین یاری، زهرا کریمی اضماره* صفحات 319-342

    دانشگاه علم و صنعت ایران در این مقاله، برای اولین بار توزیع UTIW برای مدل بندی داده های سرعت باد پیش نهاد می شود. از آن جایی که برای داده های سرعت باد یک کران بالا وجود دارد، در نتیجه می توان این داده ها را به کمک توزیع UTIW بیان کرد. در این مطالعه، توزیع UTIW معرفی و برخی ویژگی های آماری آن مورد مطالعه قرار می گیرد. سپس پارامترهای این توزیع با استفاده از چند روش براورد می شوند. مطالعه های شبیه سازی مربوط به این براوردگرها ارایه می شود. عملکرد این توزیع بر روی داده های واقعی سرعت باد استان اردبیل آزمون می شود. بر اساس نتیجه های به دست آمده، توزیع UTIW در برازش به داده های سرعت باد مناسب تر از توزیع های معرفی شده ی اخیر است. در نهایت، این توزیع را می توان به عنوان یک توزیع جایگزین برای ارزیابی داده های سرعت باد در نظر گرفت.

    کلیدواژگان: توزیع وایبول وارون، توزیع وایبول وارون بالا بریده، براورد پارامتره، شبیه سازی مونت کارلو، معیارهای انتخاب مدل
  • افسانه عزیزی، عبدالرضا سیاره* صفحات 343-378

    در این مقاله توزیع نوع سوم بر دو متغیره ی مارشال-اولکین تحت چپ سانسوری تصادفی مورد مطالعه قرار گرفته است. براوردگرهای بیشینه درست نمایی پارامترها به روش مستقیم و با استفاده از الگوریتم EM شرطی محاسبه و همچنین ماتریس اطلاع فیشر مشاهده شده نیز به دست آمده است. مطالعه ی شبیه سازی و تحلیل داده های واقعی به منظور ارزیابی نتیجه ها انجام شده است.

    کلیدواژگان: الگوریتم EM شرطی، تابع درست نمایی، توزیع نوع سوم بر، چپ سانسوری تصادفی
  • اعظم راستین، رضا فریدروحانی*، داوود خلیلی صفحات 379-396

    هدف از تحلیل داده های بقا از طریق رگرسیون، بسط یک مدل پیشگو با استفاده از متغیرهای پیشگو است. اما به دلیل سانسور در متغیرهای پاسخ و بالابعدی متغیرهای پیشگو، اطلاعات مورد نیاز برای مشخص کردن مدل مناسب اغلب ناکافی است. ما روشی را برای یک مطالعه ی یکپارچه از زمان بقا و پیشگوها پیشنهاد می کنیم. در ابتدا، روش های انتخاب متغیر برای یافتن یک زیرمجموعه ی مناسب از پیشگوها با احتمال معنی داری بالا بکار گرفته می شوند. سپس، بعد پیشگوها با استفاده از روش های کاهش بعد بسنده برای داده های سانسوریده بیش تر کاهش می یابد.به خصوص ما از مدل خطر متناسب کاکس برای ساخت یک مدل پیشگو برای داده های بقا استفاده می کنیم.کاربردی برای داده های مربوط به بیماری های عروق کرونر قلب (CHD) حاصل از مطالعه ی TGLS مفید بودن این کار را مشخص می کند.

    کلیدواژگان: داده ی سانسوریده، کاهش بعد بسنده، زیرفضای مرکزی، رگرسیون وارون ورقه ورقه شده، انتخاب متغیر، بیماری عروق کرونر قلب
  • صدیقه عظیمی*، احسان بهرامی سامانی، مجتبی گنجعلی صفحات 397-407

    در این مقاله یک مدل توام جدید با اثرهای تصادفی برای پاسخ های شمارشی همبسته صفر آماسیده و پیوسته ارایه می کنیم. در این مدل، فرض می کنیم پاسخ دوجمله ای بیش پراکنده از توزیع بتا دوجمله ای صفر آماسیده و پاسخ پیوسته از توزیع نرمال پیروی می کند. علاوه بر این، از روش بیشینه درستنمایی برای براورد پارامترهای مدل استفاده می کنیم. همچنین مدل پیش نهادی را با استفاده از روش شبیه سازی مونت کارلویی ارزیابی می کنیم. سرانجام، مدل را به داده های واقعی برازش می دهیم و عامل های موثر بر پاسخ های آمیخته را می یابیم.

    کلیدواژگان: اثرهای تصادفی، پاسخ های آمیخته، الگوریتم EM، داده های آمارگیری جمعیتی
  • محمد مهدی صابر* صفحات 409-446

    در این مقاله چند پیشگوگر برای پیشگویی در یک مدل خودوایاز مرتبه ی دوم مانا معرفی شده و سپس با هم مقایسه می شوند. این کار جداگانه برای حالت هایی که مشاهده ها به زمان مورد نیاز برای پیشگویی، دور یا نزدیک باشند انجام می شود. برای مقایسه ی پیشگوگرها از معیار میانگین توان دوم خطای پیشگویی و معیار نزدیکی پیتمن استفاده می شود. دو مجموعه داده های واقعی با استفاده از پیشگوگرهای برتر بررسی و تحلیل می شوند.

    کلیدواژگان: مدل خودوایاز مرتبه ی دوم مانا، عمل کرد پیشگویی، معیار نزدیکی پیتمن
  • شهره انعامی، حمزه ترابی*، تقی اخوان نیاکی صفحات 447-464

    در بسیاری از کاربردها، کیفیت یک محصول می تواند به صورت مجموع درصد مطلوبیت کیفی چند ویژگی آن محصول اندازه گیری شود. در این حالت، به منظور بررسی فرایند تولید می توان نمودار پایشی را بر اساس توزیع بتای چندمتغیره ساخت.هدف این مطالعه، معرفی یک نمودار پایشی جدید به منظور بررسی کیفیت محصولات است، زمانی که ویژگی های کیفی از توزیع بتای دومتغیره پیروی می کنند. با یک مطالعه ی شبیه سازی، کارایی نمودار پایشی معرفی شده با استفاده از معیار متوسط طول دنباله ارزیابی می شود. در حالتی که پارامترهای توزیع نامعلوم باشند، با استفاده از روش بیشینه ی درستنمایی، پارامترهای این توزیع براورد می شوند. سپس با یک مطالعه ی شبیه سازی، کارایی نمودار پایشی معرفی شده در دو حالت پارامترهای معلوم و نامعلوم، با یکدیگر مقایسه می شوند.

    کلیدواژگان: توزیع بتای دو متغیره، روش درستنمایی بیشینه، متوسط طول دنباله
  • محمدتقی معطی*، حمیدرضا نواب پور، فرزاد اسکندری صفحات 465-490

    <span style="font-family:Times New Roman,serif;">مدت هاست پیش بینی های جمعیتی برای کوچک ناحیه ها توجه فزاینده ی پژوهش گران بخش جمعیت شناختی کاربردی را به خود جلب کرده است. با توجه به سیاست های جمعیتی پیش نهادی ایران در سال های اخیر و با توجه به نیاز دستگاه های اجرایی مختلف به اطلاعات واحدهای جغرافیایی کوچک، لزوم بررسی و ارایه ی مدل پیش بینی جمعیتی کوچک ناحیه ای در ایران بیش از پیش ضروری به نظر می رسد. منظور از پیش بینی جمعیتی در کوچک ناحیه ها به تنهایی دستیابی به تعداد کل جمعیت نیست بلکه هدف رسیدن به تعداد جمعیت همراه با ویژگی های اجتماعی و اقتصادی خانوارها و اعضای درون آن ها است. مطالعه ی حاضر سعی در ارایه ی مدلی برای پیش نگری جمعیت در کوچک ناحیه ها دارد. در این مطالعه شهر به عنوان کوچک ناحیه در نظر گرفته شده است. به منظور پیش نگری جمعیت بین سال های دو سرشماری در ایران، 1385 و 1390، محلات یکی از شهرهای مرکزی کشور و از آنجا که منطقه جغرافیایی آن از 1385 تا 1390 تغییر نکرده است، در بین بسیاری از شهرها انتخاب شده است. از این رو، این مقاله جمعیت هم گذاشت شده با ویژگی های خاص در سال 1385 را با ارایه ی یک مدل گسترش یافته در سال 1390 پیش نگری می کند آن را با جمعیت پیش نگری شده از یک مدل موجود مقایسه می کند.</span></span><span style="font-family:Times New Roman,serif;"></span></span></span>

    کلیدواژگان: نمونه مبنا، روزامدسازی متناسب تکراری، شبیه سازی جمعیت، کوچک ناحیه، جمعیت هم گذاشتی
  • لیدا کلهری*، آسیه عباسی، روشنک علی اکبری صبا، نسرین ابراهیمی صفحات 491-506

    یکی از چالش های سازمان های آماری ملی اجرای آمارگیری با یک پرسش نامه ی طولانی و تعداد زیادی قلم های اطلاعاتی است. تکمیل یک پرسش نامه ی طولانی وقت گیر است و منجر به مشکلاتی از جمله افزایش بی پاسخی می شود. به خصوص در شرایط بحرانی مانند همه گیری بیماری کووید 19، این مسئله چالش برانگیزتر خواهد بود. یک راه حل برای مواجهه با این مشکل استفاده از طرح پرسش نامه ی خردشده است که انعطاف پذیرتر است و به زمان کم تری برای گرداوری داده ها نیاز دارد. در این مقاله، طرحی برای شکستن پرسش نامه ی آمارگیری هزینه و درامد خانوار پیش نهاد می کنیم. این طرح یکی از مهم ترین آمارگیری های سالانه ی مرکز آمار ایران است که پرسش نامه ی آن طولانی و تکمیل کردن آن زمان بر است.

    کلیدواژگان: طرح پرسش نامه ی خرد شده، رگرسیون، آمارگیری هزینه و درامد خانوار
  • فاطمه امیدی، آرزو حبیبی راد*، وحید فکور صفحات 507-533

    ما در این مقاله دو آزمون جدید نیکویی برازش بر اساس اطلاع کولبک-لیبلر تجمعی (CKL) و اطلاع کولبک-لیبلر باقیمانده تجمعی  (CRKL) برای توزیع نمایی با پارامتر نامعلوم و داده های سانسورشده ی تصادفی را پیش نهاد می دهیم. کوزیول و گرین ‎(1976)‎ آمار‏ه کرامرفون-می سز را با داده های سانسوریده ی تصادفی برای یک فرضیه ی ساده مبتنی بر براورد حد حاصل ضربی کاپلن-مایر برای تابع توزیع معرفی کردند. ما از ایده ی آن ها برای به دست آوردن آماره ی آزمون بر اساس ‎CKL‎ و ‎CRKL‎ برای سانسور تصادفیده در توزیع نمایی با پارامترهای براوردشده استفاده می کنیم. توان آزمون های پیش نهادی برای توزیع نمایی با آماره های آزمون بر اساس تابع توزیع تجربی و با استفاده از ایده ی کوزیول و گرین ‎(1976)‎ مقایسه می شوند. در مطالعه های شبیه سازی از مدل های سانسور تصادفی کوزیول و گرین ‎(1976)‎ کمک گرفتیم و نتایج مطالعه ها نشان دادند که آزمون پیش نهادی در مقایسه با آماره های دیگر برای بسیاری از فرضیه های مقابل توان بیش تری دارد.

    کلیدواژگان: آماره ی کرامر فون-می سز، اطلاع کولبک -لیبلر تجمعی، اطلاع کولبک-لیبلر باقیمانده ی تجمعی، براوردگر کاپلن-مایر، توزیع نمایی، داده های سانسورشده ی تصادفی
  • مجید هاشم پور*، مهدی دوست پرست، الهه ولایتی مقدم‎ ‎ صفحات 535-557

    به طور معمول در نظام های مهندسی فرض بر این است که طول عمر مولفه ها مستقل و هم توزیع هستند. اما در واقعیت ، خرابی یک مولفه منجر به بار بیش تر بر روی مولفه های باقی مانده می شود و بنا بر این باعث می شود توزیع مولفه های باقی مانده تغییر کند. برای مدل بندی این نوع نظام، می توان از نظریه ی آماره های ترتیبی دنباله ای استفاده کرد. فرض می شود طول عمر مولفه های تشکیل دهنده ی یک نظام دارای توزیع وایبول و تحت مدل نرخ خطر متناسب شرطی که حالت خاصی از نظریه ی آماره های ترتیبی دنباله ای است مدل بندی شده است. براوردگرهای بیشینه ی درستنمایی پارامترهای نامعلوم در حالت های مختلف به دست آمده است. مدل جدیدی که با عنوان مدل نرخ خطر متناسب شرطی تحت روند توانی مشخص می شود به عنوان یک تعمیم از حالت مستقل و هم توزیع مولفه ها پیش نهاد می شود و سپس روش های استنباطی آماری شامل براوردهای نقطه ای و فاصله ای و همچنین آزمون های تحت فرضیه ی بالا توسعه می یابد. در آخر، داده های واقعی مربوط به زمان خرابی اجزای هواپیما، مان و فرتیگ ‎(1973)‎، برای نشان دادن مدل و روش های استنباطی توسعه یافته در اینجا مورد تحلیل قرار می گیرند.

    کلیدواژگان: داده های سانسوریده، براورد، تابع خطر، قابلیت اطمینان، آماره های ترتیبی دنباله ای
|
  • Eisa Mahmoudi*, Ameneh Rostami, Rasoul Rouzegar Pages 287-317

    In this paper, we introduce the first-order non-negative integer-valued autoregressive (INAR(1)) process with Poisson-Lindley innovations based on a new thinning operator called power series thinning operator. Some statistical properties of process are given. The unknown parameters of the model are estimated by three methods; the conditional least squares, Yule-Walker and conditional maximum likelihood. Then, the performances of these estimators are evaluated using simulation study. Three special cases of model are investigated in some detail. Finally, the model is applied to four real data sets, such as the annual number of earthquakes, the monthly number of measles cases, the numbers of sudden death series and weekly counts of the incidence of acute febrile muco-cutaneous lymph node syndrome. Then we show the potentiality of the model.

    Keywords: Integer-valued autoregressive processes, power series distributions, Poisson-Lindley distribution, thinning operator, Yule-Walker equations
  • Gholamhossein Yari, Zahra Karimi Ezmareh* Pages 319-342

    In this paper, for the first time, the upper truncated inverse Weibull (UTIW) distribution is proposed for modeling wind speed data.Since there is a upper limit for empirical wind speed data, this data can be represented by using the UTIW distribution. In this study, the UTIW distribution is introduced and some of its statistical properties are studied. Then, the parameters of this distribution are estimated by using different methods. Simulation studies for these estimators are presented. In addition, the mentioned distribution performance is tested on real wind speed data of Ardabil province in Iran. Based on the results of the analysis, it is found that the presented distribution in this study for modeling wind speed data is more appropriate than recently introduced distributions. Finally, this distribution can be used as an alternative model for evaluating wind speed data.

    Keywords: Inverse Weibull distribution, upper truncated inverse Weibull distribution, wind speed, parameters estimation, Monte-Carlo simulation, model selection criteria
  • Afsaneh Azizi, Abdolreza Sayyareh* Pages 343-378

    In this paper, a Marshal-Olkin bivariate model based on Burr $III$ distribution is considered under random left censoring. The maximum likelihood estimator of the unknown parameters is obtained using the direct method and Expectation Conditional Maximization algorithm. We also obtained the Fisher information matrices. To discuss the properties of the estimators obtained iteratively, a simulation study is carried out. A real data set is used to illustrate the theoretical results.

    Keywords: Marshal-Oklin bivariate distribution, Burr lll distribution, ECM algorithm, pseudo likelihood, random left censoring
  • Azam Rastin, MohammadReza Farid Rouhani*, Davoud Khalili Pages 379-396

    An objective of analyzing survival data via regression is to develop a predictive model given predictors. However, due to the censoring in response variables and the high dimensionality of predictors, information needed for an appropriate model specification is often inadequate. We propose a method for an integrated study of survival time and predictors. At first, variable selection methods are employed for finding the correct subset of predictors with significantly higher probability. This is based on the Lasso approach. Then, the dimension of the predictors is further reduced using sufficient dimension reduction methods. This is based on the Sliced inverse regression for censored data (DSIRII). In particular we use the popular Cox proportional hazards model to build a predictive model for survival data. An application to Coronary heart disease (CHD) data from the Tehran Lipid and Glucose (TGLS) study further illustrates the usefulness of the work.

    Keywords: Censored data, sufficient dimension reduction, central subspace, sliced inverse regression, variable selection, corronary heart disease
  • Sedigheh Azimi*, Ehsan Bahrami Samani, Mojtaba Ganjali Pages 397-407

    We present a new joint model with random effects for the correlated count with extra zero and continuous responses. In this model, we assume a Zero-Inflated Beta-Binomial distribution for the analysis of over dispersed binomial variable and a normal distribution for the analysis of continuous response. Furthermore, a full model likelihood function approach is used to obtain maximum likelihood estimates of the model parameters. We also evaluate the proposed model using the Monte Carlo simulation method. Finally, we fit the model to real data to find effective factors on mixed responses.

    Keywords: Random effects, mixed response, the EM algorithm, population survey data
  • MohammadMahdi Saber* Pages 409-446

    In this paper, some predictors for prediction in a stationary second order autoregressive process are introduced. The paper attempts to find the best predictor for some cases such as circumstances there exist a fixed number of observations near or far from desired time. Pitmanchr('39')s measure of closeness and mean square error of prediction are used in order to comparison these predictors. The Gaussian and Gamma distributions have been used for distribution of errors. Finally analysis of two real data sets has also been presented for illustrative purposes.

    Keywords: AR(2) model, prediction performance, Pitman's measure of closeness
  • Shohreh Enami, Hamzeh Torabi*, Taghi Akhavan Niaki Pages 447-464

    In many practical situations, the quality of a product can be measured based on some quality characteristics in terms of the sum of the percentage of these characteristics utilities. In these cases, control charts based on multivariate beta distribution can be used to monitor the process. This study aims to introduce a new control chart for monitoring the quality of products when two quality characteristics follow a bivariate Beta distribution. The efficacy of the proposed control chart is evaluated using the average run length criterion using a simulation study. In the case that the parameters of this distribution are unknown, the maximum likelihood method is applied. Then, using a simulation study, the performance of the proposed charts, in two cases known and unknown parameters are compared.

    Keywords: Bivariate beta distribution, maximum likelihood method, average run length
  • Mohammad Taghi Moeti*, Hamidreza Navvabpour, Farzad Eskandari Pages 465-490

    Population projections of small areas have attracted the attention of many researchers in applied demographics for many years. According to the suggested population policies of Iran in recent years and considering the need of different governmental agencies for having enough information about population and individual characteristics in small areas, studying and presenting an appropriate model of population projections for small areas seems more necessary than ever. Given that today not only population projections include estimating the number of populations and identifying their specific characteristics, but also more projections are likely to project different required characteristics of organizations. The present study attempts to introduce a model for population projections in small areas. In this study, "city" is considered as a small area. For the purpose of surveying population projection between two censuses in Iran, 2006 and 2011, Mahallat, a central city in this country, has been selected among many cities since its geographical area has not been changed from 1996 to 2011. Hence, the present article projects simulated synthetic population in 2011 with distinctive characteristics of 2006 population by presenting an extended model and comparing it with projected population from the existing model.

    Keywords: Sample-based, interactive proportional updating, simulation of population, small area, synthetic population
  • Lida Kalhori*, Asiyeh Abbasi, Roshanak Aliakbari Saba, Nasrin Ebrahimi Pages 491-506

    One of the challenges at National Statistical Organizations is conducting a survey with a long questionnaire and a large amount of items. Filling out a lengthly questionnaire is time consuming and leads to problems such as increased unresponsiveness rate. Especially during critical situations such as pandemic Covid-19, this would be more challenging. A solution to encounter this difficulty is using a split questionnaire design that is more flexible and taking less time for collecting data. In this paper, we propose a split questionnaire design for Household Expenditure and Income Survey(HEIS) which is one of the most important surveys conducted annually by Statistical Center of Iran and its questionnaire is really long and time consuming to complete.

    Keywords: Split questionnaire design, regression model, HEIS
  • Fatemeh Omidi‎, Arezou Habibirad*, Vahid Fakoor‎ Pages 507-533

    ‎We propose two goodness of fit test statistics based on‎ Cumulative Kullback--Leibler (CKL) information and Cumulative residual Kullback--Leibler (CRKL) information for exponential distributions with unknown parameter and randomly censored data‎. ‎Koziol and Green introduced the Cramér-von Mises statistic with randomly censored data for a simple hypothesis based on the Kaplan--Meier product limit of the distribution function‎. ‎We use their idea to obtain test statistics based on CKL and CRKL for a randomly censored exponential distribution with estimated parameters‎.
    ‎The power of the proposed tests for testing exponentiality is compared with the test statistic based on the empirical distribution function using the opinion of Koziol and Green‎. ‎A simulation study is performed under a special censorship model introduced by Koziol and Green‎. ‎Simulation studies show a relatively high power of proposed test statistics in many alternatives‎.

    Keywords: Cramér-von Mises statistic, cumulative Kullback--Leibler information, cumulative residual Kullback--Leibler information, exponential distribution, Kaplan--Meier estimator, randomly censored data
  • Majid Hashempour*, Mahdi Doostparastand, Elaheh Velayati Moghaddam Pages 535-557

    ‎In engineering systems‎, ‎it is usually assumed that the lifetimes of components are independent and identically distributed (iid)‎. ‎But‎, ‎the failure of a component results in a higher load on the remaining components and hence causes the distribution of the surviving components to change‎. ‎For modelling this kind of system‎, ‎the theory of sequential order statistics (SOS) can be used‎. ‎Assuming Weibull distribution for lifetimes of components and conditionally proportional hazard rates model as a special case of the SOS theory‎, ‎the maximum likelihood estimates of the unknown parameters are obtained in different cases‎. ‎A new model‎, ‎denoted by PTCPHM‎, ‎as a generalization of the iid case is proposed‎, ‎and then statistical inferential methods including point and interval estimations as well as hypothesis tests‎ ‎under PTCPHM are developed‎. ‎Finally‎, ‎real data on failure times of aircraft components‎, ‎due to Mann and Fertig (1973) ‎, ‎are analysed to illustrate the model and inferential methods developed here‎.

    Keywords: Censored data, estimation, hazard function, reliability, sequential order statistics