فهرست مطالب

مجله علوم آماری - سال یازدهم شماره 2 (پیاپی 22، پاییز و زمستان 1396)

مجله علوم آماری
سال یازدهم شماره 2 (پیاپی 22، پاییز و زمستان 1396)

  • تاریخ انتشار: 1397/01/07
  • تعداد عناوین: 10
|
  • حمزه آگاهی صفحات 207-217
    فرایند های تصادفی در آمار و احتمال از اهمیت زیادی برخوردار هستند، به طوری که پیدا کردن کران های بالایی و پائینی برای انتگرال های میانگین مربع تصادفی به یک مسئله اساسی منجر شده است. در این مقاله نشان داده می شود که برای فرایندهای تصادفی میانگین مربع مشتق پذیر، شرط تحدب در نتایج مشهور گذشته را می توان با شرایط ضعیف تر جایگزین کرد.
    کلیدواژگان: فرایند های تصادفی، انتگرال های میانگین مربع تصادفی، میانگین مربع مشتق پذیر
  • هادی امامی، پروانه منصوری صفحات 219-240
    تمام مشاهدات نقش یکسان در مدل های آماری ندارند. گاهی برخی از مشاهدات اثرات نامناسبی روی نتایج تحلیل رگرسیونی دارند. بنابراین شناسایی چنین مشاهداتی در تحلیل داده ها از اهمیت ویژه ای برخوردار است. برای شناسایی چنین مشاهداتی از روش های تشخیصی استفاده می شود. در مقاله حاضر با استفاده از روش حذف موردی و مدل انتقال میانگین نقاط دورافتاده، مباحث تشخیصی در مدل خطی آمیخته نیمه پارامتری با خطا در اندازه گیری مورد بررسی قرار گرفته است. علاوه بر مباحث حذف موردی، مباحث حذف آزمودنی نیز ارایه شده است. در پایان عملکرد مباحث تشخیصی با استفاده از مجموعه داده های واقعی و یک مثال شبیه سازی نشان داده شده است.
    کلیدواژگان: مدل خطی آمیخته، خطا در اندازه گیری، فاصله کوک، روش های امتیاز تصحیح شده، حذف موردی
  • رضا پورموسی، نرجس گیلانی صفحات 241-262
    در این مقاله ابتدا به معرفی مدل های رگرسیون پواسون آمیخته پرداخته و در ادامه به معرفی یک مدل جدید به نام رگرسیون پواسون-بیرنبام ساندرز با هدف لحاظ کردن مسئله بیش پراکنش در مدل بندی داده های شمارشی پرداخته می شود.
    از آن جا که توزیع بیرنبام ساندرز آمیخته ای از دو توزیع گاوسی وارون تعمیم یافته است، لذا می توان مدل معرفی شده دو پارامتری را تعمیمی بر مدل های قبلی دانست که علاوه بر داشتن یک پارامتر کمتر نسبت به مدل رگرسیون پواسون گاوسی وارون تعمیم یافته، دارای شکل بسته در تابع جرم احتمال حاشیه ای و گشتاورهای مربوطه است.
    برای برآورد پارامتر های این مدل از الگوریتم EM استفاده و در نهایت کارایی این مدل نسبت به مدل های موجود با استفاده از مطالعه شبیه سازی شده و یک مثال واقعی نشان داده شده است.
    کلیدواژگان: وزیع بیرنبام ساندرز، الگوریتم EM، داده های شمارشی، مدل های رگرسیون پواسون، بیش پراکنش، مدل رگرسیون پواسون آمیخته
  • میثم تسلی زاده خمس، زهرا رضایی قهرودی صفحات 263-284
    روش های متعددی برای خوشه بندی داده های بیان ژن دوره ای زمانی وجود دارد ولی محدودیت هایی برای این روش ها وجود دارد که از جمله آن ها می توان به عدم در نظر گرفتن همبستگی در طول زمان و زمان بر بودن محاسبات اشاره داشت. در این مقاله با معرفی مدل های اثرات آمیخته ی ناپارامتری و نیمه پارامتری، این همبستگی در طول زمان در نظر گرفته شده و با استفاده از اسپلاین تاوانیده، حجم محاسبات به طور چشم گیری کاهش یافته است. در پایان با استفاده از مطالعه شبیه سازی عملکرد روش پیشنهادی با روش های قبلی مقایسه و با استفاده از ملاک BIC، مدل مناسب تر انتخاب و تحلیل می شود. همچنین روش پیشنهادی در یک مثال کاربردی داده های بیان ژن دوره ای زمانی ارائه شده است.
    کلیدواژگان: پروفایل های طولی، هموارسازی اسپلاین، اسپلاین تاوانیده، مدل اثرات آمیخته خطی، خوشه بندی مدل پایه، بیان ژن
  • سید محمدرضا علوی، صفورا علی بابایی، رحیم چینی پرداز صفحات 285-295
    توزیع بتا برای مدل بندی داده هایی که به صورت نسبت هستند، توزیع مناسبی است. در موارد زیادی که داده های نسبت شامل تعداد زیادی صفر و یک هستند، توزیع های بتای آماسیده مناسب هستند. در صورتی که احتمال ثبت چنین مشاهده هایی متناسب با یک تابع وزن نامنفی از آن ها باشد، آن مشاهده ها دارای توزیع موزون بتای آماسیده هستند. تمرکز این مقاله روی توزیع اریب اندازه بتای آماسیده به عنوان یک حالت خاص از توزیع موزون بتای آماسیده با وزن توانی است. خواصی از این توزیع مطالعه و پارامترهای آن به روش های ماکسیمم درستنمایی و گشتاوری برآورد و با استفاده از مطالعه شبیه سازی دو روش مقایسه می شوند. در پایان مدل مفروض به داده های واقعی نسبت مرگ و میر برازش داده می شوند.
    کلیدواژگان: توزیع بتا، توزیع بتای آماسیده، توزیع موزون، توزیع بتای آماسیده اریب اندازه
  • افشین فلاح، رامین کاظمی، حسن خسروی صفحات 297-317
    تحلیل رگرسیونی به طور سنتی با فرض همگن بودن جامعه و نرمال بودن توزیع متغیر پاسخ صورت می پذیرد. این در حالی است که در بسیاری از کاربردها، به دلیل ناهمگنی مشاهدات، وجود نقاط دور افتاده، چولگی یا ترکیبی از آن ها، مشاهدات ساختاری ناهمگن با زیرجوامعی چوله -متقارن را نشان می دهند. در چنین حالاتی، می توان آمیخته ای متناهی از توزیع های چوله-متقارن را برای مدل بندی جامعه مورد استفاده قرار داد. در این مقاله رهیافت بیزی تحلیل رگرسیونی تحت فرض ناهمگن بودن جامعه و چوله-متقارن بودن توزیع زیر جوامع، با استفاده از آمیخته ای متناهی از توزیع های چوله نرمال مورد توجه قرار گرفته است. به منظور ارزیابی رهیافت پیشنهادی و مقایسه آن با مدل فراوانی گرا، از یک مطالعه شبیه سازی و یک مثال کاربردی استفاده شده است.
    کلیدواژگان: تحلیل رگرسیون بیزی، توزیع آمیخته متناهی، چولگی، الگوریتم EM، الگوریتم گیبز
  • مجتبی مرادی صفحات 319-328
    عدد پایه تکثیر، متوسط تعداد افرادی است که توسط یک فرد مبتلا به یک بیماری واگیردار، به آن بیماری مبتلا می شوند. از لحاظ علم پزشکی، برآورد عدد پایه تکثیر از دیرباز دارای اهمیت ویژه ای بوده است. در این مقاله با استفاده از فرایند شاخه ای روشی جدید برای برآورد آن معرفی می شود و در انتها، این روش برای داده های ارائه شده توسط مرکز ملی اطلاعات بیوتکنولوژی آمریکا به کار گرفته می شود.
    کلیدواژگان: فرایند شاخه ای، عدد پایه تکثیر، اپیدمیولوژی
  • مهرداد نادری، علیرضا عربپور، احد جمالیزاده صفحات 329-344
    در این مقاله تعمیم دیگری از توزیع بیرنبام-ساندرز برپایه توزیع چوله-لاپلاس ارایه می شود. همچنین برخی از ویژگی های توزیع معرفی شده به همراه برآورد پارامترهای توزیع با استفاده از الگوریتم EM و برآورد خطاهای استاندارد ارائه شده است. در نهایت نیز یک مثال شبیه سازی شده و همچنین کاربرد برازش توزیع روی دو مجموعه داده واقعی مورد بررسی قرار گرفته شده است.
    کلیدواژگان: توزیع بیرنبام-ساندرز، توزیع چوله-لاپلاس، الگوریتم، EM مطالعات مونت-کارلو
  • مهران نقی زاده قمی، مریم وحیدیان صفحات 345-355
    فاصله های تحمل مورد توجه بسیاری از پژوهشگران قرار گرفته و به طور گسترده ای در صنعت به کار می رود. فاصله تحمل یک فاصله تصادفی است که با یک ضریب اطمینان مشخص، نسبتی از جامعه مورد بررسی را پوشش می دهد. در این مقاله، ابتدا حدود تحمل آماری شامل حدود تحمل با پوشش مورد انتظار β و حدود تحمل با میزان پوشش β و سطح اطمینان γ برای طول عمر سیستم های k از n با مولفه های توزیع شده با توزیع نمایی بیان می شوند. سپس دقت حدود تحمل و تعداد شکست های لازم برای رسیدن به سطح دقت مورد نظر را بر اساس داده های سانسور شده نوع دوم محاسبه می شوند. در پایان، نتایج به توزیع وایبول تعمیم داده می شود.
    کلیدواژگان: توزیع نمایی، حدود تحمل، داده های سانسور شده نوع دوم
  • شهرام یعقوب زاده صفحات 357-379
    در این مقاله برآوردهای ماکسیمم درستنمایی، نااریب با کمترین واریانس به طور یکنواخت، صدکی، بهترین برآورد صدکی تک-مشاهده ای در خانواده برآوردهای صدکی تک-مشاهده ای و بهترین برآورد صدکی دو-مشاهده ای در خانواده برآوردهای صدکی دو-مشاهده ای مبتنی بر آماره های ترتیبی برای تابع چگالی احتمال و تابع توزیع تجمعی توزیع بتا وایبول هندسی، خصوصا با تابع نرخ خطر گودالی و تک مدی شکل که برای مدل بندی داده های مربوط به قابلیت اعتماد و طول عمر مفید است در دو بخش به دست آورده شده و با استفاده از روش شبیه سازی مونت کارلو و محاسبه میانگین توان دوم خطای برآوردگرها مقایسه شده و در هر بخش برآورد مطلوب تعیین می شود.
    کلیدواژگان: توزیع بتا وایبول هندسی، برآورد صدکی، بهترین برآورد صدکی تک-مشاهده ای، بهترین برآورد صدکی دو-مشاهده ای
|
  • Hamzeh Agahi Pages 207-217
    Stochastic processes are very important in statistics and probability, where finding upper and lower bounds of mean-square stochastic integral has led to a basic problem. In this paper we show that for mean-square differentiable stochastic process, the convexity condition in previous well-known results can be replaced by weaker conditions.
    Keywords: Stochastic processes, Mean-square stochastic integrals, Mean-square differentiable
  • Hadi Emami, Parvaneh Mansoori Pages 219-240
    Semiparametric linear mixed measurement error models are extensions of linear mixed measurement error models to include a nonparametric function of some covariate. They have been found to be useful in both cross-sectional and longitudinal studies. In this paper first we propose a penalized corrected likelihood approach to estimate the parametric component in semiparametric linear mixed measurement error model and then using the case deletion and subject deletion analysis we survey the influence diagnostics in such models. Finally, the performance of our influence diagnostics methods are illustrated through a simulated example and a real data set.
    Keywords: Case deletion, Cook's distance, Corrected score methods, Linear mixed models, Measurement error, Semiparametric linear models
  • Reza Pourmousa, Narjes Gilani Pages 241-262
    In this paper the mixed Poisson regression model is discussed and a Poisson Birnbaum-Saunders regression model is introduced consider the over-dispersion. The Birnbaum-Saunders distribution is the mixture of two the generalized inverse Gaussian distributions, therefore it can be considered as an extension of traditional models.
    Our proposed model has less dimensional parameter space than the Poisson- generalized inverse Gaussian regression model. We also show that the proposed model has a closed form for likelihood function and we obtain its moments. The EM algorithm is used to estimate the parameters and its efficiency is compared with conventional models by a simulation study. An analysis of a real data is provided for more illustration.
    Keywords: Birnbaum-Saunders distribution, EM algorithm, Count data, Poisson regression models, Overdispersion, Mixed Poisson regression model
  • Meysam Tasallizadeh Khemes, Zahra Rezaei Ghahroodi Pages 263-284
    There are several methods for clustering time course gene expression data. But, these methods have limitations such as the lack of consideration of correlation over time and suffering of high computational.
    In this paper, by introducing the non-parametric and semi parametric mixed effects model, this correlation over time is considered and by using penalized splines, computation burden dramatically reduced. At the end, using a simulation study the performance of the presented method is compared with previous methods and by using BIC criteria, the most appropriate model is selected. Also the proposed approach is illustrated in a real time course gene expression data set.
    Keywords: Longitudinal profiles, Spline smoothing, Penalized spline, Linear mixed effects model, Model- based clustering, Gene expression
  • Sayed Mohammad Reza Alavi, Safura Alibabaie, Rahim Chinipardaz Pages 285-295
    The standard Beta distribution is a suitable distribution for modeling the data that include proportions. In many situations which the data of proportions include a considerable number of zeros and ones, the inflated beta distributions are more appropriate. When probabilities of recording such observations are proportional to a nonnegative weight function, the recorded observations distributed as a weighted inflated Beta. This article focuses on the size biased inflated Beta distribution as a special case of weighted inflated Beta distribution with the power weight function. Some properties of this distribution is studied and its parameters are estimated using maximum likelihood and method of moments approaches. The estimators are compared via a simulation study. Finally, the real mortality data set is fitted for this model.
    Keywords: Beta distribution, Inflated beta distribution, Weighted distribution, Size biased inflated beta distribution
  • Afshin Fallah, Ramin Kazemi, Hasan Khosravi Pages 297-317
    Regression analysis is done, traditionally, considering homogeneity and normality assumption for the response variable distribution. Whereas in many applications, observations indicate to a heterogeneous structure containing some sub-populations with skew-symmetric structure either due to heterogeneity, multimodality or skewness of the population or a combination of them. In this situations, one can use a mixture of skew-symmetric distributions to model the population. In this paper we considered the Bayesian approach of regression analysis under the assumption of heterogeneity of population and a skew-symmetric distribution for sub-populations, by using a mixture of skew normal distributions. We used a simulation study and a real world example to assess the proposed Bayesian methodology and to compare it with frequentist approach.
    Keywords: Bayesian regression analysis, Mixture distribution, Skewness, EM algorithm, Gibbs algorithm
  • Mojtaba Moradi Pages 319-328
    The basic reproduction number is the average number of secondary infection cases generated by a single primary case in a susceptible population. Estimation of the basic reproduction number is important in medical studies. In this paper, we describe a new method for estimating the basic reproduction number by branching processes. Finally, we apply this estimator on real data reported by the National Center for Biotechnology Information in the USA.
    Keywords: Branching Process, Basic Reproduction Number, Epidemiology
  • Mehrdad Naderi, Alireza Arabpour, Ahad Jamalizadeh Pages 329-344
    This paper presents a new extension of Birnbaum-Saunders distribution based on skew Laplace distribution. Some properties of the new distribution are studied and the EM-type estimators of the parameters with their standard errors are obtained. Finally, we conduct a simulation study and illustrate our distribution by considering two real data example.
    Keywords: Birnbaum-Saunders distribution, Skew Laplace distribution, EM algorithm, Monte Carlo study
  • Mehran Naghizadeh Qomi, Maryam Vahidian Pages 345-355
    The problem of finding tolerance intervals receives very much attention in researches and is widely applied in industry. Tolerance interval is a random interval that covers a proportion of the considered population with a specified confidence level. In this paper, the statistical tolerance limits are expressed for lifetime of k out of n systems with exponentially distributed component lifetimes. Then, we compute the accuracy of proposed tolerance limits and the number of failures needed to attain a desired accuracy level based on type-II right censored data. Finally, we extend our results to the Weibull distribution.
    Keywords: Exponential distribution, Tolerance limits, Type-II censored data
  • Shahram Yaghoobzadeh Pages 357-379
    In this paper, the maximum liklihood estimation, unbiased estimations with minimum variance, percentile estimation, best percentile estimation single-observation estimation and the best percentile estimation two-observations in class which are based on order statistics are calculated in two sections for probability density and cumulative distribution functions of the beta Weibull geometric distribution, specially with bathtub-shaped and unimodal failure rate which are useful for modeling of data related to reliability and lifetime. Furthermore, through the simulation method of Monte Carlo and calculation of average square of errors of estimators, they are subjected to comparisons ultimately, the desirable estimator in each section is determined.
    Keywords: Beta Weibull Geometric distribution, Percentile Estimation, Best Single-observation Percentile Estimation, Best Two-observation Percentile Estimation, Monte Carlo Simulation