فهرست مطالب

گستره علوم آماری - سال یکم شماره 2 (بهار و تابستان 1395)

نشریه گستره علوم آماری
سال یکم شماره 2 (بهار و تابستان 1395)

  • تاریخ انتشار: 1395/04/14
  • تعداد عناوین: 8
|
  • علیرضا پاک گهر* صفحات 7-14
    در این مقاله میزان کارایی مدل های رده بندی رگرسیون لجستیک باینری و رگرسیون درختی روی متغیر وابسته باینری بررسی می شود. شیوه پردازش مدل، استفاده از تمام داده ها در مرحله آموزشی است. مجموعه داده های مورد مطالعه از یک گزارش مطالعاتی درباره سوابق بیماری زردی به دست آمده است که یک مجموعه داده شامل متغیرهای کمی و کیفی است. میزان کارایی دو روش طبقه بندی کننده رگرسیون لجستیک و رگرسیون رده بندی درخت تصمیم، بر اساس معیارهای کارایی آماری نظیر دقت، توجه به موارد خاص، و تحلیل حساسیت است. نتایج تجربی ما نشان می دهد که رگرسیون لجستیک، دقت بالای 83% و رگرسیون درختی میزان دقت حدود 73% را بر روی مجموعه نشان داده اند. به همین ترتیب میزان حساسیت رگرسیون لجستیک باینری برابر 77% و رگرسیون درختی برابر 66% است. همچنین اندازه توجه به موارد خاص مدل رگرسیون برابر 85% وبرای رگرسیون درختی برابر 76% است. نتایج کارایی مدل نشان می دهد رگرسیون لجستیک باینری بهتر از رگرسیون درختی عمل کرده است.
    کلیدواژگان: داده کاوی، رگرسیون لجستیک، رگرسیون درختی، دقت، حساسیت و مشخصه بودن
  • مهدی شمس* صفحات 15-30
    در برخی مسائل آماری از جمله آزمون فرضیه ها نیاز به وجود اثبات استقلال دو آماره کمکی و آماره بسنده کامل داریم. با استفاده از قضیه باسو بدون این که توزیع توأم دو آماره محاسبه شوند، با داشتن شرایط لازم وجود این استقلال ثابت می شود. در این مقاله به بیان کاربردهایی از این قضیه در آزمون فرضیه های آماری می پردازیم. پیدا کردن توزیع نسبت درست نمایی تعمیم یافته و پرتوان ترین آزمون های یکنواخت نااریب، استقلال نسبت های درست نمایی برای آزمون های مرکب و آزمون های مدل های اقتصادسنجی می تواند چند مورد از کاربردهای این قضیه باشد. در پایان به طور مختصر شبیه سازی آزمون فرضیه ها بیان می گردد.
    کلیدواژگان: قضیه باسو، توزیع نسبت درست نمایی تعمیم یافته، پرتوان ترین آزمون های یکنواخت نااریب، آزمون های مرکب
  • نرگس حسینیون* صفحات 31-38
    نظریه موجک ها شاخه ای از تحلیل هارمونیک و از پدیده های جدید علم ریاضی است که کاربرد های زیادی در ریاضیات و آمار و سایر علوم دارد. این نظریه علی رغم عمر کوتاه خود، به سرعت رشد کرد و تقریبا در هر زمینه ای که تحلیل فوریه حضور داشته، به رقابت با آن برخاسته است. در این مقاله یک برآورد ناپارامتری برای تابع چگالی احتمال و مشتقات آن براساس روش موجک برای متغیرهای تصادفی سانسور شده تحت وابستگی منفی تعمیم یافته ارائه می دهیم و به بررسی ویژگی های آن در فضای بسوف می پردازیم. نشان می دهیم برآوردگر معرفی شده دارای نرخ بهینه همگرایی برآوردگرهای موجک، تحت زیان است.
    کلیدواژگان: آنالیز چندریزگی، برآوردگر موجک، فضای بسوف، مشاهدات سانسور شده، وابستگی منفی تعمیم یافته
  • ابوذر بازیاری* صفحات 39-48
    نمونه گیری ترابرشی خطی یک روش بسیار مفید برای برآورد تابع چگالی جمعیت در علم زیست شناسی است. در این مقاله، ابتدا به معرفی روش نمونه گیری ترابرشی خطی پرداخته شده و سپس آزمون فرضیه پارامتری برای تابع چگالی نیم نرمال در مقابل تابع چگالی نمایی یک متغیره در روش نمونه گیری ترابرشی خطی در نظر گرفته شده است. آماره آزمون با استفاده از روش نسبت درست نمایی محاسبه شده است. به دلیل ساختار پیچیده آماره آزمون، محاسبه توزیع آن تحت فرضیه صفر و نیز تعیین مقادیر بحرانی آن کار ساده ای نخواهد بود، بنابراین از روش شبیه سازی مونت کارلو برای یافتن مقادیر بحرانی آماره آزمون در سطوح مختلف معناداری استفاده شده است. با مثال های عددی این مسئله آزمون مورد بررسی قرار گرفته است.
    کلیدواژگان: آزمون فرضیه پارامتری، تابع چگالی نیم نرمال، شبیه سازی مونت کالو، نمونه گیری ترابرشی خطی
  • شهرام یعقوب زاده شهرستانی* صفحات 49-54
    در این مقاله ابتدا چندجمله ای های استرلینگ‎ معرفی و روش محاسبه آنها در نرم افزار R‎ و کاربردشان در حل رده ای از انتگرال ها را بیان می کنیم که در محاسبه گشتاورها‏، گشتاورهای آماره های مرتب‏، آنتروپی های رنی و شانون و... در توزیع های آماری بر حسب این نوع انتگرال ها، نقش بسزایی دارد. سپس با استفاده از ‏آن‏، گشتاورهای دو توزیع آماری مرتبط با این انتگرال ها را به دست می آوریم.
    کلیدواژگان: چند جمله ای های استرلینگ، انتگرال، گشتاورها
  • فریبا نظری *، انوشیروان غفاری پور، نرگس عباسی صفحات 55-62
    در این مقاله به معرفی توزیع وایبل کوماراسوامی و بیان برخی از ویژگی های این توزیع می پردازیم.
    این توزیع یک مدل کاملا منعطف در تحلیل داده های مثبت است. توزیع وایبل کوماراسوامی شامل زیرمدل های خاص از جمله توزیع های وایبل‏ نمایی شده‏، رایلی نمایی شده‏، نمایی نمایی شده‏، وایبل و همچنین توزیع جدید نمایی کوماراسوامی است. عبارات صریح برای گشتاورها‏، تابع مولد گشتاور‏ها و همچنین نتایجی از ‏شبیه سازی بر روی توزیع را ارائه می دهیم.
    کلیدواژگان: توزیع کوماراسوامی، توزیع وایبل، نرخ شکست
  • لیدر نوایی* صفحات 63-68
    در این مقاله پس از معرفی شبه فضای احتمال، برای اولین بار شبه تابع مولد گشتاور را معرفی می کنیم و به بررسی ویژگی های آن می پردازیم.
    همچنین برخی ویژگی های شبه امید ریاضی و شبه واریانس را مورد بررسی قرار خواهیم داد.
    کلیدواژگان: شبه فضای احتمال، شبه تابع مولد گشتاور، شبه امید ریاضی
  • روشنک علی محمدی*، صدیقه خندان صفحات 69-73
    ساختار وابستگی داده های فضایی با موقعیت و فاصله بین آن‏ها مرتبط است؛ لذا تحلیل داده های فضایی دارای کاربردهای متعددی در زمینه های کاربردی است.
    در این پژوهش به مطالعه دو روش درون یابی فضایی یعنی کریگینگ معمولی و عام پرداخته می‏شود. بدین منظور، به شبیه‏سازی مجموعه های داده ها پرداخته، عملکرد هر یک از این روش‏ها تحت شرایط مورد نظر، ارزیابی می‏شود. همچنین، برای بررسی اثر اندازه نمونه های مختلف و توابع تغییرنگار متفاوت، داده ها با اندازه های نمونه و تغییرنگارهای متفاوت شبیه‏سازی شده‏اند. علاوه بر این، برای هر یک از مجموعه داده های شبیه‏سازی شده از معیارهای اعتبارسنجی متقابل برای مقایسه این دو روش استفاده شده است. به عنوان ارائه کاربردی از نتایج حاصل، دقت روش های مورد نظر در برآورد مقادیر مربوط به یک معدن استفاده شده است.
    کلیدواژگان: داده های فضایی، کریگینگ معمولی، کریگینگ عام، اعتبارسنجی متقابل
|
  • Alireza Pakgohar* Pages 7-14
    This paper describes the performance analysis of two classifier models common in statistics and data mining on binary dependent variable, binary Logistic Regression (B.LR) and Classification Regression Tree (CART). The evaluation method is using all data in training stage. The using data set is from “Evaluation of patients with Jaundice on children” report. Data set is collection of categorical and continues independent variables. The classification performance of two classifiers is presented by using statistical performance measures like accuracy, specificity and sensitivity. Experimental result showed that accuracy of LR is more than 83% and CLASSIFICATION AND REGRESSION TREE is nearly 73%. So the sensitivity measure for BINARY LOGISTIC REGRESSION is nearby 77% and 66% for CLASSIFICATION AND REGRESSION TREE as well the specificity scale is 85% for BINARY LOGISTIC REGRESSION and 76% for CLASSIFICATION AND REGRESSION TREE. The result shows the performance of BINARY LOGISTIC REGRESSION classifier is found to be better than CLASSIFICATION AND REGRESSION TREE.
    Keywords: Data Mining, Binary Logistic Regression, Classification Regression tree, Accuracy, Sensitivity, Specificity
  • Mehdi Shams* Pages 15-30
    In some statistical problems we need independence of two statistic, especially in testin hypotheses. With Basu's theorem, we can proof independence of two statistic without calculate their joint ditributions. In this paper we will give applications of this theorem in statistical testin hypothese as GLRT, UMPUT, independens LRT in Compound Tests, and testing of Econometric Models.
    Keywords: Basu's Theorem, GLRT Distribusion, UMPUT, Compound Tests
  • Narges Hoseinion* Pages 31-38
    Wavelet Analysis is a branch of Harmonic Analysis and a new phenomenon of Mathematics science which offers wide range of application in Mathematics, Statistics and other fields. Wavelets analysis is finding a rapidly growing number of applications despite its young age and often replacing the conventional Fourier transform. Basically in this paper, the problem of estimating a density and its derivatives for a sample of censored random variables is considered. The purpose of this paper is to present an approach to this problem based on wavelets methods for extended negatively dependent observations. Besides, we explore its performances under the risk in Besov ball.
    Keywords: Multiresolution Analysis, Wavelet estimator, Besov Space, Censored data, Extended Negatively Dependent
  • Abozar Bazyari * Pages 39-48
    Line transect sampling is a very helpful method for estimating the density function of population in biology. In this paper, first the line transect sampling is introduced and then parametric hypothesis testing for half normal density function against univariate exponential density function in line transect sampling was considered.
    The test statistics is obtained using likelihood ratio method. Computing the null distribution of test statistic and its critical values is not easy because of the complexity of test statistic structure, therefore Monte carlo simulation was used for finding the critical values of test statistic at different significance levels. This problem of testing was investigated with numerical examples.
    Keywords: Parametric Hypothesis Testing, Half Normal Density Function, Monte Carlo Simulation, Line Transect Sampling
  • Shahram Yaghoobzadeh Shahrastani * Pages 49-54
    This article first introduces the sterling polynomials and expresses the calculation methods in software R and their application in resolving a class of integrals which play an important role in the calculation of torques, torques of order statistics, Renyi and Shannon entropies in statistical distributions based on this type of integrals. Then, we obtain the torques of the two statistical distributions related to these integrals.
    Keywords: Sterling Polynomials, Integral, Moments
  • Fariba Nazari *, Anoushiravan Ghaffaripoor, Narges Abbasi Pages 55-62
    In this article, we introduce the Kumaraswamy Weibull distribution and discuss some features of this distribution.
    That is a quite flexible model in analyzing positive data. It contains special sub-models the exponentiated Weibull, exponentiated Rayleigh,exponentiated exponential,Weibull and also the new Kumaraswamy exponential distribution, Explicit Expressions for moments, moment generating function, and also we present the results of the simulation on the distribution.
    Keywords: Kumaraswamy distribution, Weibull distribution, failure rate
  • Leader Navaei * Pages 63-68
    In this paper for the first time we introduce the Pseudo-moment generator function and also we investigate some properties of. .
    We prove some properties of Pseudo-expectation and Pseudo-dispersion .
    Keywords: Pseudo, Probability, Pseudo, Moment Generator Function, Pseudo, Expectation
  • Roshanak Alimohammadi *, Sedigheh Khandan Pages 69-73
    Correlation structure of spatial data is related to their positions and distances. Then spatial data analysis has various applications in applied areas.
    In this research, we study two spatial interpolation methods, that is Ordinary Kriging and Universal Kriging. In this purpose, data sets are simulated and the performance of each of the methods is studied under the considered conditions. Besides, different sample sizes and variograms is considered to assess the effects of various sample sizes and different vaiogram functions. Furthermore, for every set of simulated data, cross validation criteria is applied to compare the methods. As an application of the results, the methods are applied for data of a mine.
    Keywords: Spatial Data, Ordinary Kriging, Universal Kriging, Cross Validation