به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت

جستجوی مقالات مرتبط با کلیدواژه « regression » در نشریات گروه « برق »

تکرار جستجوی کلیدواژه «regression» در نشریات گروه «فنی و مهندسی»
  • Kirti Sharma, Pawan Tiwari *, Sanjay Sinha
    Data represents a compendium of information that perpetually expands with each passing moment, contributed by individuals worldwide. Within the domain of medical science, this reservoir of data accumulates at an almost exponential rate, doubling in volume annually. The emergence of advanced machine learning tools and techniques, subsequent to a substantial evolution in data mining strategies, has bestowed the capacity to glean insights and discern concealed patterns from vast datasets, thus enabling extensive analytical pursuits. This study delves into the application of machine learning algorithms to enhance societal well-being by harnessing the transformative potential of machine learning advancements in the domain of blood glucose concentration estimation through regression analysis. The culmination of this investigation involves establishing a correlation between glucose concentration and hematocrit volume. The dataset employed for this research is sourced from clinically validated electrochemical glucose sensors (commonly referred to as glucose strips). It encompasses diverse levels of both glucose concentration and hematocrit volume, the latter being furnished by an undisclosed source to ensure copyright compliance. This dataset comprises four distinct variables, and the aim of this research involves training the dataset using regression techniques to predict two of these variables. Our results indicate that when utilizing linear regression, the R2 score for GC is approximately 0.916, whereas for HV, it reaches around 0.537. In contrast, employing the support vector regressor yielded R2 scores of about 0.961 for GC and 0.506 for HV.
    Keywords: Estimation, Correlation, analysis, Regression, Healthcare, enlightenment, Machine Learning, Quantum leap, Data mining, Insights}
  • حکیمه حسنیه، بهزاد ابراهیمی، فرید صابری موحد، مهدی افتخاری*
    روش های انتخاب ویژگی ابزاری کارا در بهبود فرآیند یادگیری شناخته می شوند. هدف از یک روش انتخاب ویژگی، شناسایی ویژگی های مرتبط و حذف ویژگی های غیرمرتبط به منظور بدست آوردن یک زیرمجموعه مناسب از ویژگی ها است، بطوریکه افزونگی بین ویژگی های انتخاب شده کمینه گردد. در داده های چند-برچسبه، این امکان وجود دارد که در صورت وجود همبستگی بین ویژگی ها، مقدار افزونگی در مجموعه ویژگی ها افزایش یابد. وجود افزونگی بین ویژگی ها به همراه چالش ابعاد بالای داده های چند-برچسبه، می تواند باعث افزایش حجم محاسبات، کاهش دقت و در نهایت افزایش احتمال رخ دادن خطا در پیش بینی و طبقه بندی داده های چند-برچسبه شود. در این مقاله، با هدف کمینه کردن افزونگی ویژگی های انتخابی، یک الگوریتم انتخاب ویژگی چند-برچسبه با در نظر گرفتن مدل رگرسیون کمترین مربعات خطا و تنظیم تنکی پیشنهاد شده است. در انتها، با استفاده از تعدادی مجموعه داده چند-برچسبه مشهور، کارایی روش پیشنهادی بررسی می گردد و نتایج بدست آمده با چند روش انتخاب ویژگی چند-برچسبه متداول مقایسه می شود
    کلید واژگان: انتخاب ویژگی چند-برچسبه, کمینه کردن افزونگی, رگرسیون, کمترین مربعات خطا, تنظیم تنکی}
    Hakimeh Hasaniyeh, Behzad Ebrahimi, Farid Saberi-Movahed, Mahdi Eftekhari *
    Feature selection methods are known to be effective in improving the learning process. The purpose of a feature selection method is to identify relevant features and remove irrelevant features in order to obtain a suitable subset of features, so that the redundancy between the selected features is minimized. In multi-label data, if there is a correlation between features, it is possible that the amount of redundancy in the feature set is increased. The existence of redundancy between features along with the challenge of high dimensions of multi-label data can grow the computational calculations, decrease the accuracy and finally increase the probability of errors in the prediction and classification of multi-label data. In this article, with the aim of minimizing the redundancy of features, a multi-label feature selection algorithm is proposed considering the least squares regression model and sparse regularization. Finally, using a number of well-known multi-label data sets, the efficiency of the proposed method is verified and the results are compared with some common multi-label feature selection methods.
    Keywords: Multi-label feature selection, Redundancy minimization, regression, Least squared error, Sparsity regularization}
  • K. Kalita *, R. Kumar Ghadai
    Recently there has been a surge in the usage of metaheuristic algorithms to design materials with optimum performance. In this article, one such recently proposed metaheuristic algorithm called RPSOLC (Repulsive Particle Swarm Optimization with Local search and Chaotic perturbation) has been used to design diamond-like carbon (DLC) thin films having better hardness. Based on a Box-Behnken design, 15 independent experiments on DLC deposition are conducted in a PECVD (plasma-enhanced chemical vapor deposition) setup by varying the CH4-Argon flow rate, hydrogen flow rate and the deposition temperature. The nano-hardness of the DLCs are evaluated using nano-indention tests. The hardness is then expressed as the function of the three process parameters using a polynomial regression metamodel. Finally, the metamodel is optimized using RPSOLC and compared with optimal predictions of a traditional GA. It is seen that RPSOLC has faster convergence and is more reliable than the GA. In general, a high H2 flow rate along with low CH4-Ar flow rate and high temperature is found to be beneficial in improving the hardness.
    Keywords: Metaheuristics, Metamodel, PSO, Regression, thin film, Coatings}
  • مژگان جواهرنیا*، ساحل جواهرنیا

    بلورهای فتونی یکی از رایج ترین ساختارها برای طراحی و پیاده سازی مدارهای الکترونیک نوری هستند. باند ممنوعه فوتونی در این ساختارها از اهمیت بالایی برخوردار است. رایج ترین روش های ریاضی برای تحلیل و محاسبه نمودارهای باند فوتونی و استخراج باند ممنوعه فوتونی بلور های فوتونی روش بسط امواج تخت است. این روش دارای پیچدگی های زیادی است که برای انجام محاسباتش نیاز به نرم افزارهای تجاری مخصوص است. در بلور های فوتونی دو بعدی دو پارامتر در باند ممنوعه فوتونی این بلور ها تاثیرگذار می باشند که ضریب شکست ماده دی الکتریک و نسبت شعاع حفره ها به ثابت شبکه بلور (r/a) هستند. در این مقاله با بهره گیری از ریاضیات و رگراسیون خطی روابط ساده تری برای استخراج محدوده باند فوتونی بلور های فوتونی ارایه شده است. مقایسه نتایج بدست آمده از روابط با نتایج بدست آمده با نرم افزار BandSOLVE برای بلور های فوتونی نشان می دهد که حداکثر اختلاف بین دو روش محاسبه برای fl و fu به ترتیب 007/0 و 028/0 بوده و میانگین اختلاف نیز به ترتیب 004/0 و 01/0 می باشد.

    کلید واژگان: روش بسط امواج تخت, رگرسیون, فوتونی, باند ممنوعه فوتونی, ساختار باند}
    Mozhgan Javahernia *, Sahel Javahernia

    Photon crystals are on of the most common structures for designing and implementing electronic optical circuits. The photon gap band is of great importance in these structures. The most common mathematical methods for analyzing and calculating photon band diagrams and extracting the forbidden photon band of photon crystals is the flat wave expansion method. This method has many complexities that require special commercial software to perform its calculations. In two-dimensional photonic crystals, two parameters in the photon band are affected, which are the refractive index of the dielectric material and the ratio of the radius of the holes to the constant of the crystal lattice (r / a). In this paper, using mathematics and linear regression, simpler relations for extracting the photon band range of photon crystals are presented. Comparison of the results obtained from the relations with the results obtained with BandSOLVE software for photonic crystals shows that the maximum difference between the two calculation methods for fl and fu is 0.007 and 0.028, respectively, and the average difference is , respectively 0.004 and is 0.01.

    Keywords: Flat wave expansion method, Regression, Photons, Photon Gap Band, Band Structure}
  • Seyedeh Rezwan Hosseini, Farnaz Ghassemi *, Mohammad Hasan Moradi

    Most of the studies on phenotype differences, including some diseases, are based on studying the areas of the genome called Single Nucleotide Polymorphism (SNP). Some SNPs on their own and some by interacting with other SNPs play an important role in any phenotype or specific disease. Various models, including regression models, are designed and implemented for prediction of these diseases. As the phenotypes are both quantitative and binary, linear regression is used for models predicting quantitative ones, which is only based on the number of minor alleles per SNP, and logistic regression is used for binary ones like complex diseases. Since complex diseases are not caused only by independent SNPs, but by the interaction of a large number of SNPs, which mostly exceeds the number of samples, penalized logistic regressions are counted to be a better choice. These models, therefore, can overcome the limitation of ordinary logistic regression on high-dimensional SNP datasets. In this paper, three regression models, including Ridge, Lasso and Elastic Net (EN), were implemented on 10000 samples of the SNP datasets of OWKIN-Inserm Institute to predict the risk of a specific disease (undisclosed for confidentiality reasons). Among these three, the Lasso model with minimizer lambda indicated higher accuracy (73.73%) and AUC (83.54%). The model is also less complex since it eliminates less related features as much as possible and keeps only the most informative ones. Besides, getting better results with Lasso indicates that multicollinearity is either not existed between variables or is low that can be neglected.

    Keywords: Complex diseases prediction, genotype-phenotype associations, SNP, Regression, penalized logistic regression}
  • Ali Emadizadeh, Zahra Azizi *

    Fire is a major factor in the development of some plant communities, especially those exposed to lightning. Lightning is almost the main cause of natural fires in most plant communities. Fire is effective in the evolution of various species of forests, pastures, and shrubs in arid regions of the world's Mediterranean regions. Remote sensing and geographic information systems are appropriate in assessing the severity of burns. In this study, the intensity of the fire in Gorgan forests is evaluated and examined. The period of the study area was from 2013 to 2017 and Landsat 8 satellite imagery was used. First, the fire points were identified within an area of 500 meters by the IDW method. Then, by using NDVI, NBR, and dNBR indicators, fire points were evaluated and fire points were marked with red pixels which is clear in the two pictures before and after the fire. Finally, it was concluded that the NBR and dNBR index are the most accurate indicators with an accuracy of more than 74%.

    Keywords: Forest, Fire, NDVI index, NBR index, dNBR index, Regression}
  • A.R. Hatamlou *, M. Deljavan
    Gold price forecast is of great importance. Many models were presented by researchers to forecast gold price. It seems that although different models could forecast gold price under different conditions, the new factors affecting gold price forecast have a significant importance and effect on the increase of forecast accuracy. In this paper, different factors were studied in comparison to the previous studies on gold price forecast. In terms of time span, the collected data were divided into three groups of daily, monthly and annually. The conducted tests using new factors indicate accuracy improvement up to 2% in neural networks methods, 7/3% in time series method and 5/6% in linear regression method.
    Keywords: Gold price forecast, data mining, time series, neural networks, regression}
  • مهدی محمدی*، سید مرتضی بیاره، محمد کوثری

    توربین های گازی یکی از مصرف کننده های عمده گاز طبیعی در شرکت ملی گاز محسوب می شوند. در این میان توربین های سه محوره بخش عمده ای از توربین های موجود در ایستگاه های تقویت فشار را به خود اختصاص داده اند. در این تحقیق ابتدا روابط اکسرژی حاکم بر اجزاء مختلف ایستگاه تقویت فشار گاز استخراج و بر اساس اطلاعات واقعی، مدل های ریاضی مختلفی بر اساس متغیرهای محیطی و عملیاتی ایجاد گردید. این مدل ها با استفاده از رگرسیون خطی چند متغیره و با کمک آنالیز واریانس ایجاد شده که نتایج دقیقی را ارائه داده است. براساس مدل های ایجاد شده می توان پارامترهایی از قبیل، بازده اکسرژی توربین، مصرف سوخت، مصرف سوخت ویژه و اکسرژی هدر رفته در کل ایستگاه را با داشتن متغیرهای محیطی و عملیاتی مانند دمای ورودی به کمپرسور هوای توربین، دمای ورودی به توربین و نسبت تراکم توربین پیش بینی کرد. با توجه به مدل های ایجاد شده، روند تاثیر متغیرهای مختلف بر روی پارامترهای مذکور مورد بررسی قرار گرفت و اثر متقابل متغیرهای مختلف بر روی پاسخ مدل های ایجاد شده نیز بررسی گردید. نتایج نشان دادند که تغییر در هرکدام از متغیرها بر شیب تغییرات توان خالص خروجی ناشی از تغییر دیگر متغیرها تاثیری ندارد، در حالی که دمای ورودی به کمپرسور و نسبت تراکم در مدل بازده اکسرژی، دمای ورودی به توربین و نسبت تراکم در مدل مصرف سوخت و دمای ورودی به کمپرسور و دمای ورودی به توربین در مدل مصرف سوخت ویژه، تاثیر متقابلی بر روی پاسخ مدل ها دارند.

    کلید واژگان: اکسرژی, توربین گازی, رگرسیون, آنالیز واریانس, ایستگاه تقویت فشار گاز}
    Mehdi Mohammadi *, Seyed Morteza Bayareh, Mohammad Kowsari

    Triple shaft gas turbines are the most gas compressor driven in natural gas compressor station in national Iranian Gas Company. In the recent study, exergy equilibrium formula of each components of gas compressor station specified and several mathematical models made. The model predict different parameters based on environmental and operational conditions. Models made by multivariate linear regression and ANOVA technique that made high precision models. The models results show that how varying the environment and operational condition such compressor inlet temperature, turbine inlet temperature and turbine pressure ratio affect exergy efficiency, fuel consumption, exergy destruction and specific fuel consumption. In this study effects of environmental and operational variables on this parameters and interaction of this variable on each other surveyed. Results showed that variation in each variables has no effect in slope of net output power variation due to change in other variables, whereas compressor inlet temperature and pressure ratio in exergy efficiency model, turbine inlet temperature and pressure ratio in fuel consumption model and turbine and compressor inlet temperature in specific fuel consumption model have interaction on their model's response

    Keywords: Exergy, gas turbine, regression, ANOVA, gas compressor station}
  • امیرمسعود سفیدیان، نگین دانشپور *
    حضور مقادیر جاافتاده در داده های دنیای واقعی مشکلی بسیار رایج و غیرقابل اجتناب است. بنابراین لازم است تا پیش از عملیات اکتشاف دانش، این مقادیر جاافتاده به طور دقیق پر شوند. در این مقاله، سه رویکرد جدید برای تخمین مقادیر جاافتاده عددی پیشنهاد می شود. در تمامی روش های پیشنهادی، مدل های رگرسیون بر زیرمجموعه هایی با همبستگی بالا اعمال می شوند. در انتخاب زیرمجموعه های مطلوب سعی می شود تا همبستگی بین صفت جاافتاده و دیگر صفات حداکثر شود. انتخاب این زیرمجموعه ها با استفاده از رویکردهایی مبتنی بر انتخاب روبه جلو انجام می شود. از معیار ضریب همبستگی برای اندازه گیری میزان ارتباط بین صفات استفاده شده است. همچنین در روش های پیشنهادی، ترتیب صفات جاافتاده برای انجام عمل جایگذاری اولویت دهی می شوند. عملکرد رویکردهای پیشنهادشده بر روی پنج مجموعه داده از دنیای واقعی با مقادیر مختلف جاافتادگی ارزیابی شده است. عملکرد رویکردهای ارائه شده با پنج رویکرد جایگذاری با مقدار میانگین، جایگذاری با استفاده از نزدیک ترین همسایگان، روش جایگذاری با خوشه بندی c-means فازی، روش جایگذاری با درخت تصمیم و روشی مبتنی بر رگرسیون به نام «الگوریتم جایگذاری با رگرسیون افزایشی صفات» (IARI) مقایسه شده است. از دو معیار شناخته شده ی ریشه میانگین مربعات خطا و ضریب تعیین برای مقایسه عملکرد رویکردهای پیشنهادی با دیگر روش های جایگذاری استفاده شده است. نتایج آزمایش ها نشان می دهد که رویکردهای ارائه شده، حتی زمانی که درصد جاافتادگی بالا است، بهتر از دیگر روش های مقایسه شده عمل می کنند.
    کلید واژگان: جایگذاری مقادیر جاافتاده, همبستگی, رگرسیون}
    A. M. Sefidian, N. Daneshpour *
    The presence of missing values in the real world data is a very prevalent and inevitable problem. So, it’s necessary to fill up these missing values accurately, before they are used for knowledge discovery process. This paper proposes three novel methods to fill numeric missing values. All of the proposed methods apply regression models on subsets of data which there are strong correlations among them. These subsets are selected using forward selection based approaches. In the selection of the desired subsets, it is tried to maximize the correlation between missing attribute and other attributes. The correlation coefficient is used to measure the relationships between attributes. The priority of each missing attribute for imputation purpose is also considered in the proposed methods. The performance of proposed methods is evaluated on five real world datasets with different missing ratios. The efficiency of the proposed methods is compared with five different estimation methods, namely, the mean imputation, the k nearest neighbours imputation, a fuzzy c-means based imputation, a decision tree based imputation, and a regression based imputation algorithm, called “Incremental Attribute Regression Imputation” (IARI) method. Two well-known evaluation criteria, namely, Root Mean Squared Error (RMSE) and Coefficient of Determination (CoD) are used to compare the performance of proposed methods with other imputation methods. Experimental results show that the proposed methods perform better than other compared methods, even when the missing ratio is high.
    Keywords: Missing values imputation, Correlation, Regression}
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال