-
The object of this study was to compare predictive accuracy of some individual modeling methods versus ensemble modeling approach in estimating the spatial potential distribution and identifying ecological requirements of Artemisia sieberi in desert rangelands of Yazd province, Central Iran. For this purpose, the species presence data were collected using the random systematic sampling method in 2019. Individual modeling of the species distribution was performed using Random Forest, Classification and Regression Tree and Generalized Additive Model after preparing environmental variable maps using GIS and geostatistics. Predictive performance of individual models was evaluated using Area Under Curve and Root Mean Square Error statistics. Furthermore, the Ensemble model was used based on the weighted average AUC. The appropriate threshold limit value was calculated based on True Skill Statistic for conversion of continuous maps to binary ones of habitat suitability. Comparison of the performance of individual models showed that the RF model had a more accurate prediction compared to the other models (AUC= 0.971 and RMSE= 0.256). Evaluation of the models implemented using threshold-dependent metrics such as Sensitivity, Specificity, and Kappa index also confirmed this finding. The overall comparison of the results from the three models versus the Ensemble model also indicates the high performance of this model compared to the individual models. Based on Ensemble model results, 45.38% of the study area had a high suitability for the establishment of A. sieberi. Based on the analysis of the importance of variables in the RF model, elevation (42%), Clay (40.02%) and pH (38.97%) in 0-30 cm soil depth had the highest effect on the presence of species. In general, Ensemble modeling can reduce the uncertainty and provide more reliable results by combining the results of the different algorithms of individual modeling.
Keywords: Species distribution modeling, Weighted Average AUC, Ensemble model, Soil properties, Iran's desert range lands -
شکست سدهای خاکی از چالش های بزرگ مهندسی عمران به شمار میرود که یکی از عمده ترین علل وقوع آن، تراوش کنترل نشده از هسته و پی سد میباشد. از این رو تحلیل تراوش، از مسائل بسیار مهم در طی مراحل طراحی، ساخت و بهره برداری از این نوع سدها است. در این راستا بررسی هد پیزومتریک یکی از اولین مراحل بررسی تراوش میباشد؛ در تحقیق حاضر هد پیزومتریک سد خاکی ستارخان با استفاده از مدلهای جعبه سیاه هوش مصنوعی و جعبه سیاه کلاسیک بر اساس 2 سناریو مورد بررسی قرار گرفته است. در هر سناریو ترکیب ورودی های مختلفی برای شرایط متفاوت در نظر گرفته شده است. در ادامه برای بهبود عملکرد مدلسازی، روش ترکیب مدل با استفاده از خروجی مدلهای منفرد جعبه سیاه انجام گرفته است. روش ترکیب مدل با استفاده از 3 روش میانگین گیری خطی ساده، میانگین گیری خطی وزندار و ترکیب غیر خطی با استفاده از شبکه عصبی مصنوعی انجام گرفته است. نتایج حاکی از آن است که به کار گیری مدلهای ترکیبی و به ویژه مدل ترکیبی غیرخطی با شبکه عصبی مصنوعی باعث افزایش دقت مدلسازی تا 10% شده است. علاوه براین، با مقایسه نتایج دو سناریو، نتیجه گیری می شود که به کارگیری سناریو2 می تواند روشی موثر برای شرایطی همچون خرابی یا از کارافتادگی برخی از پیزومترها باشد.کلید واژگان: تخمین هد پیزومتریک, مدلهای هوش مصنوعی, ترکیب مدل, سد خاکی ستارخانFailure of earth fill dams is a great challenge in Civil Engineering, in which one of the main causes is uncontrolled seepage through the core and foundation of the dam. Thus seepage analysis is one of the most important complications in design, construction and operation of this type of dams; in this way, inspecting the piezometric heads is the first step in seepage analysis. In the following paper, Sattarkhan earth fill dam piezometric heads have been analyzed via Artificial Intelligence (AI) models and a classic black box model, based on two scenarios. Each scenario has different input combinations for modeling of various conditions. To continue ensemble models have been formed via outputs of the single black box models to improve modeling performance. Three methods of model ensemble were considered, including simple linear averaging model, weighted linear averaging model and non-linear neural ensemble model. Results show that employing model ensemble and in particular non-linear ensemble by neural network, improve the modeling accuracy up to 10%. Moreover, by comparison the both scenarios, it is concluded that in case of a failure of a piezometer, employing scenario 2 can be an effective way.Keywords: Estimating Piezometric Heads, Artificial Intelligence Models, Model Ensemble, Sattarkhan Earth Fill Dam
-
دست یابی به طراحی دقیق و راهبری صحیح تصفیه خانه های فاضلاب از جمله چالش های مهم در صنعت آب و فاضلاب به شمار می آید. مدل های عددی به دلیل نیاز به داده های فراوان، زمان بر بوده و صرفه اقتصادی ندارند. بنابراین در این مطالعه، عملکرد تصفیه خانه فاضلاب تبریز با استفاده از مدل های جعبه سیاه هوش مصنوعی شامل شبکه عصبی مصنوعی (ANN)، سیستم استنتاج تطبیقی عصبی-فازی (ANFIS)، رگرسیون بردار پشتیبان (SVR) و مدل جعبه سیاه کلاسیک خودهمبسته تفاضلی با میانگین متحرک (ARIMA) براساس داده های روزانه سال های 1395-1396 مورد بررسی قرار گرفته است. جهت تعیین پارامترهای ورودی از معیار ضریب همبستگی (CC) استفاده شد که پارامترهای اکسیژن مورد نیاز بیولوژیکی (BOD)، اکسیژن مورد نیاز شیمیایی (COD) ، مواد جامد معلق (TSS)، pH ورودی به تصفیه خانه در زمان t و BOD وCOD پساب خروجی از تصفیه خانه در یک گام زمانی قبل (t-1) با بیشترین مقادیر CC به عنوان ورودی انتخاب گردیدند. BOD وCOD پساب خروجی نیز به عنوان پارامترهای خروجی مدل های هوش مصنوعی در نظرگرفته شده اند. همچنین برای بهبود عملکرد مدل سازی، روش ترکیب مدل با استفاده از خروجی مدل های منفرد مذکور، به عنوان یک روش پس پردازش، بکار گرفته شده است. ترکیب مدل به سه روش میانگین گیری خطی ساده، میانگین گیری خطی وزن دار و میانگین گیری غیر خطی با استفاده از شبکه عصبی مصنوعی انجام گرفته است. نتایج حاکی از آن است که بکارگیری مدل های غیرخطی بهتر از مدل خطی ARIMA بوده و مدل SVR بالاترین مقدار ضریب تبیین (DC) را ارایه کرده است. همچنین استفاده از مدل های ترکیبی و به ویژه مدل ترکیبی غیرخطی با شبکه عصبی مصنوعی باعث افزایش عملکرد مدل سازی تا 15% در مرحله صحت سنجی می شود.
کلید واژگان: محاسبات نرم, هوش مصنوعی, مدل خطی ARIMA, ترکیب مدل, تصفیه خانه فاضلاب تبریزIn this study, black box artificial intelligence models (AI) including feed-forward neural network (FFNN), support vector regression (SVR), and adaptive neuro-fuzzy inference system (ANFIS) were used to predict effluent biological oxygen demand (BODeff) and chemical oxygen demand (CODeff) of Tabriz wastewater treatment plant (WWTP) using the daily data collected from 2016 to 2018. In addition, the autoregressive integrated moving average (ARIMA) linear model was used to predict BODeff and CODeff parameters to compare the linear and non-linear models' abilities in complex processes prediction. To improve the prediction of BODeff and CODeff parameters, the data post-processing ensemble method was also used. The input data set included daily influent BOD, COD, total suspended solids (TSS), pH at the current time (t), and BODeff and CODeff at the previous time (t-1) and the output data included BODeff and CODeff at t. The results of the single models indicated that the SVR model provides better results than the other single models. In ensemble modeling, simple and weighted linear averaging, and neural network ensemble methods were applied to enhance the performance of the single AI models. The results indicated that using ensemble models could increase the prediction accuracy up to 15% at the verification phase.
Keywords: Soft Computing, Artificial Intelligence, ARIMA Linear Model, Ensemble, Wastewater treatment plant -
این مطالعه به بررسی کارایی یک مدل همادی در مقیاس زمانی فصلی برای تولید پیش بینی احتمالاتی با استفاده از مدل WRF جهت پیش بینی بارش در ایران پرداخته شده است. این مدل از اجرای مدل WRF با 4 پیکربندی مختلف و با 16 حالت شرایط اولیه و مرزی مختلف حاصل از پیش بینی های مدل CFSv.2 تشکیل شده است و مجموعا دارای 64 عضو است. صدک های 33 و 66 ام مبنای بارش های زیر نرمال، نرمال و بالای نرمال بوده و دوره تاریخی اجرای مدل سال های 2000 تا 2019 است. دوره عملیاتی جهت بررسی کارایی مدل نیر زمستان سال 2020 می باشد و سنجه های ارزیابی هم دو نمایه ضریب همبستگی و جذر میانگین مجذور خطا است. نتایج این مطالعه نشان می دهد که پیش بینی بارش در مقیاس فصلی در ایران دارای عدم قطعیت بالایی است و ارایه پیش بینی ها به صورت احتمالاتی هرچند می تواند از کارایی بیشتری نسبت به پیش بینی قطعی برخوردار باشد اما همچنان دارای عدم قطعیت است. توزیع فضایی خطای پیش بینی مدل در دوره تاریخی وابسته به پراکندگی مکانی بارش و فاصله از مبدا زمانی پیش بینی است، به طوری که در پیش دید اول کارایی مدل بهتر از پیش دید دوم و سوم است و از طرف دیگر در شرق و جنوب شرق کشور مدل از عدم قطعیت بالاتری نسبت به نواحی دیگر کشور برخوردار است. پیاده سازی این مدل برای یک دوره عملیاتی نشان داد که هرچند مدل می تواند تغییرات فضایی بارش در کشور را در سه پیش دید مورد بررسی پیش بینی نماید اما پیش بینی احتمالاتی هم نمی تواند به میزان قابل توجهی از عدم قطعیت مدل های عددی در پیش بینی فصلی بارش را کاهش دهد.
کلید واژگان: پیش بینی احتمالاتی, مدل همادی, بارش فصلی, سنجه های آماری, ایرانThis study evaluates the performance of an ensemble framework using the Weather Research and Forecasting (WRF) model for probabilistic seasonal precipitation forecasts. In this study, two types of data were used: a) The meteorological initial and boundary conditions come from the National Centers for Environmental Prediction (NCEP) Climate Forecast System Version 2 (CFSv2) data. b) Precipitation data from the Global Precipitation Climatology Centre (GPCC) dataset used as observational data over Iran. The ensemble model was designed based on a one-way double-nested (60-parent domain and 20-nested Km resolutions) modeling system using Weather Research and Forecasting (WRF) version 4.2 customized over Iran to downscale the second version of the NCEP Climate Forecast System (CFSv2). The results showed that precipitation forecast at seasonal time scale in Iran has high uncertainty. Although probabilistic forecasts can increase the efficacy of seasonal forecasts more than deterministic, the uncertainty of these forecasts is still high. Additionally, the downscaling of the CFS.v2 model by WRF and using multiple initial conditions and model physics can increase the accuracy of seasonal forecasts. The spatial distribution of the forecast accuracy of the ensemble model is dependent on the spatial distribution of precipitation over Iran. Another factor that affects the model's accuracy is the forecast lead time dependent especially at 2-month and 3-month forecast lead times. The results showed that the model has high uncertainty in the east and southeast of Iran. The implementation of this model for an operational period showed that although the model can forecast the spatial variation of rainfall over Iran up to a three-month lead time, probabilistic forecasting cannot significantly reduce the uncertainty of the model in a seasonal time scale. The ensemble model tends to overestimate precipitation in the third lead time.
Keywords: probabilistic forecasting, Ensemble model, Seasonal precipitation, statistical metrics, Iran -
مدل سازی پراکنش گونه ابزار مهم و ضروری برای مدیریت و حفاظت از شوکا به عنوان یک گونه مخفی کار و گیاه خوار حفاظت شده ملی در ایران است. در این پژوهش با استفاده از بسته Biomod2 و روش مدل سازی تجمعی و تعداد 91 داده حضور گونه شوکا و عوامل محیطی و انسانی، مدل تجمعی مطلوبیت زیستگاه براساس شش الگوریتم مدل توزیع گونه در منطقه مورد مطالعه با وسعت 74000 کیلومتر مربع تهیه شد. در این مطالعه AUC مدل تجمعی معادل 0/97 بود که نشان دهنده عملکرد عالی مدل است. نتایج این مطالعه 15 درصد از منطقه مطالعاتی را دارای مطلوبیت کافی برای گونه شوکا شناسایی کرد. هم چنین نتایج نشان داد که متغیرهای کاربری سرزمین (29%) و ارتفاع (29%) بیش ترین تاثیر و پس از این متغیرها دمای حداکثر در گرم ترین ما ه (17%) و شیب (11%) اهمیت بالایی بر حضور این گونه دارد. متغیرهای انسانی نتوانستند در مدل سازی تاثیر بالایی بر پراکنش گونه از خود نشان دهند. شوکا مناطق جنگلی متراکم را به علت کاهش قابلیت مشاهده شدن و هم چنین وجود پناه و غذای کافی، ترجیح می دهد.کلید واژگان: شوکا, مطلوبیت زیستگاه, مدل تجمعی, ایران, مدل سازی پراکنش گونهSpecies distribution model is important to protect and to manage the roe deer as an elusive and national protected herbivore species in Iran. In this study habitat modeling was carried out via Biomod2 package in R software environment using 91 presence points of the spices as well as environmental and human factors. Ensemble model of habitat suitability was prepared based on six species distribution model algorithms for a study area of 74000 km2. AUC for ensemble model was 0.97 which showed an excellent performance. Suitable habitat for roe deer covered an area about 15 percent of the studied area. Also, the results showed that altitude (29%) and land-use (29%) then, maximum temperature in the warmest month and slope variables were the most influential factors on species distribution. Also, the results indicate that anthropogenic factors were not much effective on the species presence. Roe deer prefers the denser forests since this habitat can reduce its visibility and provide sufficient cover and food for the species.Keywords: Roe deer, Habitat modelling, Ensemble model, Iran, Species distribution model
-
پژوهش پیش رو به بررسی قابلیت روش نسبت فراوانی و ترکیبی از این روش با انتروپی شانون در تهیه نقشه حساسیت آتش سوزی در استان چهارمحال و بختیاری می پردازد. در ابتدا مناطق آتش سوزی گذشته در این استان بر مبنای اطلاعات موجود و عملیات میدانی شناسایی شدند. از 132 آتش سوزی شناسایی شده، به طور تصادفی 92 مورد (70%) برای فرآیند مدل سازی و 40 مورد (30%) باقیمانده برای اعتبارسنجی درنظر گرفته شد. بر اساس اطلاعات موجود در منطقه مورد مطالعه، 13 عامل مرتبط با خصوصیات توپوگرافی، اقلیمی و انسانی به عنوان عامل های موثر بر وقوع آتش سوزی درنظر گرفته شد. با استفاده از مدل نسبت فراوانی و مدل ترکیبی ارتباط بین نقاط آتش سوزی و عامل های موثر بررسی شد. نتایج مدل ها مبنای ساخت نقشه های پتانسیل خطر آتش سوزی قرار گرفت. نتایج ارزیابی که با استفاده از روش مشخصه عملکرد سیستم (ROC) و سطح زیر منحنی (AUC) انجام شد، نشان داد که مدل ترکیبی با قابلیت محاسبه میزان اهمیت عامل ها و همچنین هر یک از طبقات آنها، کارایی بهتری در تهیه نقشه پتانسیل خطر آتش سوزی دارد. نرخ موفقیت و پیش بینی برای مدل نسبت فراوانی و مدل ترکیبی به ترتیب 79/02 و 75/72 درصد و 85/16 و 82/91 درصد محاسبه شد. بر اساس نتایج، بیشتر از یک سوم مساحت استان چهارمحال و بختیاری در طبقات خطر زیاد تا خیلی زیاد آتش سوزی قرار می گیرند که در این میان، عامل های کاربری اراضی، نوع خاک و فاصله از جاده دارای بیشترین اهمیت هستند.کلید واژگان: جنگل های زاگرس, چهارمحال و بختیاری, سیستم اطلاعات جغرافیایی, مدل سازیThis study investigates the capability of frequency ratio and an ensemble method of frequency ratio with Shannons entropy to produce a reliable map of wildfire susceptibility for Chaharmahal and Bakhtiari province, Iran. At first, the fire locations were identified in the study area from historical archives and field surveys. Ninety two cases (70%) out of 132 detected fire locations were randomly selected for modeling, and the remaining 40 (30 %) cases were used for the validation. Thirteen fire conditioning factors representing topography, climate, and human activities of the study area were extracted from the spatial database. Using the frequency ratio and the ensemble model, the relationship between the conditioning factors and fire locations were explored. The results were then used to produce distribution maps of wildfire hazard. The verification analysis using Receiver Operating Characteristic (ROC) curves and the Areas Under the Curve (AUC) revealed that the ensemble model with the capability of computing the weights of factors and their categories is more efficient than frequency ratio. The success and prediction rates for the frequency ratio and ensemble model were found to be 79.2 and 75.72%, and 85.16 and 82.92%, respectively. Further, the results suggest that more than one-third of the study area falls into the high and very high hazard classes, and the conditioning factors of land use, soil types, and distance from roads play major roles in fire occurrence and distribution in the study area.Keywords: Chaharmahal, Bakhtiari, GIS, Modeling, Zagros forests
-
کرکس مصری، به عنوان یک گونه در خطر انقراض، به طور گسترده تحت تاثیر تعارض با انسان قرار دارد و جمعیت آن در حال کاهش است. توانایی دست یابی به منابع تغذیه ای از مهم ترین عوامل موثر بر پراکنش این گونه به شمار می رود. در این پژوهش، مطلوبیت زیستگاه های تغذیه ای کرکس مصری در استان کرمانشاه با استفاده از رویکرد مدل سازی تلفیقی حاصل از هفت مدل بررسی شد. حدود 4/19 درصد (1021/40 کیلومتر مربع) از گستره این استان به عنوان زیستگاه های تغذیه ای مطلوب کرکس مصری شناسایی شد. حدود 31/92 درصد (326 کیلومتر مربع) از گستره زیستگاه های تغذیه ای مطلوب توسط شبکه حفاظتی پوشش داده شده است. تراکم دام (31/82 درصد)، فاصله از مناطق پراکنش سم داران وحشی (15/36 درصد)، فاصله از مکان های دفن زباله (14/77 درصد)، پوشش سرزمین (12/46 درصد) و ارتفاع (11/85 درصد) به عنوان مهم ترین متغیرهای موثر در تعیین مطلوبیت زیستگاه تغذیه ای کرکس مصری شناسایی شدند. به نظر می رسد کرکس های مصری به مناطق عشایرنشین و چادرنشین، فعالیت های دامداری و مکان های دفع زباله متکی اند، که مهم ترین دلیل آن را می توان تغذیه از لاشه های حیوانات اهلی دانست. بنابراین، درنظر گرفتن راهکارهای مناسب به منظور پایش و مدیریت فعالیت های انسانی در مناطق گفته شده در برنامه حفاظت کرکس مصری اهمیت ویژه ای دارد.
کلید واژگان: کرکس مصری, زیستگاه های تغذیه ای, مکان های دفع زباله, مناطق عشایرنشین, دامداریThe Egyptian vulture, Neophron percnopterus, as a globally endangered species, is significantly affected by conflicts with human, leading to the decline of this species population. Availability of food resources is known as one of the most important factors affecting the distribution of the Egyptian vulture. In this study, we employed an ensemble modelling approach to predict the suitability of the foraging habitat for the Egyptian vulture based on seven distribution modelling algorithms. According to our results, suitable foraging habitats for this bird accounted for about 4.19% (1021.40 km2) of the study area, of which only approximately 31.92% (326 km2) was covered by the conservation areas. Livestock density (31.82%), the presence of wild ungulates (15.36%), distance to dump sites (14.77%), landcover (12.46%) and elevation (11.85%) made the highest contribution to the ensemble model of this species. Our results indicated that Egyptian vultures mainly rely on dump sites, nomadic areas and livestock farming sites, thereby reflecting the vulture's tendency to livestock carcasses. Thus, it is important to develop effective strategies for proper monitoring and managing human activities in these areas.
Keywords: Egyptian vulture, Foraging habitats, Dump sites, Nomadic areas, Livestock farming -
مدل سازی گروهی به عنوان یک مقوله نوظهور در بسیاری از رشته های مهندسی به خصوص زمینه های مختلف مهندسی آب در حال گسترش است. تخمین دقیق نیاز آبی زعفران به عنوان محصول راهبردی شرق کشور یکی از مهم ترین اقدامات تاثیرگذار در برنامه ریزی منابع آب منطقه خواهد بود. از این رو، این پژوهش اقدام به بررسی عملکرد مدل سازی گروهی در بهبود مدل سازی نیاز آبی زعفران در منطقه بیرجند استان خراسان جنوبی کرد. داده های واقعی نیاز آبی زعفران در سال دوم کشت در گام نخست در محل آزمایشگاه لایسی متری دانشگاه بیرجند جمع آوری شد. مدل سازی نیاز آبی زعفران با استفاده از داده های اقلیمی و نیاز آبی زعفران در بستر ماشین یادگیری درخت تصمیم انجام شد. همچنین، از دو روش Boosting و Bagging جهت ارتقای نتایج مدل درخت تصمیم استفاده شد. به منظور کمی کردن اثر مدل سازی گروهی آزمون های مقایسه ای متعددی نظیر شاخص های ارزیابی (RMSE و MAE)، مقایسه توزیع پراکنش داده ها (تحلیل وایولین Violin assessment)، ارزیابی کم/بیش تخمینی، مقایسه سری زمانی و تحلیل بهبود خطا استفاده شد. نتایج نشان داد که علی رغم دقت و کارایی نسبی مدل درخت تصمیم در شبیه سازی نیاز آبی زعفران، امکان بهبود نتایج همچنان وجود دارد. همچنین، نتایج اثبات کرد که مدل سازی گروهی ظرفیت بالقوه ی خوبی در زمینه ارتقای نتایج دارد. به طوری که یادگیری گروهی بانظارت (Boosting) دقت مدل درخت تصمیم را بیش از 30 درصد بهبود بخشید (کاهش قدر مطلق خطا از 36 میلی متر به 65/23 میلی متر) و این موضوع عامل کاهش RMSE را از 44/0 میلی متر به 07/0 میلی متر شد. علاوه بر این، نتایج آزمون های مقایسه ای تایید کرد که خروجی تولید شده توسط روش Boosting از کیفیت بسیار بهتری نسبت به خروجی مدل درخت تصمیم و روش Bagging برخوردار است.کلید واژگان: بهبود خطا, تحلیل وایولین, لایسیمتر, یادگیری گروهی نظارتی, هوش مصنوعیEnsemble modelling is expanding in several areas of engineering, especially different aspects of water engineering. Accurate estimation of saffron water requirement (SWR), an essential strategic production of the agriculture sector, is a crucial and influencing act in local water planning of this region. Hence, this study aimed to check the applicability of ensemble modelling in enhancing SWR at Birjand, Southern Khorasan, Iran. The actual water requirement of saffron was recorded in the field lysimetric laboratory at the University of Birjand. The simulation of water requirement was conducted utilizing Decision Tree Regression (DTR) with input climate features. Additionally, Boosting and Bagging methods were employed to establish and enhance the ensemble process of soil water requirement (SWR) simulations. To track the effectiveness of any method, some comparative tests were designed, such as statistical criteria (RMSE and MAE) detection, Violin plot analysis, over/underestimation, times series comparison, and error improvement test. Results indicated that although the acceptable performance of DTR in simulating SWR, the probable improvement was potentially felt. Derived results confirmed that supervised ensemble modelling (Boosting) could enhance the accuracy of DTR by more than 30 percent (reducing absolute error from 36 mm to 23.65 mm), resulting in declining RMSE from 0.44 mm to 0.07 mm. Further, different experiment outcomes revealed that the Boosting algorithm quality is more appealing than DTR and Bagging outputs.Keywords: Artificial intelligence, Error improvement, Lysimetric lab, Supervised ensemble modelling, Violin plot analysis
-
The nature and importance of user’s comments in various social media systems play an important role in creating or changing people's perceptions of certain topics or popularizing them. It has now an important place in various fields, including education, sales, prediction, and so on. In this paper, Facebook social network has been considered as a case study. The purpose of this study is to predict the volume of Facebook users' comments on the published content called post. Therefore, the existing problem is classified as a regression problem. In the method presented in this paper, three regression models called elastic network, M5P model, and radial basis function regression model are combined and an ensemble model is made to predict the volume of comments. In order to combine these base models, a strategy called stack generalization is used, based on which the output of the base models is provided to a linear regression model as new features. This linear regression model combines the outputs of the 3 base models and determines the final output of the system. To evaluate the performance of the proposed model, a database of the UCI dataset, which has 5 training sets and 10 test sets, has been used. Each test set in this database has 100 records. In the present study, the efficiency of the base models and the proposed ensemble model is evaluated on all these sets. Finally, it is concluded that the use of the ensemble model can reduce the average correlation coefficient (as one of the evaluation criteria of the model) to 74.4 ± 16.4, which is an acceptable result.
Keywords: regression, Ensemble Model, Facebook, Comment Volume Prediction -
در دهه های اخیر قابلیت پیش بینی های هواشناسی به دلیل توسعه شهری و تغییر اقلیم به امری مهم در جوامع بشری تبدیل شده است. پیش بینی این متغیرها علاوه بر آگاهی دادن به بخش های گوناگون جامعه، نقش موثری را در تصمیم گیری و برنامه ریزی بهتر در زمینه های مختلف، نظیر مدیریت منابع آبی، ایفا می نمایند. امروزه در این حوزه، بکارگیری مدل های پیش بینی عددی وضع آب و هوا یکی از متداول ترین رویکردها به شمار می روند و تلاش های فراوانی برای توسعه مدل های جدید و بهبود نتایج پیش بینی های آن ها در سطح جوامع علمی جهان در جریان می باشد. در این تحقیق، برونداد هفت مدل پیش بینی از مجموعه مدل های همادی چندگانه آمریکای شمالی به منظور ارزیابی پیش بینی بارش حوضه سد کرخه در دوره 31 ساله (2015-1985) به کار گرفته شده است. بدین منظور پس از مقیاس کاهی برونداد مدل های پیش بینی در افق های زمانی 1 تا 3 ماهه با استفاده از روش رگرسیون خطی چندگانه (MLR) ، امکان بهبود آن ها با استفاده از رویکرد ترکیب مدل ها مورد بررسی قرار گرفته است. ارزیابی کارایی مدل ها با استفاده از شاخص های ضریب همبستگی پیرسون (ρ) و ریشه میانگین مربعات خطای نرمال شده (NRMSE) برای ارزیابی پیوسته و منحنی اطمینان پذیری برای ارزیابی احتمالاتی، انجام گردید. نتایج نشان می دهد که هیچ کدام از مدل ها به تنهایی در تمامی افق های زمانی مورد بررسی، عملکرد مطلوبی را نداشته اند و استفاده منفرد از آن ها عملکرد مناسبی را نشان نمی دهد؛ درحالی که مدل ترکیبی (MME) به طورکلی عملکرد مناسب تری را نشان می دهد. نتایج حاصل از این تحقیق، اهمیت استفاده از همادی مدل های چندگانه بر مبنای نتایج خروجی چندین مدل را جهت ارتقاء مهارت پیش بینی بارش نشان می دهد.
کلید واژگان: ارزیابی مهارت, مقیاس کاهی, اطمینان پذیری, مدل های همادی آمریکای شمالی, حوضه سد کرخهIn recent decades, the ability of meteorological forecasts due to urban development and climate change has become an important issue in human societies. Forecasting these variables in addition to informing different segments of society, plays an effective role in better decision making and planning in different areas, such as water resources management. Nowadays in this field, the use of numerical forecasting models is one of the most common approaches. In this study, the output of seven forecast models from the North American Multi Model Ensemble (NMME) project is used to evaluate the forecast of precipitation in Karkheh Dam basin during the 31 years period (1985-2015). For this purpose, the outputs of precipitation forecast models for 1-3 month lead times were downscaled using Multiple Linear Regression (MLR) method. Then the possibility of improving forecast skill of them has been evaluated using an ensemble model approach. The models were assessed using both continuous and probabilistic methods using Pearson correlation coefficient (ρ) and normalized root mean square error (NRMSE) and reliability diagram respectively. The results indicate that none of the forecast models performed well in all lead times alone and their individual use did not show good performance; while the Multi Model Ensemble (MME) generally shows better performance than the individual models. The results of this study, demonstrate the importance of using an ensemble model based on the outputs of several models for improving the long term precipitation forecast skill.
Keywords: skill assessment, Downscaling, Reliability, North American Multi Model Ensemble, Karkheh Dam Basin
-
از آنجا که گزینه «جستجوی دقیق» غیرفعال است همه کلمات به تنهایی جستجو و سپس با الگوهای استاندارد، رتبهای بر حسب کلمات مورد نظر شما به هر نتیجه اختصاص داده شدهاست.
- نتایج بر اساس میزان ارتباط مرتب شدهاند و انتظار میرود نتایج اولیه به موضوع مورد نظر شما بیشتر نزدیک باشند. تغییر ترتیب نمایش به تاریخ در جستجوی چندکلمه چندان کاربردی نیست!
- جستجوی عادی ابزار سادهای است تا با درج هر کلمه یا عبارت، مرتبط ترین مطلب به شما نمایش دادهشود. اگر هر شرطی برای جستجوی خود در نظر دارید لازم است از جستجوی پیشرفته استفاده کنید. برای نمونه اگر به دنبال نوشتههای نویسنده خاصی هستید، یا میخواهید کلمات فقط در عنوان مطلب جستجو شود یا دوره زمانی خاصی مدنظر شماست حتما از جستجوی پیشرفته استفاده کنید تا نتایج مطلوب را ببینید.
* ممکن است برخی از فیلترهای زیر دربردارنده هیچ نتیجهای نباشند.
-
معتبرحذف فیلتر