جستجوی مقالات مرتبط با کلیدواژه "پیش پردازش" در نشریات گروه "آب و خاک"
تکرار جستجوی کلیدواژه «پیش پردازش» در نشریات گروه «کشاورزی»-
پیش بینی بارش به دلیل استفاده در مطالعات سیلاب و منابع آب از اهمیت بسیار بالایی برخوردار است. مدل های عددی پیش بینی وضع هوا در سال های اخیر توسعه زیادی یافته است. امروزه مراکز هواشناسی مطرح دنیا از این مدل ها در پیش بینی های هواشناسی خود استفاده نموده اند، مرکز ECMWF یکی از این مراکز در پیش بینی های هواشناسی جهانی است. پژوهش حاضر باهدف ارزیابی عملکرد مرکز ECMWF جهت پیش بینی بارش در حوضه پلدختر به انجام رسیده است. مدل های پیش بینی عددی مستعد خطای سیستماتیک هستند؛ بنابراین بررسی تاثیر 7 روش تصحیح اریبی (Delta ،EQM ،EZ ، QM، LS، STB،TVSV) بر مدل پیش بینی بارش ECMWF، هدف دیگر این تحقیق بود. نتایج به دست آمده نشان داد مدل ECMWF در عمده نقاط حوضه پلدختر، RMSE پایینی داشت و از دقت قابل قبولی برخوردار بود. همچنین ارزیابی بارش تصحیح شده نشان داد که روش Delta در همه ایستگاه های باران سنجی موردبررسی، عملکرد مناسبی داشت. روش STB در دو ایستگاه، 90 درصد داده های بارش را تصحیح نمود. روش EZ و QM در 4 ایستگاه حدود 85 درصد پیش بینی ها را تصحیح نمودند. این دو روش عملکردی مشابه داشتند. روش های LS و EQM در هر 7 نقطه موردبررسی عملکرد ضعیفی داشتند و به عبارتی نتوانستند خطای اریبی پیش بینی ها را تصحیح نمایند. روش TVSV نیز عملکرد قابل قبولی نداشت. روش Delta در عمده نقاط RMSE بارش پیش بینی شده را بهبود بخشید و روش STB توانست کم برآوردی بارش پیش بینی شده را تصحیح نماید. نتایج این مطالعه نشان داد که ارتفاع در صحت بارش پیش بینی شده دخیل است چنانچه مدل پیش بینی در ارتفاع کم، کمترین RMSE و در ارتفاعات بالا، بیشترین مقدار این شاخص را داشت. روش های تصحیح اریبی مقادیر بارش پیش بینی شده را تا حد قابل قبولی بهبود بخشیدند و همین امر کارایی مدل پیش بینی بارش را در سامانه هشدار سیل افزایش می دهد.
کلید واژگان: پس پردازش, تصحیح اریبی دلتا, تصحیح اریبی منطقه ارتفاعی, تصحیح اریبی نگاشت چندک, مدل عددی هواشناسیIntroductionhuman intervention in nature and the land-use change of rivers and floodplains, and climate change, the risk of flood has increased in the world. Controlling and reducing the damages flood is done in two methods, structural and non-structural. Research conducted in different parts of the world shows that the use of non-structural methods such as flood forecasting and warning systems along with structural methods reduces flood damage. Flood forecasting and flood notification are logical tools to reduce flood risks in flood-prone areas. Precipitation forecasting is very important due to its use in flood and water resources studies. Numerical weather predictions have been extensively developed in recent years. Today, the world's leading meteorological centers have used these models in their meteorological forecasts. The ECMWF is one of the centers in global meteorological forecasts. The present study was conducted to evaluate the performance of the ECMWF center for precipitation forecasting in the Poldokhtar watershed. Numerical prediction models have systematic errors. Therefore, the purpose of this study was to investigate the effect of 7 bias correction methods (Delta, EQM, EZ, QM, LS, STB, TVSV) on the ECMWF rainfall forecasting model.
MethodsThe studied area is the Poldokhtar watershed from the subbasins of the Karkheh basin. This watershed is located in Lorestan province. The information from 7 rain gauges station was used in this research. In this study, the comparison of ECMWF center forecasted rainfall with rain gauge station data was made point by point. 7 rain gauge stations in the Poldokhtar watershed were selected for point evaluation. The distance of these stations from the center of gravity of the network points was less than 10 km. The period used in this study is from 2016 to 2020. In the first step, the predicted rainfall was downloaded from the TIGGE database website. The data of this database is in GRIB2 format, which was extracted with QGIS software in Excel format. In the next step, predictions were evaluated before bias correction. Then due to the bias in the predictions, corrections were made with 7 bias correction methods. Finally, the bias correction forecast was evaluated. Bias correction methods that were used in this study include the Delta method, Elevation Zone (EZ), Quantile Mapping based on Empirical Distribution (EQM), Quantile Mapping (QM), Linear Scaling (LS), Spatio-Temporal Bias correction (STB), and the TVSV method. In this study, the daily precipitation forecast of the ECMWF center was used. In the used methods, 70% of the data were considered for the control period and 30% of the data for the prediction period. In the Delta method, the changes between the average observations and the simulation are added to the daily observed precipitation. In the LS method, the correction of daily values is based on the difference between the observed control period and the uncorrected data. The elevation zone (EZ) bias correction method, corrects the forecasted precipitation at the high altitude. The EQM method is a statistical-empirical base-quantile method, which is based on the experimental transformation and bias correction of the simulated precipitation by the regional climate model. The QM method removes biases by using cumulative distribution functions (CDF) for observed and predicted values at any time scale. In the STB method, the predicted daily precipitation is calculated for the relevant time window, and the values of the ground stations and the corrected prediction values are replaced and calculated bias. The TVSV method is based on the 7-day time window. In this study, two types of statistical indicators continuous and classified were used to evaluate the numerical model of precipitation forecasting. The continuous index includes RMSE, ME, and MAE and the classified indicators include POD, FAR, and BIAS.
ResultsThe results showed that the ECMWF model had a low RMSE in most parts of the Poldakhtar watershed and had acceptable accuracy. Also, the corrected precipitation evaluation showed that the Delta method had a good performance in all the rain gauge stations under study. The STB method in two stations corrected 90% of the precipitation data. The EZ and QM methods in about 4 stations corrected about 85% of the predictions. These two methods had similar performance. LS and EQM methods had poor performance in all 7 points studied. In other words, they could not correct the bias of the predictions. The TVSV method also did not have acceptable performance. The Delta method improved the predicted precipitation in most parts of the RMSE and the STB method was able to correct the low estimate of the predicted precipitation. The results of this study showed that altitude is involved in the accuracy of predicted precipitation. If the low altitude forecast model had the lowest RMSE and at high altitudes, the highest value of this index. Biased correction methods improved the predicted precipitation values to an acceptable level, which increases the application of the predicted precipitation model in the flood warning system. According to the ME index, the underestimation is higher in the upper elevations of the basin. The main reason for this difference can be not correct the effect of altitude on the value of precipitation. At the ECMWF center, no significant change was observed in the POD index after bias correction. The small change in the POD index at the ECMWF center can be due to the good performance and structure of the numerical model at this center. The POD index at high altitudes performed better than this index at low altitudes. The bias correction methods improved the predicted precipitation values to an acceptable level, therefore increasing the effectiveness of the precipitation forecasting model in the flood warning system.
Keywords: Delta bias correction, Elevation Zone bias correction, Numerical weather predictions, post-processing, Quantile Mapping bias correction -
پیش بینی دبی رسوبی با دقت بالاتر، از مهم ترین مولفه های فرآیندهای هیدرولوژیکی در مدیریت منابع آب می باشد. به دلیل پیچیدگی پدیده انتقال رسوب و وجود چندین پارامتر موثر در تخمین آن، تعیین روابط حاکم مشکل می باشد. این تحقیق به منظور ارایه مدل بهینه برآورد بار رسوب معلق در دو ایستگاه هیدرومتری متوالی یک رودخانه طبیعی انجام گرفته است. در این راستا، جهت کاهش مقدار خطا در پیش بینی دبی رسوبی از روش های پیش پردازش سری زمانی به همراه روش های هوشمند مبتنی بر کرنل ماشین بردار پشتیبان (SVM) و رگرسیون فرآیند گاوسی (GPR) استفاده شده است. دو سناریو بررسی دبی رسوب معلق برای حالت تک ایستگاهی و ارتباط بین ایستگاهی در نظر رفته شد و مدل های متفاوتی بر اساس مشخصات هیدرولیکی و ذرات رسوبی تعریف گردید و مورد ارزیابی قرار گرفت. در استفاده از روش های پیش پردازش، ابتدا روش تبدیل موجک (WT) به کار رفت، سپس زیر سری های با فرکانس بالای بدست آمده از روش WT با روش تجزیه مد تجربی (EMD) دوباره تجزیه گردیدند. در نهایت زیر سری های تاثیرگذار به عنوان ورودی مدل های مبتنی بر کرنل استفاده شدند. نتایج حاصل از تحلیل مدل های تعریف شده، دقت بالای روش های تلفیقی به کار رفته در تحقیق را در تخمین رسوب معلق به خوبی نشان داد. نتایج نشان داد که در حالت اول، مقدار معیار خطا برای مدل برتر به ترتیب از 0.035 و 0.037 برای روش های GPR و SVM به 0.28 و 0.29 برای مدل های تلفیقی کاهش یافت. به طور کلی، مدل های ترکیبی دقت مدل سازی را بین 20 تا 25 درصد افزایش دادند. جهت ارزیابی قابلیت اطمینان مدل برتر، از تحلیل عدم قطعیت مونت کارلو استفاده شد و نتایج نشان داد که مدل GPR دارای درجه عدم اطمینان مطلوبی در مدل سازی است.
کلید واژگان: پیش پردازش, تجزیه مد تجربی, رگرسیون فرآیند گاوسی, رسوب معلقIntroductionSediment transportation and accurate estimation of its rate is a significant issue for river engineers and researchers. So far, various and complex relationships have been proposed to predict the amount of suspended sediment transport rate, such as velocity and critical shear stress based equations. However, the complex nature of sediment transport and lack of validated models make it difficult to model the suspended sediment concentration and suspended sediment discharge carried by rivers. Although the developed models led to promising results in sediment transport prediction, due to the importance of sediment transport and its impact on hydraulic structures it is necessary to use other methods with higher efficiency. On the other hand, in recent years, the Meta model approaches have been applied in investigating the hydraulic and hydrologic complex phenomena. Hybrid models involving signal decomposition have also been shown to be effective in improving the prediction accuracy of time series prediction methods, as indicated in. Complementary Ensemble Empirical Mode Decomposition analysis is one of the widely used signal decomposition methods for hydrological time series prediction. Decomposition of time series reduces the difficulty of forecasting, thereby improving forecasting accuracy.In this study, due to the complexity of the sediment and erosion phenomenon and the effect of different parameters in estimating, time series pre-processing methods along with support vector machine (SVM) and Gaussian process regression (GPR) kernel based approaches were used to estimate suspended sediment load of a natural river at two consecutive hydrometric stations. For this purpose, different models were defined based on hydraulic and sediment particles characteristics. Moreover, the capability of integrated pre-processing and post-processing methods in two states of inter-station and between-stations was investigated. First, the Wavelet Transform (WT) method was used for data pre-processing then, the high-frequency sub-series were selected and re-decomposed using the Empirical Mode Decomposition (EMD). Finally, the most effective sub-series were imposed as inputs for kernel-based models. In addition, to assess the reliability of the superior model, Monte Carlo uncertainty analysis was used.The results showed that the GPR model had a desirable degree of uncertainty in modeling.
Materials and MethodsIn this study, data of two stations of Housatonic River was used. The distance between stations was approximately 50 km. The first station is located near Great Brighton, Massachusetts, and the second station is in Connecticut. The basin area for the stations is 282 and 634 square miles, respectively. The flow path is from the first station to the second station. SVM and GPR models are based on the assumption that adjacent observations should convey information about each other. Gaussian processes are a way of specifying a prior directly over function space. This is a natural generalization of the Gaussian distribution whose mean and covariance are a vector and matrix, respectively. Due to prior knowledge about the data and functional dependencies, no validation process is required for generalization, and GP regression models are able to understand the predictive distribution corresponding to the test input. Wavelet Transform (WT) uses a flexible window function (mother wavelet) in signal processing. The flexible window function can be changed over time according to the signal shape and compactness. After using WT, the signal will decompose into two approximations (large-scale or low-frequency component) and detailed (small-scale component) components. EEMD was proposed to solve the mode mixing issue of empirical mode decomposition (EMD) which specifies the true IMF as the mean of an ensemble of trials. Each trial consists of the decomposition results of the signal plus a white noise of finite amplitude. EMD can be used to decompose any complex signal into finite intrinsic mode functions and a residue, resulting in subtasks with simpler frequency components and stronger correlations that are easier to analyze and forecast. Another important feature of empirical model of decomposition is that it can be used for noise reduction of noisy time series, which can be effective in improving the accuracy of model predictions. In the uncertainty analysis method, two elements are used to test the robustness and to analyze the models uncertainty. The first one is the percentage of the studied outputs which are in the range of 95PPU and the next one is the average distance between the upper (XU) and lower (XL) uncertainty bands. In this regard, the considered model should be run many times (1000 times in this study), and the empirical cumulative distribution probability of the models be calculated. The upper and lower bands are considered 2.5% and 97.5% probabilities of the cumulative distribution, respectively.
Results and DiscussionIn order to evaluate and review the performance of the tested models and determine the accuracy of the selected models, three performance criteria named Correlation Coefficient (CC), Determination Coefficient (DC), and Root Mean Square Errors (RSME) were used. The obtained results indicated that the accuracy of the applied integrated models was higher than the single SVM and GPR models. The use of integrated methods decreased the error criteria between 20 to 25 %. The obtained results for the uncertainty analysis showed that in suspended sediment load modeling the observed and predicted values were within the 95 PPU band in most of the cases. Moreover, it was found that the amount of d-Factors for train and test datasets were smaller than the standard deviation of the observed data. Therefore, based on the results, it could be induced that the suspended sediment modeling via integrated WT-EEMD-GPR model led to an allowable degree of uncertainty.
ConclusionComparison of the developed models’ accuracy revealed that integrated GPR and SVM models had higher performance compared with single GPR and SVM models in predicting the suspended sediment discharge. The use of these two methods approximately decreased the error criteria between 20 to 25 %. According to the results, for the models that were developed based on the station data, the model with the input parameters of Dwt, Dwt-1, and Dst-1 and in the case of investigating the relationship between the stations, the model with the input parameters of Dst-2, Dwt-1, and Dst-1 were superior models. Also, based on the uncertainty analysis, the integrated GPR model had an allowable degree of uncertainty in suspended sediment modeling. However, it should be noted that the used methods are data sensitive models. Therefore, further studies using data ranges out of this study and field data should be carried out to determine the merits of the models to estimate suspended sediment load in the real conditions of flow.
Keywords: Experimental mode decomposition, Gaussian process regression, Pre-processing, Suspended sediment -
سری زمانی هیدرولوژیک عاملی وابسته به زمان است که یافتن نحوه تغییرات و پیش بینی آن مهم ترین هدف تجزیه و تحلیل سری های زمانی می باشد. هدف این تحقیق بررسی همزمان خصوصیات سری زمانی و پیش پردازش آنها و پارامترهای مهم مدل برنامه ریزی بیان ژن جهت پیش-بینی های با دقت بالا در مراحل آموزش و صحت سنجی می باشد. در این پژوهش از سری های زمانی عمق آب زیرزمینی ایستگاه دشت چمچمال واقع در استان کرمانشاه با دوره زمانی 12ساله و اقلیم کوهستانی و سری زمانی ماهانه دمای آلاسکا با دوره زمانی 50ساله و اقلیم سرد و خشک استفاده شده است. برای مدل سازی سری های زمانی مذکور از نرم افزارGenexprotools5.0 استفاده شده است. نتایج این تحقیق، نشان داد تناوبی بودن خصوصیات داده موجود در سری زمانی دما، سبب بروز نتایج همبستگی بالای 90% در مراحل مختلف آموزش و صحت سنجی گردید به طوریکه اثر پارامترهای مختلف بیان ژن کمتر از 10درصد در بهبود نتایج می باشد. از سوی دیگر با بررسی سری-زمانی عمق آب زیرزمینی که فاقد خصوصیت تناوبی و دارای شکلACF نزولی است، نتایج پیش بینی مدل GEP با هر پارامتر تاثیرگذار بیان ژن،R بیش از 44% در مرحله صحت سنجی حاصل نشد. این بدان معنی است که پیش پردازش سری زمانی اثرگذاری بیشتری در نتایج پیش-بینی دارد. به طوریکه با حذف ترم تناوب نتایج پیش بینی در همه مراحل مدل سازی به طرز معنی داری کاهش می یابد. در این حالت بهترین R برای قسمت صحت سنجی50 درصد می باشد.کلید واژگان: بیان ژن, پیش بینی, پیش پردازش, تناوب, سری زمانیHydrological time-series is a time-dependent hydrological variable that finding the model of changes and predicting is the most important goal of time-series analysis. The purpose of this study is to simultaneously study the characteristics of time series and their prediction and the important parameters of the GEP for high-precision predictions in the training and validation. In this study, groundwater depth time-series of Chamchamal plain station located in Kermanshah province with a 12-year period and mountainous climate and the monthly time-series of Alaska temperature with a 50-year period and cold and dry climate have been used. Genexprotools5.0 software has been used to model time-series by GEP.The results of studying with GEP showed that the periodicity of data properties that existed in the time series of temperature caused correlation results above 90% in different stages of training and validation. So that the effect of different parameters of GEP is less than 10% in improving results. On the other hand, by examining the time-series of groundwater depth, which lacks periodicity and has a descending ACF shape, the prediction results of the GEP with any effective expression parameter, R more than 44% in the validation wasn't obtained. This means that the time-series preprocessing has a greater impact on the prediction results. So that by eliminating the semester, the prediction results in all stages of modeling are significantly reduced. In this case, the best R for the validation is 50%.Keywords: time series, Gene expression, Forecasting, Periodicity, preprocessing
-
برای مدیریت پایداری اراضی، اطلاع از فعالیت ها و خصوصیات خاک و تغییرات زمانی و مکانی آنها ضروری است. طیف سنجی امواج مریی و مادون قرمز نزدیک به دلیل دقت و سرعت عمل بالا قابلیت ویژه ای در شناسایی و تعیین خصوصیات خاک دارد. هدف این مطالعه ارزیابی دقت روش طیف سنجی مریی-مادون قرمز نزدیک در برآورد مقدار کربن آلی (OC) و کل مواد خنثی شونده خاک (TNV) خاک است. به این منظور تعداد 110 نمونه خاک از استان های خوزستان، یزد و تهران تهیه و در آزمایشگاه طیف سنجی گردید. طیف به دست آمده از دستگاه طیف سنج با 5 روش پیش پردازش فیلتر ساویتزکی گولای (SG)، مشتق اول همراه با ساویتزکی گولای (FD-SG)، مشتق دوم همراه با ساویتزکی گولای (SD-SG)، واریانس استاندارد نرمال (SNV)، تصحیح پخشیده چندگانه (MSC) اصلاح شد. همچنین عملکرد دو روش PLSR و SVMR در برآورد ویژگی های خاک مقایسه گردید. نتایج نشان دادند که مدل PLSR نسبت به مدل SVMR در برآورد OC و TNV دقت بالاتری دارد. دربرآود OC، مدل PLSR و روش پیش پردازش MSC (47/1= RPDVAL و 19/0 = RMSEVAL ،59/0 =VAL R2) بهترین عملکرد و روش پیش پردازش SD-SG، ضعیف ترین عملکرد (52/0= RPDVAL و 27/0 = RMSEVAL ،15/0 =VAL R2) را نشان داد. همچنین برای TNV روش پیش پردازش (FD-SG) بهترین عملکرد (01/2= RPDVAL و 70/5 = RMSEVAL ،78/0 =VAL R2) و روش پیش پردازش (SD-SG) ضعیف ترین عملکرد (31/0= RPDVAL و 13/11 = RMSEVAL ،1/0 =VAL R2) را نشان داده است. طول موج کلیدی برای OC در محدوده 421 و 612 نانومتر و برای TNV در محدوده 2315 و 2151 نانومتر مشاهده گردید. این مطالعه نشان داد که روش طیف سنجی Vis-NIR به علت دارا بودن اساس فیزیکی و در نظر گرفتن فاکتورهای تاثیرگذار، به عنوان یک مدل بزرگ مقیاس، قابلیت مناسبی برای ارزیابی و پیش بینی OC و TNV خاک دارد.
کلید واژگان: طیف سنجی, رگرسیون, پیش پردازش, کربن آلی, کل مواد خنثی شوندهFor sustainable land management, it is necessary to understand the functions and characteristics of soils, and their spatial and temporal changes. Visible and near-infrared spectroscopy has a specific capability to identify and determine soil properties due to high accuracy and high-performance speed. The purpose of this study is to evaluate the accuracy of visible and near-infrared spectroscopy method in estimating soil organic matter and total neutralizing value. Therefore, 110 soil samples were collected from Khuzestan, Yazd and Tehran provinces, and spectral reflectance was performed using ASD FieldSpec3. The spectra obtained from the spectrometer were pre-processed using five methods including Savitzky-Golay filter (SG), the first derivative with the Savitzky-Golay filter (FD-SG), the second derivative with the Savitzky-Golay filter (SD-SG), the standard normal variate (SNV), and Multiplicative scatter correction (MSC). Also, the performance of PLSR and SVMR methods was compared in terms of soil organic carbon and total neutralizing value estimation. The results indicated that the PLSR model in estimating both organic carbon properties and total neutralizing value had higher accuracy compared to the SVR model. In estimation of soil organic carbon, PLSR method and MSC preprocessing method had the best performance (R2VAL=0.59, RMSEVAL=0.19 and PRDVAL=1.47) and the second derivative method had the least performance (R2VAL=0.15, RMSEVAL=0.27 and PRDVAL=0.52). Also for estimation of total neutralizing value, the first derivative preprocessing method had the best performance (R2VAL=0.78, RMSEVAL=5.70 and PRDVAL=2.01) and the second derivative method had the least performance (R2VAL=0.1, RMSEVAL=11.13, and PRDVAL=0.31). The key wavelengths were observed for soil organic matter in the range of 421- 612 nm and for total neutralizing value in the range of 2315- 2151 nm. This study showed that the Vis-NIR spectroscopy method, due to its physical basis and considering the influencing factors, as a large-scale model, makes it possible to evaluate and predict soil OC and TNV.
Keywords: Organic carbon, Preprocessing, Regression, Spectroscopy, Total neutralizing value -
سرعت آستانه فرسایش یک عامل مهم در ارزیابی فرسایش پذیری خاک یک منطقه به شمار می رود که اندازه گیری آن زمان بر و پرهزینه است. استفاده از طیف بازتابی خاک در برآورد سرعت آستانه فرسایش، سبب کاهش هزینه و افزایش سرعت عمل می شود. هدف از این پژوهش مقایسه کارایی و دقت مدل های رگرسیونی حداقل مربعات جزیی (PLSR)، ماشین بردار پشتیبان (SVR) و شبکه عصبی (ANN) در برآورد سرعت آستانه فرسایش در مناطق مستعد تولید گرد و غبار استان خوزستان است. برای این منظور ابتدا تعداد 91 نمونه خاک از قسمت های مرکزی و جنوبی مناطق مستعد تولید ریزگرد استان جمع آوری شد و سرعت آستانه فرسایش با استفاده از تونل باد تعیین گردید. در ادامه طیف بازتابی نمونه های خاک با دستگاه طیف سنج به دست آمد. روش های پیش پردازش بر روی طیف اصلی اجرا شد و مدل سازی با استفاده از سه مدل PLSR، SVR و ANN انجام گرفت. نتایج نشان داد که میانگین سرعت آستانه فرسایش در منطقه 7/9 متر بر ثانیه و حداقل آن 25/5 متر بر ثانیه به دست آمد، همچنین سرعت آستانه همبستگی معنی داری با سدیم محلول(58/0- =r) و نسبت جذب سدیمی (48/0- =r) در سطح احتمال 5 درصد نشان داد. مدل ANN در پیش پردازش مشتق دوم بهترین دقت برآورد (52/2= PRD) و مدل SVR در طیف اصلی (56/0= PRD) کمترین دقت برآورد را داشت. در پایان طول موج کلیدی سرعت آستانه فرسایش منطقه در محدوده های 1850 و 1930 نانومتر به دست آمد.با توجه به همبستگی بین بازتاب خاک با سرعت آستانه فرسایش (76/0=r)، از این روش می توان برای ارزیابی فرسایش پذیری مناطق مستعد تولید ریزگرد استفاده کرد.
کلید واژگان: فرسایش پذیری, طول موج کلیدی, پیش پردازش, ماشین بردار پشتیبانThreshold friction speed is an important factor for assessing the soil erodibility, but its measurement is time consuming and costly. Estimating threshold friction velocity by use of soil reflectance increases operating speed and reduces cost. The aim of this study was to compare the efficiency and accuracy of partial least squares regression (PLSR), support vector regression (SVR) and artificial neural network (ANN) regression models in estimating the threshold friction velocity in dust-prone areas of Khuzestan Province. For this purpose, 91 soil samples were collected from the central and southern parts of dust-prone areas of the province and the threshold friction velocity was determined using wind tunnels. Then, the reflectance spectra of soil samples were obtained with a spectrometer. Pre-processing methods were performed on the main spectrum and modeling was performed using, PLSR, SVR and ANN models. The results showed that the threshold friction velocity in the region was 9.7 m/s and the minimum was 5.25 m/s. Also, the threshold friction velocity was significantly (p<0.05) correlated with dissolved sodium (r= -0.58) and sodium adsorption ratio (R= -0.48). The ANN model had the best estimation accuracy in the second derivative preprocessing (PRD = 2.52) and the SVR model had the lowest estimation accuracy in the main spectrum (PRD = 0.56). Finally, the key wavelength of the threshold friction velocity was in the range of 1850 and 1930 nm. Because of the soil reflectance correlation with threshold friction velocity (r=0.76), the spectroscopy method can be used to assess the soil erodibility in areas prone to dust production.
Keywords: Erodibility, Key Wavelength, preprocessing, Support Vector Machine -
پیش بینی دبی رودخانه ها یکی از موارد مهم در برنامه ریزی و مدیریت منابع آبی می باشد. در این تحقیق از روش های پیش پردازش و پس پردازش سری زمانی به همراه روش های مبتنی بر کرنل ماشین بردار پشتیبان (SVM)و رگرسیون فرآیند گاوسی (GPR) جهت تخمین دبی جریان یدو رودخانه طبیعی در ایالات متحده با دو ایستگاه هیدرومتری متوالی استفاده شده است. رودخانه اول شامل تقریبا 2 سال داده بوده و در رودخانه دوم از 4 سال داده روزانه دبی استفاده شده است. مدل های متفاوتی بر اساس مشخصات هیدرولیکی جریان تعریف گردید و کارایی روش های تلفیقی پیش پردازش و پس پردازش در دو حالت درون ایستگاهی و بین ایستگاهی بررسی شد. جهت پیش پردازش داده ها ابتدا از روش تبدیل موجک گسسته (DWT) استفاده شد. سپس زیر سری های با فرکانس بالا انتخاب شده و با روش تجزیه مد تجربی یکپارچه (EEMD) دوباره تجزیه گردیدند. در نهایت زیر سری های با انرژی بالا به عنوان ورودی مدل های مبتنی بر کرنل استفاده شدند. برای پس پردازش داده ها نیز از مدل میانگین عصبی غیرخطی (NNA) استفاده شد. نتایج حاصل از تحلیل مدل های تعریف شده، دقت بالای روش های تلفیقی به کار رفته در تحقیق را در تخمین دبی جریان به خوبی نشان داد. بطوریکه در هر دو ایستگاه ، درصد خطا با استفاده از روش های تلفیقی پیش پردازش و پس پردازش نسبت به روش های هوشمند مبتنی بر کرنل تقریبا به میزان 20 تا 25 درصد کاهش یافت. مشاهده شد که در حالت بررسی دبی رودخانه بر اساس داده های خود ایستگاه مقدار خطای RMSE مدل تقریبا از 3/0 به 26/0 و در حالت استفاده از داده های ایستگاه قبلی از مقدار 44/0 به 33/0 کاهش یافت. با توجه به قابلیت و دقت بالای روش های پیش پردازش استفاده شده در این تحقیق، مطالعات مشابه در دیگر رودخانه های کشور توصیه می گردد.
کلید واژگان: پس پردازش, تجزیه مد تجربی یکپارچه, دبی رودخانه, موجکForecasting of river discharge is a important aspect of efficient water resources planning and management. In this study, time series pre and post-processing methods along with support vector machine (SVM) and Gaussian process regression (GPR) kernel based approaches were used to estimate flow discharge of two natural river in the United States with two consecutive hydrometric stations. The first river contained about 2 years of data and in the second river 4 years of daily discharge data was used. Different models were defined based on hydraulic characteristics and the capability of integrated pre and post-processing methods in two states of inter-station and between-stations was investigated. For data pre-processing, the Discrete Wavelet Transform (DWT) method was first used. Then, the high-frequency sub-series were selected and re-decomposed using the Ensemble Empirical Mode Decomposition (EEMD). Finally, sub-series with higher energy were imposed as inputs for kernel-based models. Non-linear neural average (NNA) model was also used for data post-processing. The obtained results from the defined models showed the high accuracy of the integrated methods used in the research in estimating flow discharge. At both stations, the error percentage was reduced by approximately 20 to 25% using the integrated pre-post-processing methods compared to the intelligent kernel based models. It was observed that in the case of river flow prediction based on the station's own data, the RMSE error value of the model decreased from approximately 0.3 to 0.26 and in the case of using the previous station data decreased from 0.44 to 0.33. Due to the high capability and accuracy of the pre-processing methods used in this study, similar studies are recommended in other rivers of the country.
Keywords: Experimental mode decomposition, Flow discharge, Post-processing, Wavelet -
پیش بینی جریان رودخانه برای برنامه ریزی و مدیریت سیستمهای منابع آب بسیار حایز اهمیت بوده و میزان دقت انجام این فرآیند در درستی پیاده سازی اهداف برنامه ریزی شده نقشی بنیادین دارد. از طرفی، محاسبات نرم قابلیت بالایی در مدلسازی فرآیند های هیدرولوژیک دارد. ازینرو، در این پژوهش، مدل ترکیبی موجک-برنامه ریزی بیان ژن در مقایسه با رویکرد منفرد آن توسعه داده شده، تا جریان روزانه رودخانه خشکرود واقع در استان گیلان، را پیش بینی کند. بدین منظور، علاوه بر فرآیند پیش پردازش داده های هیدرومتری، تاثیر پارامترهای هواشناسی در عملکرد و کارایی مدل نیز بررسی شده است. همچنین، پیش پردازش با ویژگی های مختلف و پیش بینی برای چهار زمان یک، دو، سه و شش روز انجام شد. برای ارزیابی عملکرد مدلها از شاخصهای آماری ضریب همبستگی (R)، شاخص توافق (Ia)، ضریب ناش-ساتکلیف (NSE)، خطای مطلق میانگین (MAE)، جذر متوسط مربعات خطا (RMSE) و معیار جریان حدی (PFC) استفاده شد. نتایج نشان میدهد که استفاده از موجک برای پیش پردازش داده ها موجب ارتقای قابل ملاحظه کارایی مدل ترکیبی در مقایسه با مدل منفرد شده است، به گونه ایکه ضریب همبستگی داده های ارزیابی برای زمان پیش بینی سه روز از 0/27 به 0/80 افزایش و همزمان خطای مطلق میانگین از 1/4 به 0/80 مترمکعب در ثانیه کاهش یافته است. از طرف دیگر، پارامترهای هواشناسی موجب شدند که مقادیر حدی در سری زمانی داده های دبی رودخانه بخوبی پیش بینی شده و کارایی مدل در پیش بینی مقادیر مذکور به مقدار قابل ملاحظه ای ارتقا یابد. نتایج حاصل از این مطالعه بیانگر آن است که رویکرد ترکیبی موجک- برنامه ریزی بیان ژن در ترکیب با پارامترهای هواشناسی، میتواند با کارایی بالایی در پیش بینی جریان بکار رود.
کلید واژگان: پیش پردازش, دبی روزانه, رودخانه خشکرود, سری زمانیForecasting stream flow is very important for planning and managing water resources systems and its precision has a significant role in accurately implementing the planned objectives. Besides, soft computing has a significant ability in modelling hydrologic processes. Therefore, in the present study, the Hybrid Wavelet-Gene Expression Programming model has been developed in comparison with its singular approach so that it forecasts the daily streamflow of Khoshkroud river located in Guilan province. For this purpose, in addition to the process of pre-processing hydrometric data, the effect of meteorological parameters on the model’s performance and efficiency has been studied. Also, pre-processing was performed with different properties and for four durations of one, two, three and six days. Correlation coefficient (R), index of agreement (Ig), Nash-Sutcliffe coefficient (NSE), mean absolute error (MAE), root-mean-square error (RMSE) and peak flow criteria(PFC) statistical indices were used to assess the models’ performances. The results show that using wavelet transform to pre-process hydrometric data will significantly improve the efficiency of the hybrid model in comparison with the singular model, such that the correlation coefficient of the validation data for three days has increased from 0.27 to 0.80 and similarly, the mean absolute error has decreased from 1.4 to 0.80 m3/Sec. On the other hand, meteorological parameters have caused the extreme values in the river’s flow rate time series to be well modelled and their efficiency in the extreme values to be significantly increased. The results obtained from this research express that the hybrid model alongside the meteorological parameters can be successfully and efficiently used in flow forecasting.
Keywords: daily discharge, Khoshkroud river, Preprocessing, time series -
سابقه و هدف
در سال های اخیر نواحی گسترده ای از استان خوزستان به دلیل عدم پوشش سطحی و مقاومت کم خاک در برابر باد فرساینده، مستعد تولید ریزگرد هستند. در بین ویژگی های خاک، ماده آلی با اتصال ذرات خاک نقش مهمی در مقاومت به فرسایش بادی و تولید ریزگرد دارد. با توجه با سطح گسترده ی کانون های ریزگرد استان خوزستان، استفاده از روش های سنتی تجزیه و تحلیل خاک پر هزینه و زمان بر است. روش طیف سنجی به دلیل مزیت سرعت عمل و سهولت جابجایی، می تواند هزینه و زمان اندازه گیری ویژگی های خاک را کاهش دهد. بر این اساس هدف از این پژوهش بررسی رفتار طیفی کربن آلی خاک در مناطق مرکز و جنوب استان خوزستان با استفاده از دو مدل رگرسیونی چند متغیره ماشین بردار پشتیبان (SVR) و شبکه عصبی (PLS-ANN) و تعیین طول موج کلیدی کربن آلی خاک در این مناطق است.
مواد و روش هادر این پژوهش منطقه مطالعاتی به شبکه های 2 در 2 کیلومتری تقسیم گردید و نمونه برداری به روش سیستماتیک- تصادفی انجام شد. مقدار کربن آلی نمونه های خاک در آزمایشگاه اندازه گیری گردید. طیف بازتابی نمونه ها با استفاده از دستگاه Fildspec3 در اتاقک تاریک تعیین شد و اندازه گیری طیفی با سه نوع آشکارساز در محدوده مریی تا مادون قرمز نزدیک (2500-350 نانومتر) صورت گرفت. به منظور حذف نویز در طیف بازتابی، طیف اصلی با 4 روش مشتق اول همراه با فیلتر ساویتزکی - گولای (FD-SG)، روش مشتق دوم به همراه فیلتر ساویتزکی - گولای (SD-SG)، واریانس نرمال استاندارد (SNV) و حذف پیوستار (CR) پیش پردازش شد. در ادامه عملکرد مدل های SVR و PLS-ANN در طیف اصلی و روش های پیش پردازش مورد مقایسه قرار گرفت.
یافته هانتایج نشان داد که مدل PLS-ANN دقت بیشتری نسبت به مدل SVR در برآورد کربن آلی خاک داشت. در مدل SVR روش پیش پردازش حذف پیوستار (CR) بهترین عملکرد (CR) (82/1=CAL RPD و 06/0 =CAL RMSE ،84/0 =CAL R2) و طیف اصلی (ROW) (66/1=CAL RPD و 14/0 =CAL RMSE ،74/0 =CAL R2) کمترین عملکرد را داشتند. در مدل PLS-ANN بهترین عملکرد مرتبط به روش مشتق دوم (SD-SG) (34/2=CAL RPD و 05/0 =CAL RMSE ،92/0 =CAL R2) و کمترین عملکرد در روش مشتق اول (FD-SG) (86/1=CAL RPD و 1/0 =CAL RMSE ،80/0 =CAL R2) مشاهده شد.
نتیجه گیریدر این پژوهش روش های پیش پردازش سبب بهبود دقت کلی مدل های SVR و PLS-ANN نسبت به طیف اصلی شدند. با توجه به عملکرد روش مشتق دوم در مدل PLS-ANN که بهترین دقت را در برآورد کربن آلی خاک داشت، طول موج های 800، 1800 و 2000 نانومتر به عنوان طول موج کلیدی کربن آلی خاک در برای مناطق مستعد تولید ریزگرد شناسایی شد.
کلید واژگان: ماشین بردار پشتیبان, مدل شبکه عصبی, پیش پردازش, حذف پیوستارBackground and ObjectivesIn recent years, due to the lack of surface coating and low soil resistance to wind erosion, the large area of Khuzestan province is sensitive to dust production. Among the soil characteristics, the organic matter by collecting soil particles, has important role in soil resistance to wind erosion and dust production. Since these areas are so wide, the use of traditional methods of soil analysis is really costly and time consuming. The spectroscopy approach, due to the advantage of speed and easy movement, can reduce the cost and time of measurement. The aim of this study is to investigate the spectral behavior of soil organic carbon in central and southern regions of Khuzestan province by using tow multivariate regression, Support Vector Regression) SVR( and neural network (PLS-ANN), and key wavelength determination of soil organic matter in these areas.
Materials and MethodsIn this research, the study area was divided into 2 km square grids and systematic and random sampling Methods were performed. The soil organic matter in samples was measured in the laboratory. The Reflectance spectra of soil samples were determined using FildSpect setup in dark room. And spectral measurements were carried out with three types of detectors in range of visible to near infrared (3500-2500 nm). To eliminate the noise in normal reflectance spectra, the main spectra were preprocessed by four methods, including the first derivative with the Savitzky-Golay filter (FD-SG), the second derivative with the Savitzky-Golay filter (SD-SG), the standard normal variant method (SNV) and the continuum removed method (CR). Next, the performance of SVR and PLS-ANN models in main spectra preprocessed method were compared.
ResultsThe results showed that the PLS-ANN model had better accuracy compared to SVR model in estimating organic carbon. In SVR models, the continuum removal method (CR) had the best performance (R2CAL=0.84, RMSECAL=0.06 and RPDCAL=1.82) and the main Spectra had the worst performance (R2CAL=0.74, RMSECAL=0.14 and RPDCAL=1.66). In PLS-ANN models, the best performance belonged to the second derivative (SD-SG), (R2CAL=0.92, RMSECAL=0.05 and RPDCAL=2.34) and the worst performance was related to the first derivative (FD-SG), (R2CAL=0.80, RMSECAL=0.1 and RPDCAL=1.86).
ConclusionIn this study, the preprocessing methods improved the overall accuracy of SVR and PLS-ANN models compared to the main spectrum. According to the second derivative method, in PLS-ANN witch had the best accuracy in estimating soil organic carbon, the Wavelength ranges around 800, 1800 and 2000 nm were identified as the key wavelength of the organic carbon in sensitive centers to dust production.
Keywords: Support vector machine, neural network, Preprocessing, Continuum Removal Method -
سطح وسیعی از اراضی شور و نیمه شور استان خوزستان به علت عدم پوشش سطحی و مقاومت کم خاک در برابر باد فرساینده به کانون های مستعد تولید ریزگرد تبدیل شده اند. هدف از این پژوهش مدل سازی شوری خاک مناطق حساس به تولید ریزگرد استان خوزستان با روش طیف سنجی امواج مرئی و مادون قرمز نزدیک (2500-350 نانومتر) بود. از مدل های چند متغیره رگرسیون حداقل مربعات جزئی، شبکه عصبی مصنوعی و مدل جنگل تصادفی برای مدل سازی شوری خاک به کار گرفته شد. طیف بازتابی خاک با دستگاه طیف سنج زمینی (FieldSpec) تعیین شد. همچنین روش های پیش پردازش فیلتر ساویتزی گولای، مشتق اول به همراه فیلتر ساویتزی گولای (FD-SG)، مشتق دوم به همراه فیلتر ساویتزی گولای (SD-SG)، روش نرمال سازی استاندارد (SNV) و روش حذف پیوستار (CR)، جهت حذف نویز و افزایش دقت مدل های چند متغیره مورد استفاده قرار گرفت. نتایج نشان داد که مدل ترکیبی حداقل مربعات جزئی- شبکه عصبی مصنوعی با معیارهای ارزیابی (65/2 - 40/3 =(RPDcal در برآورد شوری خاک دقت مناسبی دارد. در مقابل مدل ترکیبی حداقل مربعات - جنگل تصادفی نیز کمترین دقت (98/1-85/0= (RPDcal را نشان داد. پیش پردازش طیف اصلی در دو مدل شبکه عصبی و رگرسیون حداقل مربعات جزئی سبب افزایش نسبی دقت مدل شد درحالی که در مدل جنگل تصادفی پیش پردازش سبب کاهش دقت برآورد مدل، نسبت به طیف اصلی شد. محدوده 1800،1900، 2000، 2300 و 1500 نانومتر به عنوان طول موج کلیدی متاثر از شوری خاک شناسایی شد. از طول موج های کلیدی به دست آمده، می توان در مطالعات دورسنجی و تهیه نقشه شوری مناطق حساس به تولید گرد و غبار استان خوزستان استفاده کرد.کلید واژگان: رگرسیون حداقل مربعات جزئی, پیش پردازش, فیلتر ساویتزی گولای, طول موج کلیدی, مدل جنگل تصادفیA broad area of saline and semi-saline lands of Khuzestan province have changed into centers susceptible to dust production due to eroded wind and lack of surface coating and low soil resistance. The objective of this study was to model the soil salinity of sensitive areas to dust production in Khuzestan Provenience usin spectrometry method of visible and near-infrared wavelengths (2500-350 nm). The least square multivariate regression model, artificial neural network and random forest model were used to estimate soil salinity. The main soil spectrum was determined using the FieldSpect machine. Also, preprocessing methods including Savitzky-Golay filter, the first derivative with the Savitzky-Golay filter (FD-SG), the second derivative with the Savitzky-Golay filter (SD-SG), the standard normalization method (SNV), and the continuum remove method (CR) were used to eliminate the noise and to increase the accuracy of the multivariate model. The results showed that the combined model partial least squares-artificial neural network model with assessment criteria (RPDcal = 3.40-2.65) has high accuracy for salinity estimation. In contrast, the combined model of least squares - random forest showed the lowest accuracy (RPDcal = 0.85-1.98). Preprocess of the main spectrum in two models (neural network and partial least squares regression) increased the relative accuracy of the model; while in the random forest model, preprocess reduced the accuracy of the model compared to the main spectrum. The ranges of 1800, 1900, 2000, 2300 and 1500 nm were recognized as "the key wavelengths" impressed by soil salinity. The key wavelengths can be used in remote sensing studies and mapping of soil salinity in areas sensitive to dust production in Khuzestan province.Keywords: Partial least squares regression, Preprocessing, Savitzky-Golay filter, Key wavelengths, Random forest model
-
میزان شوری خاک یکی از عوامل تاثیرگذار بر مدیریت آبیاری و مزرعه می باشد اما اندازه گیری شوری با روش های معمول آزمایشگاهی امری وقت گیر وپر هزینه می باشد. لذا استفاده از روش طیف سنجی مادون قرمز در اندازه گیری میزان شوری خاک به عنوان روشی سریع و غیرمخرب ارزشمند خواهد بود. در این تحقیق طیف های بازتابی، جذبی و مشتق اول طیف بازتابی خاک های با شوری طبیعی و مصنوعی در سطوح مختلف شوری (dS.m-1 2/1 تا 5/307) در بافت های خاک سبک تا سنگین توسط روش های مختلف هموارسازی پردازش شده و جهت پیش بینی شوری خاک از مدل رگرسیونی حداقل مربعات جزئی (PLSR) استفاده شد، با توجه به ضرایب تبیین (R2) و مجذور میانگین مربعات خطا (RMSE) استفاده از طیف جذبی نسبت به طیف های بازتابی و مشتق اول طیف بازتابی نتایج دقیق تری را ارائه نمود. همچنین پیش بینی شوری خاک با استفاده از طیف جذبی در هر دو دسته خاک سنگین و سبک روشی کارآمد و موفق بود، هرچند این روش در خاک های با بافت سنگین (836/0 =R2) نتایج دقیق تری را در پیش بینی شوری خاک نسبت به خاک سبک (756/0 =R2) ارائه کرد. همچنین مشخص گردید که روش های پردازش میانگین متحرک و فیلتر ساویتزکی- گلای بیشترین تاثیر را بر بهبود نتایج پیش بینی شوری خاک ارائه نمودند.کلید واژگان: بافت خاک, پیش پردازش, شوری خاک, طیف سنجی, مادون قرمز, هموارسازیIntroductionAlthough the soil salinity as an effective factor on soil and water management is typically assessed by measuring the soil electrical conductivity (ECe), this conventional laboratory method is time-consuming and costly. Therefore, near-infrared spectroscopy (NIR) as a fast, cheap and non-destructive method to assess soil salinity level can be considered as a valuable alternative method. Reviews of literature on the application of NIR spectroscopy for soil salinity prediction have shown that there is no sufficient information about the effect of soil texture on results accuracy; therefore, in this study the soil salinity was predicted under different soil salinity levels and various soil textures. The effect of different pre-processing methods was also investigated to improve the predicted soil salinity.Materials and MethodsTwenty three surface soil samples were collected from different places in Fars province, then; some soil properties such as percentage of particles size and ECe were measured. These samples were artificially salted by adding the water in different salinity levels to the soil samples. The ECe of these soils were between 2.1 to 307.5 dS/m and then all samples dried to reach the field capacity level. Soil reflectance spectra were obtained in 350-2500 nm wavelength range. The absorbance and derivative of reflectance spectra were calculated based on the reflectance spectra. In order to determine the effect of smoothing technique, as a pre-processing method, 4 various methods (moving average, Gaussian, median and Savitzky-Golay filters) in 12 different segment sizes (3,5,7,9,11,13,15,17,19,21,23 and 25) were applied and the processed spectra introduced to Partial Least Square Regression (PLSR) model to predict soil salinity in two calibration and validation steps. At the first step, the soil salinity was predicted for all samples using of reflectance, absorbance and derivative of reflectance spectra under 4 pre-processing methods and 12 segment sizes. According to the R2 and RMSE indices, the best type of spectra, the effect of various pre-processing methods and the best segment size in prediction of soil salinity were determined as absorbance spectra, moving average and Savitzky-Golay filters for segment size of 25 and 15, respectively. In the second step, the effect of soil texture on prediction accuracy was investigated. For this purpose, soil samples were divided into the coarse and fine textures and soil salinity was predicted for each of these groups using different pre-processing methods and different segment sizes.Results and DiscussionIn prediction of soil salinity by absorbance, reflectance and derivative of reflectance spectra, the R2 values in validation step were 0.742, 0.706 and 0.670; and RMSE values were 29.92, 31.96 and 33.9 (dS.m-1), respectively. The absorbance spectra were the best spectra type in prediction of soil salinity. Therefore, in next step, absorbance spectra were used only for predicting the salinity in fine and coarse soil textures. Results showed that the prediction in coarse texture was better than that of the fine texture (R2= 0.836 and R2=0.756, respectively). It was also revealed that the highest R2 occurred in coarse texture and the accuracy of prediction was reduced in fine textures. The results showed that the performance of different pre-processing methods is related to the spectrum type. Although the pre-processing methods had no positive effect in using of reflectance spectra, but it improved the predicted values which were obtained using of absorbance and derivative of reflectance spectra. The best results were occurred when the absorbance spectra were used. Moving average method increased the accuracy of prediction more than the other pre-processing methods, and according to the results this method, for the segment size of 25, was the best technique in soil salinity prediction.ConclusionAccording to the R2 and RMSE indices, the prediction of soil salinity by absorbance spectra was more accurate than the prediction using reflectance and derivative of reflectance spectra (R2= 0.742, 0.706 and 0.670, respectively). Although the predicted soil salinity in coarse soils were more accurate than that in fine soils. Using of absorbance spectra to predict the soil salinity in all soil textures was efficient. The results showed that using of pre-processing methods improved the soil salinity prediction by absorbance and derivative of reflectance spectra, and the moving average and Savitzky-Golay filter were the best pre-processing methods.Keywords: Near-infrared spectroscopy, Pre-processing, Soil salinity, Soil texture
-
ماده آلی خاک به دلیل تاثیر بر روی خصوصیات فیزیکی، شیمیایی و بیولوژیکی خاک به عنوان شاخصی از کیفیت خاک و حاصلخیزی آن محسوب می گردد. هدف از این پژوهش بررسی اثر رطوبت بر رفتار طیفی خاک به منظور برآورد مقدار ماده آلی با استفاده از روش طیفی سنجی مرئی- مادون قرمز نزدیک بود. همچنین عملکرد روش های مختلف پیش پردازش در مدل سازی مقایسه شد. به همین منظور تعداد 50 نمونه خاک از لایه سطحی (0 تا 30 سانتی متر) به صورت تصادفی از برخی از شهرستان های استان تهران جمع آوری شد. نمونه ها هوا خشک شده و از الک 2 میلی متری عبور داده شدند. مقدار ماده آلی و بافت خاک در آزمایشگاه اندازه گیری شد. برای اندازه گیری بازتاب طیفی، نمونه های خاک در آون خشک (105 درجه، به مدت 24 ساعت) و با سطوح 5، 10، 15 و 20 درصد وزنی (گرم آب/ گرم خاک) رطوبت دهی شدند. سپس بازتاب طیفی نمونه خاک های موردمطالعه با استفاده از دستگاه اسپکترورادیومتر زمینی در دامنه طول موج مرئی- مادون قرمز نزدیک (2500-350 نانومتر) در تاریکخانه اندازه گیری شد.نتایج حاصل از ارزیابی متقابل نشان داد که روش پیش پردازش SNV عملکردی بهتر در پیش-بینی کربن آلی خاک دارد. بهترین نتیجه در رطوبت آون خشک برای گروه اعتبارسنجی با مقدار R2 و RMSE به ترتیب 83/0 و 422/0 حاصل شد. همچنین R2 و RMSE به ترتیب 75/0 و 543/0 در رطوبت 5 درصد؛ 70/0، 553/0 در رطوبت 10 درصد؛ 60/0، 558/0 در رطوبت 15 درصد به دست آمد.کلید واژگان: بازتاب طیفی, پیش پردازش, رگرسیون حداقل مربعات جزئی, مرئی- مادون قرمز نزدیکSoil organic matter is considered as an indicator of soil quality and its fertility due to its impact on the physical, chemical and biological properties of soil. The purpose of this study was to investigate the effect of moisture on soil spectral behavior in order to estimate the amount of organic matter using visible-near infrared spectroscopy. Also, the performance of different preprocessing methods was compared in modeling. For this purpose, 50 soil samples from a surface layer (0-30 cm) were randomly collected from some cities in Tehran province. The samples were air-dried and passed through a 2 mm sieve. The amount of organic matter and soil texture were measured in the laboratory. To measure spectral reflectance, soil samples are dry in the oven and they were hydrated with levels of 5, 10, 15 and 20 wt.% (Grams of water / g of soil). Then, Soil samples were scanned using a FieldSpec Pro Spectroradiometer with a measurement range of 350–2500 nm. The results of the cross-evaluation indicated that SNV pre-processing method was better in predicting organic carbon content of soil. The best result for the validation group was obtained in dry oven moisture with R2 and RMSE values of 0.83 and 0.422 respectively. Also, R2 and RMSE were 0.75 and 0.543, respectively, at 5% moisture content, 0.70, 0.553 at 10% moisture, 0.605, 0.558 in moisture content of 15%.Keywords: partial least squares regression, preprocessing, spectral reflection, visible-near infrared
-
استفاده بهینه از آب آبیاری نیاز به برنامه ریزی دقیق آبیاری دارد و برآورد دقیق ضریب گیاهی به خصوص در مقیاس های وسیع پیش نیاز آن است. هدف از این تحقیق مقایسه برخی از رویکردهای پیش پردازش داده های ورودی به شبکه عصبی مصنوعی: رگرسیونی و کاهش داده (تحلیل مولفه های اصلی و چرخشی) در برآورد ضریب گیاهی با شاخص های NDVI، RI، TVI، MSAVI، SAVI، mTVI، EVI، MNDVI، TVX، NVSWI در جهت مدل سازی ضریب گیاهی گندم در استان آذربایجان شرقی بود. مقایسه عملکرد رویکرد کاهش داده و رگرسیون بیانگر کاهش معیارهای خطا در رویکرد کاهش داده بود، به عنوان نمونه درصد افزایش آماره RMSE از حالت چرخشی به رگرسیون 8/11 و از حالت تحلیل مولفه های اصلی به رگرسیون 7/22 بود. رویکردهای مورد استفاده در برآورد ضریب گیاهی از تخمین بیش برآوردی برخوردار بودند به طوری که میزان افزایش متوسط ضریب گیاهی دوره صحت سنجی از ضریب گیاهی فائو به رویکرد پیش پردازش با رگرسیون، تحلیل مولفه های اصلی و چرخشی به ترتیب 7/13، 7/6 و 6/4 درصد بوده است. بنابراین استفاده از چرخش در تحلیل کاهش داده میزان دقت تخمین را بالا می برد. کاهش 13/39 درصد ضریب همبستگی از شاخص MSAVI نسبت بهNDVI ، حاکی از این است که شاخص های توسعه یافته براساس شرایط منطقه در افزایش کارایی برآورد ضریب گیاهی با تصاویر ماهواره ای از اهمیت ویژه ای برخوردار هستند.کلید واژگان: پیش پردازش, چرخشی, شاخص های توسعه یافته, کاهش دادهOptimal use of irrigation water requires to the precise irrigation planning and the accurate crop coefficient estimation is the prerequisite of that particularly in the global scale. The aim of research was the comparison of preprocessing approaches of artificial neural network: regression and data reduction (principle component analysis and rotation) for crop coefficient estimation using NDVI, RI, TVI, MSAVI, SAVI, mTVI, EVI, MNDVI and TVX for wheat crop coefficient of East Azarbaijan Province. The performance of regression and data reduction approaches indicated the error criteria decreasing of data reduction approach, for example RMSE increasing from rotation to regression and from principle component analysis to regression was 11.8 and 22.7%, respectively. The used approaches of crop coefficient estimation has overestimation as the average increase of crop coefficient in the validation period showed 7.7, 6.13 and 4.6% increasing of crop coefficient from FAO to the regression, principle component and rotation approaches, respectively. Therefore, using the rotation in the data reduction analysis increased the accuracy of estimation. Decreasing of correlation coefficient-39.13% - from MSAVI to NDVI indicated that the improved indices basis on the study area condition increased the performance of crop coefficient estimation using satellite images.Keywords: Preprocessing, Rotation, Improved Indices, Data Reduction
-
حوضه های آبریز جنوب غرب کشور شامل کرخه، کارون بزرگ، جراحی و زهره سهم چشمگیری در تامین منابع آبی مورد نیاز بخش های کشاورزی، شرب، صنعت و نیروگاه های برقابی منطقه و برخی استان های واقع در شرق زاگرس دارند. وجود داده های پایه ماهانه بارش با تراکم مناسب از نیازهای اساسی برای مدیریت منابع آبی منطقه از قبیل تصمیم گیری در مورد زمان مناسب آبگیری و تخلیه سدها، واسنجی و پس پردازش برونداد مدل های پیش بینی ماهانه بارش و پیش آگاهی خشکسالی می باشد. بررسی تعدادایستگاه های سنجش بارش تحت پوشش وزارت نیرو و سازمان هواشناسی کشور نشان می دهد که حدود 34 درصد از منطقه فاقد تراکم مناسب از ایستگاه های اندازه گیری بارش می باشد. برای پرکردن خلاء های آماری از داده های بازکاوی افرودیت که توسط سازمان هواشناسی ژاپن و با همکاری اتحادیه هواشناسی آسیا در تامین داده های بارش کشورهای آسیایی تهیه شده است، استفاده گردید. داده های شبکه ای افرودیت در دو تفکیک مکانی 5/0×5/0 درجه و 25/0×25/0 درجه در دسترس هستند. بدین منظور در ابتدا صحت داده های بارش افرودیت با داده های دیدبانی بررسی گردید. پس از حصول اطمینان از کارایی داده های افرودیت و اعمال تصحیحات مربوطه، داده ها مذکور جایگزین داده های دیدبانی مخدوش یا شبکه های فاقد داده شدند. به دلیل عدم به روزرسانی داده های APHRODITE بر روی غرب آسیا، دوره مطالعاتی محدود به دوره 2007-1987 میلادی گردید. بررسی ها نشان داد، داده های تلفیقی دیدبانی-افرودیت بدست آمده به خوبی قادر به نمایش الگوهای بارش حوضه های آبریز جنوب غرب کشور به ویژه در ماه های سرد و پر بارش می باشد.کلید واژگان: اریبی, بارش شبکه ای, پس پردازش, پیش بینی ماهانه, کارون بزرگIntroductionSoutheast watersheds of Iran including Great Karoon, Karkheh, Jarrahi and Zohreh have the most significant contribution in the water supply of the agriculture, industry, drinking water and hydroelectric power plants over Iran. 25 percent of the countrys electricity is produced from hydroelectric power plants located in this region. The existence of a monthly relatively high resolution gridded precipitation dataset is of the most important needs of water resources management for such as deciding on the suitable time of dewatering and discharge of dams, calibration of dynamical monthly forecasting models and drought early warning. Even considering all observation stations governed by Meteorological Administration and Ministry of Power, the density of stations is not so enough to use them for calibration of hydro-climate model outputs. To overcome this deficiency, one way to fill the gap is using bias corrected global gridded precipitation dataset such as APHRODITE, CMORPH, PRESIANN and other newly generated data.
Material andMethodsWatershed of Karkheh, great Karoon, Jarrahi and Zohreh are the area of study which covers southwest provinces of Khuzestan, Kermanshah, Ilam, Chaharmohal-Bakhtiari, Kohkiluyeh and Buyerahmad, Isfahan, Hamadan, Fars and Lorestan, which is shown in figure 2. There are 135 observation station in the area of study which governs by Iran Meteorological Organization and Ministry of Power. Area of study covers by 75 grids of 0.5×0.5 degree latitude and longitude. For each grid there is an APHRODITE precipitation data. In the 34% of grids, there is no observation station. The main goal of this study is to attribute a reliable monthly precipitation data to all grids without any observation station. Period of APHRODITE data set is 1987-2007, which is same to observation period. Firstly regional bias of APHRODITE data set has been computed by comparing observed precipitation with APHRODITE one. Then bias corrected APHRODITE precipitation (Composite APHRODITE Observation dataset) has been placed in non-observation grids. Efficiency of composite precipitation data has been determined by statistical parameters of bias, correlation and Nash-Sutcliff indices.Results And DiscussionIn this research the results have been evaluated at monthly and seasonal time scales. In the case of seasonal time scale, we found that the minimum APHRODITEs bias of 1.2 mm has been occurring in summer, while the maximum bias has been occurring in winter by 40.9mm. It means that the bias is high in the rainy season. Seasonal correlations were statistically acceptable in 0.05 significant levels, showing same seasonal fluctuations in APHRODITE and rain gage data. To provide seasonal composite APHRODITE-Observed precipitation gridded data set, mean seasonal bias of APHRODITE has been removed, while preserving seasonal fluctuation. The highest spatial correlation of 0.8 was detected in autumn, while it was about 0.7 for spring and winter. The minimum seasonal correlation was in summer by 0.5. There were also a good agreement between area averaged observation and APHRODITE data, when considering statistical indices of bias, Nash-Sutcliff and relative percentage errors. Results show the cumulative distribution function of APRODITE data is behind of the observed cumulative distribution function data, meaning that APHRODITE reaches its maximum earlier than observation data. This implies that APHRODITE cannot capture well the extreme monthly precipitation. Monthly correlations are approximately greater than 0.9, but the only exception is September with a correlation coefficient of 0.52. All correlations are significant in 0.05 levels. The highest spatial correlation was occurred in Novembers. Monthly Nash-Sutcliff was 0.96 in monthly time series. The categorical percentage score was 94.1%. These results strongly confirm that APHRODITE precipitation data is a good option for replacement in grid cells without observations. The number of observation stations per cell is varied from 1 to 7. We found that the maximum monthly correlations occur in grid cells of 0.5×0.5 degree latitude and longitude which having at least 3 observation stations. The three-station bias has been applied to APHRODITE data, then bias-removed data has been replaced with grid cells without observations. Spatial patterns of new composite APHRODITE-observation data set has good agreement with observation in the areas having intense observation stations. They also can capture well the spatial precipitation distribution of rainy areas located in the center of basin and low rainfall areas located in the southwest of the region. The results of this research can be used in calibration of dynamical seasonal forecasting outputs, drought early warning and rain-runoff simulation.Keywords: APHRODITE, Calibration, Great Karoon Basin, Khuzestan, Precipitation
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.