به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت

جستجوی مقالات مرتبط با کلیدواژه « decision trees » در نشریات گروه « آب و خاک »

تکرار جستجوی کلیدواژه «decision trees» در نشریات گروه «کشاورزی»
  • فرحناز دوستعلی زاده، مجتبی خوش روش*، رامین فضل اولی، محمدمهدی باطنی

    با توجه به اهمیت آب شیرین برای حیات بشر و آسیب پذیری منابع آب زیرزمینی در برابر انواع آلودگی ها و امکان انتقال آلاینده ها به سایر منابع آب های سطحی و زیرزمینی و همچنین، قرار داشتن کشور ایران در کمربند خشک و نیمه خشک، محافظت از این عنصر با ارزش و کمیاب بسیار ضروری بوده و پایش مداوم و مستمر آن باید از اولویت های مدیریت منابع آب قرار گیرد. از این رو، در پژوهش حاضر به آلودگی نیترات در دشت های شرق استان مازندران و بررسی مسائل مربوطه پرداخته شد و مدلی کارآمد و بهینه جهت پیش بینی غلظت نیترات ارائه شد. در انجام این پژوهش به مقایسه ی سه مدل یادگیری ماشین درخت تصمیم، رگرسیون لجستک و شبکه عصبی مصنوعی پرداخته شد. داده های فیزیکی و شیمیایی اندازه گیری شده طی سال های 1364 تا 1399 استفاده شده و به عنوان متغیرهای ورودی مدل ها قرار داده شد. متغیر ها شامل دما، سطح ایستابی، pH، EC ، HCO3-، CL-، SO24-، Na+، K+، Mg2+، Ca2+، THو TDS بوده و میزان آلودگی نیترات آب زیرزمینی با تقسیم 70 درصد داده ها به عنوان آموزش و 30 درصد به عنوان آزمون، پیش بینی شده و از شاخص های R2، RMSE، NSE و PBIAS برای ارزیابی مدل ها استفاده شد. نتایج به دست آمده حاکی از آن بود که مدل درخت تصمیم با اختلاف زیاد نسبت به دو مدل دیگر بهترین عملکرد را داشته (957/0R2 = و 297/0RMSE=، 95/0= NSE و 907/0Testing acc =) و پس از آن رگرسیون لجستیک و شبکه عصبی مصنوعی با عملکردهای به مراتب ضعیف تری نسبت به مدل درخت تصمیم قرار داشتند. پیشنهاد می شود آزمایش با مدل های دیگر یادگیری ماشین و تغییر قراردادن متغیرهای ورودی و اضافه کردن چند متغیر دیگر از جمله کاربری اراضی و بارندگی انجام و نتایج با پژوهش حاضر مقایسه گردند.

    کلید واژگان: داده کاوی, درخت های تصمیم, رگرسیون لجستیک, شبکه عصبی مصنوعی}
    Farahnaz Doustalizadeh, Mojtaba Khoshravesh *, Ramin Fazloula, Mohammadmehdi Bateni

    Considering the importance of fresh water for human life and the vulnerability of groundwater sources to all kinds of pollution and the possibility of transferring pollutants to other surface and groundwater sources, as well as the location of Iran in the arid and semi-arid belt, protecting this valuable and rare element is imperative and its continuous monitoring must be one of the priorities of water resources managers. Therefore, in the current research, nitrate pollution in the eastern plains of Mazandaran province was discussed and relevant issues were investigated, and an efficient and optimal model for predicting nitrate concentration was presented. In this research, three machine learning models including decision tree, logistic regression and artificial neural network were compared. The physical and chemical data measured during the years 1985 to 2020 were used and entered as the input variables of the models. The variables include temperature, water level, pH, EC, HCO3-, CL-, SO24-, Na+, K+, Mg2+, Ca2+, TH and TDS; The amount of nitrate contamination of the groundwater, was predicted by dividing 70% of the dataset as training and 30% as testing data. The R2, RMSE, NSE and PBIAS indexes were applied for model evaluation. The results indicated that the Decision Tree model had the best performance with a large difference compared to the other two models (R2 = 0.957 and RMSE = 0.297, NSE = 0.95 and testing acc = 0.907). After That, logistic regression and artificial neural network had much weaker performances than the lead model. It is suggested to conduct another research with other machine learning models by changing the input variables and add some extra ones such as land-use and compare the results with the current research.

    Keywords: Data Mining, Decision Trees, Logistic Regression, Artificial Neural Network}
  • حسین نوروزی، عطاء الله ندیری*، اصغر اصغری مقدم، مریم قره خانی
    قابلیت انتقال یکی از پارامترهای مهم در شناسایی خصوصیات آبخوان ها می باشد و به دست آوردن مقادیر و چگونگی توزیع آن توسط مدل سازی، برای مدیریت آبخوان ها ضروری به نظر می رسد. برآورد این پارامتر با استفاده از آزمایشات صحرایی مانند آزمایش پمپاژ بسیار پرهزینه و وقت گیر است. برای مدیریت مناسب آبخوان دشت ملکان که یکی از قطب های کشاورزی شمال غرب کشور می باشد شناخت پارامترهای هیدروژئولوژیکی، خصوصا قابلیت انتقال امری لازم و ضروری می باشد. در مطالعه حاضر روش جنگل تصادفی (RF) که یک روش یادگیری مبتنی بر دسته ای از درخت های تصمیم است، برای پیش بینی قابلیت انتقال آبخوان پیشنهاد شده که تاکنون در این زمینه مورد استفاده قرار نگرفته است. روش RF نسبت به روش های دیگر دارای مزایایی مانند دقت پیش بینی بالا، توانایی در یادگیری روابط غیر خطی، توانایی بالا در تعیین متغیرهای مهم در پیش بینی و ماهیت غیر پارامتری می باشد. در مدل RF به دلیل اینکه با افزایش درخت ها میزان خطا کاهش می یابد، بنابراین تعداد 500 درخت برای فراخوانی مدل استفاده شد و پس از اجرای مدل نتایج مدل به وسیله برآورد خطای خارج از کیسه (OOB) ارزیابی گردید و علاوه بر این، برای کاهش ابعاد و افزایش دقت و قابل تفسیر بودن مدل، روش انتخاب ویژگیFS)) به کار برده شد و متغیرهای مهم در پیش بینی نیز شناسایی گردید. بر اساس نتایج مدل سازی با RF مقادیر MSE و AUC به ترتیب برابر با 036/0 و 96/0، متغیرهای هدایت الکتریکی، محیط آبخوان و گرادیان هیدرولیکی به ترتیب به عنوان پارامترهای مهم و تاثیرگذار در پیش بینی قابلیت انتقال شناسایی شدند. همچنین نتایج قابل قبول مدل RF در پیش بینی قابلیت انتقال و تعیین پارامترهای مهم در پیش بینی، نشان از مزایای مدل ارائه شده نسبت به سایر مدل ها در بحث پیش بینی، می باشد.
    کلید واژگان: آبخوان, جنگل تصادفی, درخت تصمیم, دشت ملکان, قابلیت انتقال}
    A. Nadiri *, A. Asghari Moghadam, H. Noruozi
    Transmissivity is an important factor in identifying the characteristics of aquifers, so, estimating its value and distribution by modeling is necessary for aquifer management. Estimation of this parameter using field experiments such as pumping test is costly and time-consuming. For suitable management of Malikan plain, as one of active agricultureal areas in north-west of the country, understanding the hydrogeological parameters, such as transmissivity is required. In this study the random forest (RF) algorithm, which is a learning method based on ensemble of decision trees, is proposed for predicting transmissivity that has not been used in this field, yet. The RF technique has advantages over other methods due to having high prediction accuracy, ability to learn nonlinear relationships, non-parametric natural and ability to determine the important variables in the prediction process. Increasing the number of trees decrease the error, so 500 trees were selected to reap high efficiency of the model. The model results were evaluated by OOB error estimating method and in addition, to reduce the dimensions, increase the accuracy and better interpretation of the model process, the FS method was used. The most important variables in the prediction were also identified by the FS method. Based on the results of RF modeling with AUC=0.96 and MSE=0.036, electrical conductivity, aquifer media and hydraulic gradient variables were the most important parameters in predicting transmissivity, respectively. Also the accuracy of RF model and determining the important parameters in transmissivity prediction showed the advantages of this model over other models in prediction issue.
    Keywords: Aquifer, Decision trees, Malikan plain, Random forest, Transmissivity}
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال