-
یادگیری رتبه بندی که یکی از روش های یادگیری ماشین برای مدل کردن رتبه بندی است، امروزه کاربردهای بسیاری به خصوص در بازیابی اطلاعات، پردازش زبان طبیعی و داده کاوی دارد. فعالیت یادگیری رتبه بندی را می توان به دو بخش تقسیم کرد. یکی سیستم یادگیری مورد استفاده و دیگری سیستم رتبه بندی. در سیستم یادگیری، یک مدل رتبه بندی بر اساس داده های ورودی ساخته می شود. در بخش سیستم رتبه بندی، از این مدل ساخته شده برای پیش بینی رتبه بندی استفاده می شود. در این مقاله یک الگوریتم پیشنهادی مبتنی بر یادگیری جمعی به منظور یادگیری رتبه بندی اسناد ارائه می شود که این الگوریتم به صورت تکراری یادگیرهای ضعیفی بر روی درصدی از داده های آموزشی که توزیع آنها بر اساس یادگیر قبلی عوض شده است، می سازد و جمعی از یادگیرهای ضعیف را برای رتبه بندی تولید می کند. این الگوریتم سعی می کند تا با ساختن رتبه بند بر روی درصدی از داده ها، سبب افزایش دقت و کاهش زمان شود. با ارزیابی بر روی مجموعه داده لتور 3 دیده می شود که بهتر از الگوریتم های دیگری در این زمینه که مبتنی بر یادگیری جمعی هستند، عمل می کند.کلید واژگان: یادگیری رتبه بندی, یادگیری رتبه بندی در بازیابی اطلاعات, یادگیری ماشین, یادگیری جمعیLearning to rank refers to machine learning techniques for training a model in a ranking task. Learning to rank has been shown to be useful in many applications of information retrieval, natural language processing, and data mining. Learning to rank can be described by two systems: a learning system and a ranking system. The learning system takes training data as input and constructs a ranking model. The ranking system then makes use of the learned ranking model for ranking prediction. In this paper, a new learning algorithm based on ensemble learning for learning ranking models in information retrieval is proposed. This algorithm iteratively constructs weak learners using a fraction of the training data whose weight distribution is determined based on previous weak learners. The proposed algorithm combines the weak rankers to achieve the final ranking model. This algorithm constructs a ranking model on a fraction of the training data to increase the accuracy and reduce the learning time. Experimental results based on Letor.3 benchmark dataset shows that the proposed algorithm significantly outperforms other ensemble learning algorithms.Keywords: learning to rank, learning to rank for information retrieval, Machine learning, ensemble learning
-
سرعت موج برشی یکی از پارامترهای مهم برای تعیین خواص مکانیکی و پتروفیزیکی در مخازن هیدروکربوری است. اندازه گیری موج برشی به کمک روش های آزمایشگاهی و بهره گیری از ابزار صوتی دوقطبی امکان پذیر است، با این حال، با توجه به هزینه بالای عملیات مغزه گیری و اخذ لاگ صوتی دوقطبی، داده های واقعی موج برشی تنها برای تعداد محدودی از چاه های یک میدان در دسترس می باشند. برای غلبه بر این محدودیت ها، روش های مختلف هوش مصنوعی به منظور تخمین پارامتر مذکور از طریق لاگ های معمول چاه به کار برده می شوند. در این مطالعه به تخمین سرعت موج برشی با استفاده از روش های یادگیری جمعی (ensemble learning) در مخزن آسماری میدان منصوری پرداخته شد. در این مطالعه، سرعت موج برشی با استفاده از روش های یادگیری جمعی مثل رای گیری (Voting)، برانبارش (Stacking) ، بسته بندی (Bagging) و تقویت (Boosting) در مخزن آسماری برآورد شد و نتایج با مدل های مرسوم مثل، رگرسیون خطی (LR)، رگرسیون بردار پشتیبان (SVR)، الگوریتم نزدیک ترین همسایه (KNN)، درخت تصمیم (DT)، شبکه عصبی (ANN) و روش های هیبریدی مثل ترکیب شبکه عصبی با الگوریتم ژنتیک (ANN-GA)، ازدحام ذرات (ANN-PSO) و سیستم های فازی (ANFIS) مقایسه شد. به منظور ارزیابی و اعتبارسنجی مدل ها از ضریب همبستگی و ریشه میانگین مربعات خطا استفاده شد. مقایسه مدل های مرسوم و روش های هیبریدی با روش های یادگیری جمعی نشان داد که الگوریتم های جمعی عملکرد بهتری در تخمین موج برشی دارند. از بین روش های یادگیری جمعی نیز مدل کت بوست (Catboost) با میزان R2 برابر 0.983 و RMSE برابر با 0.058 بهترین عملکرد را نشان داد و قادر به تعیین موج برشی با دقت بالاست.کلید واژگان: یادگیری جمعی, مخزن آسماری, میدان نفتی منصوری, سرعت موج برشی, یادگیری ماشینیShear wave velocity is one of the important parameters for determining mechanical and petrophysical properties in hydrocarbon reservoirs. Shear waves are usually obtained from dipole sonic imager (DSI) tools or core analysis in the laboratory. However, these methods as common sources for shear wave estimation are time-consuming and costly and thus can only provide information on shear wave in a few drilled wells. To overcome these limitations, different artificial intelligence methods are used to estimate the mentioned parameter through the conventional well logs. In this study, the shear wave velocity was estimated using ensemble learning methods in Asmari Reservoir in the Mansouri oilfield. In this study, shear wave velocity was estimated using ensemble learning methods such as voting, stacking, bagging, and boosting in the Asmari reservoir, and the results were compared with conventional models such as Linear regression (LR), support vector regression (SVR), nearest neighbor algorithm (KNN), decision tree (DT), neural network (ANN) and hybrid methods such as combining neural network with genetic algorithm (ANN-GA) ), particle swarm (ANN-PSO) and fuzzy systems (ANFIS). In order to evaluate and validate the models, correlation coefficient (R2) and root mean square error (RMSE) were used. A comparison of conventional models and hybrid methods with ensemble learning methods showed that ensemble algorithms perform better in shear wave estimation. Considering the testing phase, among the ensemble learning methods, the Catboost model has provided the lowest error (RMSE=0.058) and highest correlation coefficient (R=0.983) can determine shear wave with high accuracy.Keywords: Ensemble Learning, Asmari Reservoir, Mansouri Oil Field, Shear Wave Velocity, Machine Learning
-
تقریبا همه ی تصاویر سنجنده ی مادیس دارای قسمت های پوشیده از ابر هستند. به منظور استخراج اطلاعات صحیح از داده های مادیس، یکی از پیش پردازش های کلیدی شناسایی پیکسل های ابری و جداسازی آن از عوارض مشابه مانند برف/یخ است. ویژگی های مورد استفاده در طبقه بندی ابر به دو دسته ی ویژگی های بافتی و طیفی تقسیم می شوند. با استفاده از ویژگی های بافتی باند های مرئی امکان جداسازی پیکسل های ابر از پیکسل های برف/یخ فراهم می شود ولی ابر و برف می توانند دارای ویژگی های حرارتی مشابه باشند. همچنین از ویژگی های حرارتی (دما) در ماسک ابر مادیس به منظور شناسایی ابر ها در ارتفاع های مختلف استفاده شده است. مطالعات زیادی به منظور طبقه بندی پوشش سطح زمین با استفاده از روش های یادگیری جمعی انجام شده است و از این روش ها صرفا به منظور طبقه بندی استفاده شده است. در این تحقیق کاربردی جدید از روش های یادگیری جمعی در مقایسه با مطالعات پیشین مطرح شده است و از این روش ها به منظور ادغام دو نوع مختلف از طبقه بندی کننده ها که نوع اول طبقه بندی کننده هایی با ویژگی های انعکاسی و نوع دوم با ویژگی های حرارتی هستند، استفاده شده است. همچنین در مطالعات پیشین، اثر تغییر ویژگی های ورودی بر عملکرد نهایی روش های یادگیری جمعی مورد بررسی قرار نگرفته است. بنابراین هدف این تحقیق مقایسه ی نتیجه ی ادغام طبقه بندی کننده های با ویژگی های انعکاسی و حرارتی با استفاده از دو نوع از روش های یادگیری جمعی شامل boosting و الگوریتم جنگل تصادفی(RF)، به منظور شناسایی پیکسل های ابری، سیروس و برف/یخ با توجه به روش انتخاب ویژگی می باشد. ابتدا به منظور انتخاب ویژگی های انعکاسی و حرارتی در روش های boosting به کار گرفته شده، شامل adaboost.M1، adaboostSVM،logitboost و totalboost از روش های معیار S و الگوریتم ژنتیک (GA) و در روش RF علاوه بر روش های ذکر شده از روش حذف ویژگی به روش بازگشتی (RFE) و ماتریس کارلیشن استفاده شد. سپس طبقه بندی کننده ها در سطح تصمیم با یکدیگر ادغام شدند. برای اکثر روش های یادگیری جمعی صرف نظر از روش انتخاب ویژگی، دقت تولید کننده ی ابر وسیروس بالایی دست آمد. استفاده از دو روش RFE و ماتریس کارلیشن در الگوریتم RF توانست دقت کاربری پیکسل های ابر به ترتیب 99% و 100% را نتیجه دهد که نسبت به حالتی که از روش های معیار S و الگوریتم ژنتیک (GA) برای انتخاب ویژگی استفاده شد، دقت های بالا تری را نشان داد. روش های boosting صرف نظر از روش انتخاب ویژگی با اختصاص وزن بیشتر به داده های آموزشی مربوط به کلاس با تعداد داده های آموزشی کم تر، توانستند به دقت تولید کننده ی برف/یخ بالا تری تسبت به الگوریتم RF دست یابند. همچنین این روش ها دقت کاربری سیروس نسبتا بالا تری نسبت به روش های RF نتیجه دادند. در بین روش های انتخاب ویژگی مختلف در RF روش ماتریس کارلیشن توانست دقت کاربری سیروس 91% را نتیجه دهد. در انتها، میزان توافق نتایج طبقه بندی با نقشه ی مرجع به دست آمده از ماسک ابر مادیس محاسبه شد. روش های RF درصد توافق های بالا تری نسبت به روش های boosting نتیجه دادند. بالا ترین درصد توافق برای روش RF-RFE به مقدار 76% و پایین ترین برای روش logit boost-GA به مقدار 42% به دست آمد.کلید واژگان: روش های یادگیری جمعی, انتخاب ویژگی, ابر, برف, یخ, سیروس, ادغام, طبقه بندی کننده های انعکاسی و حرارتیAlmost all MODIS images have cloudy regions. Cloud detection and discriminating it from similar objects like snow/ice is a necessary pre-processing step before extracting accurate information. Features for cloud detection can be divided into two categories; textural and spectral features. Using textural features in the visible bands make cloud and snow/ice pixels separable, while cloud and snow can have similar temperature. Thermal features have been used for cloud detection in different heights in MODIS cloud mask (MOD35). Recently variety of studies using ensemble learning methods for land cover classification have been done. In the studies, ensemble learning methods used for classification but in this study, a new application has been introduced; for fusion of classifiers having reflectance and thermal features. Also, in previous studies, the effect of changing feature selection method on the performance of ensemble learning methods has not been examined. So, the purpose of this study is the comparison of the performance of fusion of the reflectance and thermal classifiers using two kinds of ensemble learning methods including boosting and Random Forest (RF) for detection of cloud, cirrus and snow/ice pixels, based on the feature selection method applied. First, some of the Visible-Infrared bands (VIR), 1, 2, 8 and 26 in addition to the thermal bands including 20, 22, 31, 32 and 35 of Terra MODIS were calibrated and the reflectance and Brightness Temperature (BT) values were extracted. Also, three indexes, Normalized Difference Vegetation Index (NDVI), Normalized Difference Snow Index (NDSI) and the ratio of bands b1/b2 were computed. Gray Level Co-occurrence Matrix (GLCM) textural features of the above mentioned bands and some of the BT differences including, BT31-BT32, BT33-BT31, BT31-BT20, BT20-BT32, BT22-BT32 were added to the reflectance and thermal input features sets. For selecting the suitable reflectance and thermal features in different kinds of boosting methods including Adaboost.M1, AdaboostSVM, Logitboost and Totalboost, S criteria and Genetic Algorithm (GA) were used, and in RF algorithm in addition to these methods, Recursive Feature Elimination (RFE) and correlation matrix were applied too. After feature selection step, training data were selected manually for cloud, cirrus and snow/ice and fed into the reflectance and thermal classifiers. Classifiers were fused in decision level using the majority vote method. The performance of different cases was compared using producer accuracy, user accuracy and kappa coefficient indexes. For almost all ensemble methods, ignoring which one of the feature selection methods applied, a high cloud and cirrus producer accuracy achieved. RFE and correlation matrix methods in RF algorithm, resulted in 99% and 100% cloud producer accuracy. These values are higher than S criteria and GA. Boosting methods, ignoring the kind of feature selection method, got higher snow/ice producer accuracy than RF algorithm by assigning higher weights to the class that has less training data among classes. Also, boosting methods resulted in higher cirrus user accuracy than RF. Among feature selection methods applied in RF, correlation matrix achieved 91% value for cirrus user accuracy. Finally, agreement to the reference map produced from MOD35 calculated. RF algorithms showed higher agreement with the reference map in comparison to the boosting methods. Highest agreement resulted from RF-RFE with the value of 76% and lowest agreement from Logitboost-GA with the value of 42%.Keywords: Ensemble Learning Methods, Feature Selection, Cloud, Snow, Ice, Cirrus, Fusion, Refelective, Thermal Classifiers
-
هدف از این پژوهش استفاده از مدل یادگیری جمعی برای ترکیب پیش بینی های مدل های جنگل تصادفی، حافظه طولانی کوتاه مدت و شبکه عصبی بازگشتی جهت ارائه یک سیستم معاملاتی الگوریتمی مبتنی بر آن می باشد. در این پژوهش یک مدل پیش بینی مبتنی بر مدل یادگیری ماشین جمعی ارائه شده است و عملکرد آن با هر یک از زیر الگوریتم ها و داده های واقعی مقایسه می شود. در این پژوهش در مرحله اول با استفاده از سه مدل یادگیری ماشین، سقف و کف قیمت بیت کوین پیش بینی شده است. در مرحله دوم، خروجی های مدل ها به عنوان متغیرهای ویژگی به مدل های XGboost و LightGBM جهت پیش بینی سقف و کف ها ارائه شده است. سپس در مرحله سوم خروجی های مرحله دوم، با الگوی دسته بندی رای گیری جمعی برای پیش بینی سقف و کف بعدی، ترکیب می شوند. داده های سقف و کف قیمت بیت کوین در تایم فریم 1 ساعته از تاریخ 1/1/2018 الی آخر 30/6/2022 به عنوان متغیر هدف و 31 اندیکاتور تحلیل تکنیکال به عنوان متغیر ویژگی برای سه مدل در مرحله اول استفاده شده اند. در نهایت مقادیر پیش بینی و سیستم های معاملاتی الگوریتمی با داده های واقعی برای 3 مدل و مدل یادگیری جمعی معرفی شده مورد ارزیابی و مقایسه قرار گرفتند. نتایج به دست آمده نشان دهنده ارتقا عملکرد دقت و صحت مدل یادگیری جمعی پیشنهاد شده در پیش بینی سقف و کف بیت کوین و همچنین، عملکرد بهتر آن نسبت به زیر الگوریتم ها می باشد
کلید واژگان: معاملات الگوریتمی, پیش بینی سقف و کف قیمت, یادگیری ماشین جمعی, XGBoost, LightGBMThe purpose of this research is to use the ensemble learning model to combine the predictions of random forest models, short-term long memory and recurrent neural network to provide an algorithmic trading system based on its. In this research, a prediction model based on ensemble machine learning model is presented and its performance is compared with each of the sub-algorithms and real data. In this research, in the first stage, using three machine learning models, the price top and bottom of Bitcoin have been predicted. In the second stage, the outputs of the models are presented as feature variables to the XGboost and LightGBM models to predict the roof and floors. Then, in the third stage, the outputs of the second stage are combined with the collective voting classification pattern to predict the next ceiling and floor. Bitcoin price top and bottom data in the 1-hour time frame from 1/1/2018 to the end of 6/30/2022 have been used as target variables and 31 technical analysis indicators as feature variables for three models in the first stage. Finally, forecast values and algorithmic trading systems were evaluated and compared with real data for 3 models and the introduced ensemble learning model. The obtained results show the improvement of the precision and accuracy of the proposed collective learning model in predicting the top and bottom of Bitcoin, as well as its better performance than the sub-algorithms.
Keywords: Algorithmic trading, Top, bottom price prediction, Ensemble machine learning, XGBoost, LightGBM -
امروزه در بازارهای مالی حجم و سرعت معاملات افزایش چشم گیری یافته است و دچار تغییر و تحولات گسترده ای شده است. تعیین استراتژی مناسب برای خرید و فروش در بورس اوراق بهادار وقتی با روندهای افزایشی وکاهشی یا نوسانی مواجه هستند بسیار مهم می باشد .لذا برای انتخاب یک استراتژی مناسب، استفاده از مدل های پیچیده فراابتکاری استفاده می شود. در این تحقیق تلاش می-شود تا با توسعه روش جدید انتخاب و بهینه سازی پرتفوی سهام مبتنی بر الگوریتم یادگیری جمعی و ژنتیک به منظور انتخاب بهترین استراتژی معاملاتی برای کسب بازدهی بیشتر و ریسک کمتر استفاده کرد. برای پیش بینی بازده و دریافت سیگنال خرید از ترکیب الگوریتم ماشین بردار پشتیبان شش کلاسه (SVM) و برای بهینه سازی قواعد معاملاتی از الگوریتم پویای ژنتیک استفاده شد ه است. برای بهبود دقت طبقه بندی بازده در این تحقیق از روش های یادگیری جمعی شامل Bagging، یکی از الگوریتم های مبتنی بر Ensemble Learning استفاده شده است .داده های مربوط به هر سهم و متغیرهای بنیادی، در یک بازه زمانی روزانه بین سالهای 1390 تا 1399 به عنوان داده های آموزش و آزمون استفاده می شود. نتایج بدست آمده درمقایسه با روش های سنتی نتایج امیدوارکننده ای داشته است.
کلید واژگان: الگوریتم ژنتیک, یادگیری ماشین, یادگیری جمعی, بهینه سازی پرتفویThe volume and speed of transactions in financial markets has increased significantly and has undergone extensive changes nowadays. Facing with increasing, decreasing or fluctuating trends in the stock market, determining the right trading strategy is very important. Therefore, complex meta-heuristic models are used for choosing a suitable strategy. In this research, an attempt is made to develop a new method of selecting and optimizing the stock portfolio based on the ensemble learning algorithm and genetics in order to select the best trading strategy to achieve greater returns and less risk. A combination of a six-class support vector machine (SVM) algorithm is used to predict returns and receive a buying signal; besides, a dynamic genetic algorithm is used to optimize trading rules. In this study, collective learning methods including Bagging, one of the algorithms based on Ensemble Learning, have been used to improve the accuracy of classification of returns. Data related to each share and fundamental variables in a daily time interval between years 1390 to 1399 is used as training and test data. The obtained results, comparing to traditional methods, are promising.
Keywords: Genetic Algorithm, Machine Learning, Ensemble Learning, Portfolio optimization -
در این مقاله با استفاده از رویکرد زمان سنجی بازار وروش های یادگیری جمعی همگن و غیر همگن به ارایه سیگنال خرید، نگهداری و فروش و پیش بینی بازار بر اساس ویژگی های بنیادی ویژگی های فنی و سری زمانی بازدهی هر شرکت در 100 روز منتهی به روز جاری پرداخته شده است. بر این اساس ، 208 شرکت که به عنوان شرکت های فعال بین سال های 1390 تا 1399 بودند، انتخاب شدند. برای آموزش داده ها توسط ماشین یادگیری جمعی دوسطحی (HHEL) و پیش بینی روند بازار بر اساس استراتژی زمان سنجی بازار ، از داده های 5 سال 1390 تا 1394 استفاده و برای تست داده ها به منزله بهینه سازی سبد سهام بر اساس بیشینه سازی بازده سبد سهام و کمینه سازی ریسک سبد سهام سرمایه گذاری، از الگوریتم های MOPSO و NSGA II استفاده و با سبد سرمایه گذاری بدست آمده با استراتژی خرید و نگهداری مقایسه شده است. نتایج نشان داد الگوریتم MOPSO بالاترین بازده سبد سهام را با 96.437 % در مقابل الگوریتم NSGA II با بازدهی 91.157 % و روش سرمایه گذاری یکسان با بازدهی 13.058 % بدست آورده است. همچنین ریسک سبد سرمایه گذاری در الگوریتم NSGA II بسیار پایین تر از ریسک سبد سرمایه گذاری در الگوریتم MOPSO به ترتیب با 0.792% و 1.367% بوده است.کلید واژگان: الگوریتم های فرا ابتکاری چند هدفه, بهینه سازی سبد سهام, زمان سنجی بازار, مدل ترکیبی (جمعی) یادگیر ی ماشینIn this article, using the market timing approach and homogeneous and inhomogeneous collective learning methods, the purchase, maintenance and sales signal and market forecast are presented based on the basic characteristics, technical characteristics and time series of returns of each company in the 100 days leading to the current day. . Based on this, 208 companies were selected as active companies between 1390 and 1399 To teach data by two-level ensemble learning machine (HHEL) and market trend forecasting based on market timing strategy, use data from 5 years 1390 to 1394 and to test the data as stock portfolio optimization based on stock portfolio maximization and risk minimization. The investment portfolio uses MOPSO and NSGA II algorithms and is compared with the obtained investment portfolio with the buy and hold strategy. The results showed that the MOPSO algorithm achieved the highest stock portfolio yield with 96.437% compared to the NSGA II algorithm with a yield of 91.157% and the same investment method with a yield of 13.058%. Also, the portfolio risk in NSGA II algorithm was much lower than the portfolio risk in MOPSO algorithm with 0.792% and 1.367%, respectivelyKeywords: Multi-objective meta-heuristic algorithms, Portfolio optimization, Market timing, Combined (ensemble) machine learning model
-
پژوهش حاضر با هدف ارائه مدل معادلات ساختاری سازمان یادگیرنده و بررسی میزان کاربست آن در دانشگاه تهران انجام شده است. روش پژوهش توصیفی- همبستگی و روش تحلیل از نوع مدل یابی معادلات ساختاری بودهاست. جامعه آماری، کارکنان دانشگاه تهران به تعداد 2730 نفر بوده است. حجم نمونه با استفاده از فرمول نمونه گیری کوکران و روش نمونه گیری تصادفی ساده، 243 نفر انتخاب شد. برای جمع آوری داده ها از پرسش نامه محقق ساخته مبتنی بر مدل پیتر سنگه(1990) با پایایی(94/0=α) استفاده شد. روایی محتوا و سازه این پرسش نامه نیز بررسی و تایید گردید. به منظور تحلیل داده ها، از روش مدل یابی معادلات ساختاری، آزمون کولموگروف-اسمیرنوف و تی تک نمونه ای استفاده شده-است. نتایج نشان داد، مدل سازمان یادگیرنده از برازش نسبتا خوبی با داده ها برخوردار بودهاست. بر این اساس، قابلیت های فردی بر الگوی ذهنی(24/0=γ) و نگرش سیستماتیک(52/0=γ) تاثیرگذار بودهاست. نگرش سیستماتیک نیز بر آرمان مشترک(51/0=β) و یادگیری جمعی(44/0=β) تاثیرگذار بوده و آرمان مشترک نیز بر یادگیری جمعی(17/0=β) تاثیر داشته است. نهایتا این که، الگوهای ذهنی بر آرمان مشترک و یادگیری جمعی و هم چنین قابلیت های فردی بر آرمان مشترک تاثیر نداشتهاست. نتایج بررسی میزان کاربست ابعاد سازمان یادگیرنده نیز نشان داد، کاربست سازمان یادگیرنده و ابعاد آن در جامعه هدف، پایین تر از حد متوسط بوده و فقط الگوهای ذهنی در حد متوسط بودهاست.کلید واژگان: سازمان یادگیرنده, مراکز آموزش عالی, دانشگاه تهران, مدل معادلات ساختاریThis study aims to provide a learning organization SEM and the application of done at Tehran University. The research method is descriptive-correlational and analytical method was SEM. The population was University of Tehran staffs on the number of 2730 people. Sample size by using Cochran sampling formula and simple random sampling, were selected 243 people. To collect data, a questionnaire based on the model of Peter Senge (1990) designed by reliability (94/0 = α). Also evaluated and approved content and construct validity. For data analysis, Kolmogorov-Smirnov structural equation modeling, and one-sample t-test, was used. The results showed that the learning organization model has been fitted to the data. Accordingly, the individual features of the paradigm (γ =0/24) and systematic approach (γ =0/52) been effective. Systematic approach to the common cause (β=0/51) and collective learning (β=0/44) and shared vision have also had an impact on collective learning (β=0/17) has had impact. Finally, mental models based on shared vision and collective learning as well as individual features common cause whatsoever. The results showed that the application of learning organization and all aspects of its application in the target population, below the average and only mental patterns was middle.Keywords: Learning organization, higher education centers, Tehran University, Structural Equation Model
-
مدلسازی زمانی-مکانی رطوبت خاک با استفاده از داده های سنجش از دور نوری-حرارتی و مدل های یادگیری ماشینبرآورد و پایش زمانی-مکانی رطوبت خاک سطحی براساس مشاهدات سنجش از دوری (نوری و حرارتی) بدلیل ماهیت فیزیکی در شرایط پوشش گیاهی متراکم چالش برانگیز است که نیاز به بهبود و افزایش دقت تخمین رطوبت خاک در این مناطق را ضروری می سازد. لذا این پژوهش با هدف توسعه یک رویکرد جدید در برآورد رطوبت خاک سطحی در مزارع کشاورزی با شرایط پوشش گیاهی متراکم، براساس ترکیب داده های سنجش از دور نوری-حرارتی و اطلاعات فیزیکی خاک با استفاده از مدل های یادگیری ماشین انجام شد. بدین منظور از 16 تصویر ماهواره لندست-8 و بیش از 430 نقطه کنترل زمینی در طول دوره رشد گیاه نیشکر در سال زراعی 1399-1398 در منطقه کشت و صنعت نیشکر حکیم فارابی خوزستان استفاده گردید. 10 سناریوی مختلف براساس متغیرهای ورودی طراحی شد و سپس توسط پنج الگوریتم یادگیری ماشین شامل رگرسیون خطی چندگانه، مدل های مبتنی بر درخت تصمیم (classification and regression tree و M5-pruned) و مدل های مبتنی بر یادگیری جمعی (رگرسیون درختان توسعه یافته و رگرسیون جنگل تصادفی) مورد ارزیابی قرار گرفتند. مطابق با نتایج، بیشترین همبستگی متغیرها با رطوبت خاک سطحی در شاخص های خیسی خاک و رطوبت خاک نرمال شده با مقادیر ضریب همبستگی برابر 79/0 و 69/0 مشاهده شد. همچنین بیشترین دقت مدل های یادگیری ماشین بر اساس آماره هایR2 ، RMSE و MAE به ترتیب در مدل های رگرسیون درختان توسعه یافته (99/0، 011/0 و 001/0) و رگرسیون جنگل تصادفی (99/0، 014/0 و 007/0) به دست آمد. به طور کلی یافته های این پژوهش بیان گر اهمیت استفاده از ویژگی های بیوفیزیکی مستخرج از دادههای ماهواره لندست-8 در ترکیب با مدل های یادگیری جمعی است که می تواند مستقل از هرگونه اندازه گیری زمینی باشد.کلید واژگان: پوشش گیاهی متراکم, خصوصیات فیزیکی خاک, رطوبت خاک, سنجش از دور, مدل های یادگیری ماشینSpatiotemporal estimation and monitoring of soil moisture based on remote sensing observations (optical and thermal) is challenging due to its physical nature in high vegetation conditions, necessitating improving and increasing the accuracy of soil moisture estimation in these areas. Therefore, this research aimed to develop a new approach to estimating surface soil moisture in agricultural fields with dense vegetation using machine learning algorithms by incorporating optical and thermal remote sensing data and soil physical properties. For this objective, 16 Landsat-8 satellite images and more than 430 control locations were used during the sugarcane crop’s growth period in 2018-2019 at the Hakim Farabi Sugarcane Agro-Industrial company in the Khuzestan province of Iran. A set of 10 scenarios of various unique combinations of the available input variables were developed and then evaluated by five machine learning algorithms, including multiple linear regression (MLR), decision tree-based algorithms (CART and M5P), and ensemble learning-based algorithms (gradient-boosted regression trees (GBRT) and random forest regression (RFR)). According to the results, the highest correlation between input variables and surface soil moisture was observed in Soil Wetness Index (SWI) and Normalized Soil Moisture Index (NSMI) with R values of 0.79 and 0.69, respectively. Also, the highest accuracy of machine learning algorithms based on R2, RMSE, and MAE results was obtained in GBRT (0.99, 0.011, and 0.006) and RFR (0.99, 0.014, and 0.007), respectively. In general, the findings of this research show the importance of using variables based on Landsat-8 remote sensing data in combination with ensemble learning algorithms that can be independent of any ground measurements.Keywords: High vegetation, machine learning algorithms, remote sensing, Soil moisture, soil physical properties
-
پیشینه واهدافصنعت بیمه درمانی در پیش بینی هزینه های بیمه افراد که براساس پارامترهای پیچیده ای مانند سن و ویژگی های فیزیکی است، با چالش مهمی مواجه است. شرکت های بیمه برای مدیریت ریسک و جلوگیری از زیان احتمالی، بیمه گذاران را به دو گروه پرخطر و کم خطر دسته بندی می کنند. بااین حال، برآورد دقیق هزینه ها برای هر فرد می تواند کار سختی باشد. برای مقابله با این چالش، ما رویکردی مبتنی بر علم داده و یادگیری ماشین را پیشنهاد می کنیم که از یادگیری جمعی برای پیش بینی افراد پرخطر و کم خطر استفاده می کند.روش شناسی: روش پیشنهادی شامل مراحل مختلفی از جمله پیش پردازش داده ها، مهندسی ویژگی ها و اعتبارسنجی متقابل برای ارزیابی عملکرد مدل است. در مرحله اول، داده ها را با پاک کردن، مدیریت مقادیر ازدست رفته و رمزگذاری متغیرهای طبقه بندی، پیش پردازش می کنیم. در مرحله دوم، ما ویژگی های جدیدی را با استفاده از روش های مهندسی ویژگی ها مانند مقیاس بندی، نرمال سازی و کاهش ابعاد تولید می کنیم. این روش ها به استخراج اطلاعات معنادار از داده ها و بهبود عملکرد مدل کمک می کند. در مرحله بعد، ما از یادگیری جمعی برای ترکیب روش های رگرسیون متعدد، مانند رگرسیون لجستیک، شبکه های عصبی، ماشین های بردار پشتیبانی، جنگل های تصادفی، LightGBM و XGBoost استفاده می کنیم. هدف از ترکیب این روش ها این است که از نقاط قوت آن ها استفاده کنیم و نقاط ضعف آن ها را به حداقل برسانیم تا به دقت پیش بینی بهتری دست یابیم. در نهایت، عملکرد مدل را با استفاده از روش اعتبارسنجی متقاطع k-fold ارزیابی می کنیم. این روش به اعتبارسنجی دقت مدل و جلوگیری از برازش بیش از حد کمک می کند.یافته هارویکرد پیشنهادی ما به AUC برابر با 73/0 دست می یابد که اثربخشی آن را در پیش بینی افراد پرخطر و کم خطر نشان می دهد.نتیجه گیریبا استفاده از علم داده و روش های یادگیری ماشین، شرکت های بیمه می توانند دقت برآورد هزینه خود را بهبود بخشند و ریسک را بهتر مدیریت کنند. این رویکرد می تواند به شرکت های بیمه کمک کند تا پوشش بیمه ای و قیمت گذاری دقیق تری را برای افراد ارایه دهند که به رضایت بیشتر مشتریان و کاهش زیان های مالی منجر می شود.کلید واژگان: داده کاوی, ریسک, هزینه بیمه درمان, یادگیری جمعی, یادگیری ماشینBACKGROUND AND OBJECTIVESThe healthcare insurance industry faces a significant challenge predicting individuals' insurance costs, which are based on complex parameters such as age and physical characteristics. Insurance companies categorize policyholders into high-risk and low-risk groups to manage risks and avoid potential losses. However, the accurate estimation of costs for each individual can be a daunting task. By leveraging data science and machine learning techniques, insurance companies can improve their cost estimation accuracy and better manage risks. This approach can help insurance companies to provide more accurate insurance coverage and pricing for individuals leading to higher customer satisfaction and lower financial losses.METHODSTo address this challenge, a data science and machine learning-based approach that uses ensemble learning to predict high-risk and low-risk individuals is used. The method involves several steps including data preprocessing, feature engineering, and cross-validation to evaluate the model's performance. The first step involves preprocessing the data by cleaning it, handling missing values, and encoding categorical variables. The second step generates new features using feature engineering techniques such as scaling, normalization, and dimensionality reduction. Next, ensemble learning is used to combine multiple regression methods such as logistic regression, neural networks, support vector machines, random forests, LightGBM, and XGBoost. By combining these methods, the aim is to leverage their strengths and minimize their weaknesses to achieve better prediction accuracy. Finally, the model's performance is evaluated using cross-validation techniques such as k-fold cross-validation. These techniques help to validate the model's accuracy and prevent overfitting.FINDINGSThe proposed approach achieves an AUC of 0.73 demonstrating its effectiveness in predicting high-risk and low-risk individuals.CONCLUSIONIn conclusion, the healthcare insurance industry can benefit greatly from data science and machine learning-based approaches. By accurately predicting high-risk and low-risk individuals, insurance companies can better manage risks and provide more accurate coverage and pricing for their customers. This can lead to the improvement of customer satisfaction and the reduction of financial losses for insurance companies.Keywords: Data mining, Ensemble learning, Healthcare insurance cost, Machin learning, risk
-
بارش یکی از مهم ترین مولفه های هیدرولوژی و هواشناسی است که پیش بینی مقادیر آن در زمینه های مختلفی همچون کشاورزی، شرب، صنعت، بهداشت، اقلیم و محیط زیست از اهمیت ویژه ای برخوردار است. با توجه به اینکه وقوع، نوع و میزان بارش به عوامل بسیار زیادی بستگی دارد، مدل سازی و پیش بینی مقدار بارش همواره دارای پیچیدگی ها و چالش های فراوان بوده است. در این پژوهش از داده های پارامترهای هواشناسی ایستگاه همدیدی تبریز شامل دماهای کمینه، بیشینه و میانگین، رطوبت نسبی میانگین، فشار هوای میانگین، سرعت باد بیشینه و بارش در مقیاس های زمانی روزانه و ماهانه در یک دوره 35 ساله (2020-1986) استفاده شد. از روش های یادگیری ماشین و یادگیری جمعی شامل شبکه عصبی مصنوعی پرسپترون چندلایه (MLP)، جنگل تصادفی (RF)، آدابوست (AB)، تقویت گرادیان (GB)، درختان اضافی (ET) و مدل رگرسیون درخت تصمیم (DTR) برای مدل سازی بارش استفاده شد. بدین منظور 70 درصد از داده ها برای آموزش و 30 درصد از داده ها نیز برای آزمون مدل ها در نظر گرفته شدند. برای ارزیای مدل های مورد استفاده، از معیارهای آماری ضریب همبستگی (R)، جذر میانگین مربعات خطاها (RMSE)، میانگین خطای مطلق (MAE) و کلینگ گوپتا (KGE) استفاده شد. مطابق نتایج این تحقیق در مقیاس روزانه مدل MLP با 993/0R=، 184/0RMSE= میلی متر، 184/0=MAE میلی متر و 82/0=KGE و مدل ET با 986/0R=، 324/0RMSE= میلی متر، 324/0=MAE میلی متر و 75/0=KGE و در مقیاس ماهانه به ترتیب مدل MLP با 999/0=R=، 153/0=RMSE میلی متر، 222/0=MAE میلی متر و 88/0=KGE و مدل ET با 981/0=R=، 266/0R=MSE میلی متر، 197/0=MAE میلی متر و 71/0=KGE از بیشترین دقت و کمترین خطا برخوردارند. به طورکلی نتایج این پژوهش نشان دهنده عملکرد بسیار مناسب مدل های یادگیری ماشین و یادگیری جمعی در مدل سازی بارش در هر دو مقیاس زمانی روزانه و ماهانه است.
کلید واژگان: بارش, جنگل تصادفی, درختان اضافی, یادگیری جمعی, شبکه های عصبی مصنوعیPrecipitation is one of the most important components of hydrology and meteorology, and the prediction of its values are important in various fields, such as agriculture and the environment. Considering that the occurrence of precipitation and its amount depend on many factors, the modeling of precipitation has many complications. In this research, the meteorological data of Tabriz synoptic station including minimum, maximum and average temperature, relative humidity, air pressure, maximum wind speed and precipitation in the period of 1986-2020 were used. The machine learning and ensemble learning methods including Multi Layer Perceptron (MLP), Random Forest (RF), Ada Boost (AB), Gradient Boost (GB), Extra Trees (ET) and Decision Tree Regression (DTR) models were used for rainfall modeling. 70% of the data was used for training and 30% for testing the models. The statistical criteria of Coefficient of Correlation (R), Root Mean Square Error (RMSE), Mean Absolute Error (MAE) and Kling-Gupta Efficiency (KGE) were used to evaluate the models. According to the results, on daily scale the MLP model with R=0.993, RMSE=0.184 mm, MAE=0.184 mm and KGE=0.82, and the ET model with R=0.986, RMSE=0.324 mm, MAE=0.324 mm and KGE=0.75, respectively, and on monthly scale the MLP model with R=0.999, RMSE=0.153 mm, MAE=0.222 mm KGE=0.88, and the ET model with R=0.981, RMSE=0.266 mm, MAE=0.197 mm and KGE=0.71, respectively, have the highest accuracy. Overall, the results show that machine learning and ensemble learning models perform well in predicting daily and monthly rainfall.
Keywords: Artificial Neural Networks, Ensemble Learning, Extra Trees, Precipitation, Random Forest
-
از آنجا که گزینه «جستجوی دقیق» غیرفعال است همه کلمات به تنهایی جستجو و سپس با الگوهای استاندارد، رتبهای بر حسب کلمات مورد نظر شما به هر نتیجه اختصاص داده شدهاست.
- نتایج بر اساس میزان ارتباط مرتب شدهاند و انتظار میرود نتایج اولیه به موضوع مورد نظر شما بیشتر نزدیک باشند. تغییر ترتیب نمایش به تاریخ در جستجوی چندکلمه چندان کاربردی نیست!
- جستجوی عادی ابزار سادهای است تا با درج هر کلمه یا عبارت، مرتبط ترین مطلب به شما نمایش دادهشود. اگر هر شرطی برای جستجوی خود در نظر دارید لازم است از جستجوی پیشرفته استفاده کنید. برای نمونه اگر به دنبال نوشتههای نویسنده خاصی هستید، یا میخواهید کلمات فقط در عنوان مطلب جستجو شود یا دوره زمانی خاصی مدنظر شماست حتما از جستجوی پیشرفته استفاده کنید تا نتایج مطلوب را ببینید.
* ممکن است برخی از فیلترهای زیر دربردارنده هیچ نتیجهای نباشند.
-
معتبرحذف فیلتر