به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت

جستجوی مقالات مرتبط با کلیدواژه « درخت تصمیم » در نشریات گروه « عمران »

تکرار جستجوی کلیدواژه «درخت تصمیم» در نشریات گروه «فنی و مهندسی»
  • علی توکلی کاشانی*، علی مدقالچی، اعظم محمدی، محمد جزونقی

    بیشترین سهم تصادفات در جهان مربوط به کشورهای با درآمد متوسط و پایین است. از طرفی، آمار مجروحین و فوتی ها در تصادفات ترافیکی ایران رو به افزایش است؛ که بیانگر لزوم توجه و تمرکز بیش از پیش بر تحلیل تصادفات ترافیکی و یافتن علل موثر بر شدت تصادفات به منظور ارتقاء ایمنی راه های کشور و کاهش پیامدهای ناشی از آن می باشد. در مطالعه ی حاضر سعی شده است مهم ترین عوامل موثر بر شدت تصادفات برون شهری استان زنجان با دو مدل ماشین بردار پشتیبان و درخت تصمیم شناسایی شوند. بدین منظور از 25 هزار داده های تصادفات استان طی 9 سال اخیر استفاده شده است. پس از فرآیند پاکسازی داده ها، مدل ها در محیط برنامه نویسی پایتون توسعه داده شدند. نتایج تحلیل ها نشان داد در مدل ماشین بردار پشتیبان، نحوه تصادف، نوع وسیله و کیلومتر وقوع تصادف، و در مدل درخت تصمیم نحوه تصادف، نوع وسیله مقصر و کیلومتر وقوع تصادف به ترتیب سه متغیر دارای اهمیت برای پیش بینی شدت این تصادفات هستند. هم چنین بطور کلی درخت تصمیم قدرت پیش بینی بیش تری دارد و دقت این مدل در جراحات شدیدتر بیش تر از ماشین بردار پشتیبان می باشد.

    کلید واژگان: شدت تصادف, درخت تصمیم, ماشین بردار پشتیبان, تصادفات جاده ای, ایمنی ترافیک}
    Ali Tavakoli Kashani *, Ali Medghalchi, Azam Mohammadi, Mohammad Jazvanaqi

    Traffic crashes are a significant problem in low and middle-income countries, while there is a worrying trend of increasing fatal and injury crashes Iran. This highlights the urgent need to analyze the causes of such accidents to improve road safety and reduce their negative consequences. To address this issue, a study was conducted to investigate the factors that contribute to the severity of rural crashes in Zanjan province, using advanced machine learning models such as Support Vector Machine and Decision Tree. The study utilized a crash database of 25,000 incidents over a 9-year period, and after cleaning the data, the models were developed in Python. The findings suggest that “type of crash”, “at-fault driver's vehicle type”, and “kilometer occurrence of the crash” are key variables for predicting the severity of these crashes. The Decision Tree model was also found to be more accurate than the Support Vector Machine model, particularly in predicting severe crashes. This study provides valuable insights for improving road safety and reducing the harmful effects of traffic crashes in rural areas.

    Keywords: Crash Severity, Decision Tree, Support Vector Machine, Rural Crashes, Traffic Safety}
  • سارا حق بیان*، بهنام تشیع، مریم حسینی

    مدلسازی دقیق تغییرات مکانی-زمانی نیازمند روش مناسب و داده های کامل و دقیق است. داده ها از حسگرهای ایستگاه های پایش جمع آوری می شوند. تعداد این ایستگاه ها محدود است و به دلیل عوامل اجتناب ناپذیر بخشی از داده ها از دست می روند. نوآوری مقاله حاضر، غلبه بر محدودیت های روش های موجود در جانهی مقادیر از دست رفته PM2.5 است. محدودیت روش های موجود، عدم توجه همزمان به مکانیسم مکانی-زمانی داده های از دست رفته است. به منظور غلبه بر محدودیت های روش های موجود، جانهی مقادیر از دست رفته  PM2.5 همراه با در نظر گرفتن روابط بین متغیرها با حفظ تغییر پذیری و عدم قطعیت طبیعی آن ها، با استفاده از مدل های درخت اضافی و درخت تصمیم پیاده سازی گردید. نتایج نشان داد که روش درخت اضافی به دلیل کاهش سوگیری با میانگین 0.80=R2 دقت بالاتری از روش درخت تصمیم با میانگین 0.64=R2  در جانهی مقادیر از دست رفته PM2.5دارد. پس از مدیریت داده های از دست رفته با استفاده از روش درخت اضافی، از روش XGBoost به دلیل ارزیابی غیرخطی اهمیت متغیرهای موثر با هدف افزیش دقت و کاهش هزینه محاسباتی برای مدلسازی تغییرات مکانی-زمانی آلاینده PM2.5 در بافت های مختلف جغرافیایی کلانشهر تهران استفاده گردید. متغیرهای موثر درنظرگرفته شده برای جانهی و مدلسازی شامل داده های هواشناسی و سایر آلاینده های اصلی نظیر O3،Pm10،Co،So2، No2  است. متغیرهای هواشناسی شامل مجموع بارش، رطوبت نسبی، دما از مدل ECMWF استخراج گردیدند. استفاده از مدل ECMWF علاوه بر افزایش تعداد ایستگاه هواشناسی، امکان استفاده از رزولوشن یک ساعتی با تعداد بسیار ناچیز داده از دست رفته را در مقابل تعداد محدود، رزولوشن سه ساعتی با تعداد زیاد داده از دست رفته هواشناسی را فراهم می کند.

    کلید واژگان: PM2.5, داده های از دست رفته, یادگیری ماشین, درخت اضافی, درخت تصمیم, XGBoost}
    Sara Haghbayan*, Behnam Tashayo, Maryam Hosseinii

    Management of exposure and dealing with the consequences of the concentration of PM2.5 in urban environments requires accurate modeling of spatial-temporal changes of pollutant. Accurate modeling of spatial-temporal changes requires appropriate modeling methods and complete and accurate data. These data are measured by different sensors and with different accuracy, have different variability and due to unavoidable factors such as sensor damage. Missing data cause many problems such as loss of sample size and errors in data analysis; therefore, it is necessary to use solutions to estimate the missing data in modeling the concentration of PM2.5.  In this study, a method based on extra tree and decision tree models has been proposed to imputation the missing values of PM2.5 along with considering the relationships between variables while maintaining their variability and natural uncertainty. Meteorological variables and other main pollutants such as O3, Pm10, Co, So2, No2 were considered as effective variables in imputation the missing values of PM2.5. Meteorological variables including total precipitation, relative humidity, and temperature were extracted from the model of the European Center for medium-term weather forecasting. Using the ECMWF model, in addition to increasing the number of meteorological stations, provides the possibility of using hourly resolution with a very small number of missing data, as opposed to a limited number of three-hour resolutions with a large number of missing meteorological data. The results showed that the extra tree method has a higher accuracy than the decision tree method with an average of R2=0.813 due to the reduction of bias with an average of R2=0.653 in imputation of missing PM2.5 values. After managing the missing data using the extra tree method, the XGBoost method was used due to the non-linear evaluation of the importance of the effective variables with the aim of increasing the accuracy and reducing the computational cost for modeling the spatial-temporal changes of the PM2.5 pollutant in different geographical contexts.

    Keywords: PM2.5, Missing data, Machine learning, Extra tree, Decision tree, XGBoost}
  • محمدرضا نقدی زاده، مهدی شکرگذار*، امید رفیعی، عمار ناظریان
    امروزه ایمنی راه ها و معابر یکی از مهمترین مساله های صنعت حمل و نقل به شمار می رود. در این میان زیرساخت های فنی و مهندسی نظیر خط کشی های شبکه معابر یکی از عوامل موثر در تردد ایمن رانندگان به شمار می رود. حصول کیفیت مناسب خط کشی های ترافیکی و حداکثر ماندگاری به گونه ای که رنگ مورد استفاده علاوه بر دوام، دارای بازتاب مناسب در طول دوره خدمت دهی باشد، از چالش های موجود در این حوزه به شمار می رود. راهکار نیل به این اهداف با انتخاب صحیح نوع رنگ اجرایی برای عملیات خط کشی متناسب با شرایط مختلف است. عوامل متعددی نظیر وضعیت روسازی، وضعیت بازتاب، وضعیت خرابی فیزیکی رنگ، درجه اهمیت معبر، فصل اجرا، ضخامت رنگ موجود بر انتخاب نوع اجرای خط کشی مجدد تاثیرگذار است که بر اساس همین شرایط، نوع رنگ مورد استفاده باید تعیین گردد. در این مقاله سعی بر شناسایی عوامل موثر بر اجرای خط کشی های معابر با استفاده از مدل درخت تصمیم است. در همین راستا، پس از تشکیل پایگاه داده مورد نیاز، فرآیند شناسایی عوامل تاثیر گذار بر مبنای شاخص اهمیت متغیر (VIM) و الگوریتم رشد CART (با استفاده از معیار Gini Index) برای ساخت مدل استفاده شده است. نتایج نشان می دهد که وضعیت بازتاب خط کشی و درجه اهمیت معبر، مهمترین عوامل تاثیرگذار در تعیین نوع خط کشی اجرایی می باشد.
    کلید واژگان: شبکه معابر, ایمنی, اجرای خط کشی, شاخص های تاثیرگذار, درخت تصمیم}
  • علی توکلی کاشانی*، سعیده امیری فر

    عبور از چراغ قرمز یکی از رایج ترین انواع تخلفات در تقاطعات چراغ دار است که می تواند خسارت های جانی و مالی فراوانی را به دنبال داشته باشد. این مطالعه با استفاده از درخت تصمیم CART به شناسایی مهم ترین ویژگی های رانندگان که بر شدت جراحت آنان در تصادفات عبور از چراغ قرمز شهر اصفهان موثر بوده است می پردازد. برای این منظور از حدود ده هزار داده ی تصادف عبور از چراغ قرمز شهر اصفهان طی پنج سال اخیر بهره گرفته شد. شناسایی عوامل مهم بر مبنای «شاخص اهمیت متغیر» انجام شد و از ماتریس درهم ریختگی برای ارزیابی مدل استفاده شد. نتایج نشان داد استفاده از کمربند ایمنی، شغل راننده، تجربه ی رانندگی و سن راننده به ترتیب مهم ترین عوامل تاثیرگذار در آسیب دیدن رانندگان برای این نوع تصادفات هستند. شناخت این عوامل انسانی می تواند در برنامه ریزی های رسانه ای و فرهنگی و بهبود سطح ایمنی کمک شایانی نماید.

    کلید واژگان: تصادفات عبور از چراغ, درخت تصمیم, داده کاوی}
  • داود بیکی حسن*، مسعود اسمعیل زاده
    امروزه روش های مختلف سنجش از دور یکی از کاربردی ترین روش ها در حوزه اکتشافات معدنی در مناطق کوهستانی، مرزی و فاقد نمونه های ژیوشیمی و رسوبات آبراهه معتبر در مرحله شناسایی محسوب می گردد. روش های طیفی نظیر فیلتر تنظیم پیکسل های مخلوط همسان (MTMF)، نقشه بردار زاویه طیفی (SAM) و ناآمیختگی طیفی خطی (LSU) بر اساس طیف هر پیکسل تصویر عارضه های مختلف را شناسایی می کنند. این مطالعه به منظور تعیین مناطق آلتراسیون، تفکیک سنگ ها و کانی های مختلف، طبقه بندی تصاویر و در نهایت تعیین مناطق مستعد و امیدبخش کانی سازی افیولیتی، سرپانتینیت ها، هاربورژیت های سرپانتینی شده، لیستونیت ها، کرومیت و منگنز در محدوده سیاه چشمه و دیزج صورت گرفته است. در مرحله پردازش از روش نوین ساعت شنی اتوماتیک (ASH) مبتنی بر روش های طیفی مذکور به منظور تعیین مناطق دگرسان شده و تفکیک کانی ها استفاده شده است. به منظور طبقه بندی تصاویر نیز از روش های شبکه عصبی کانولوشن عمیق (CNN)، ماشین بردار پشتیبان (SVM) و درخت تصمیم J48 (DT) استفاده شده است. در نهایت نیز عملکرد مدل های مختلف براساس معیارهای ارزیابی مختلف مقایسه و مدل CNN با دقت و صحت 98% نسبت به دو مدل SVM و DT با دقت و صحت 96% به عنوان بهترین مدل برای تهیه نقشه کلاسه بندی استفاده شده است.
    کلید واژگان: دورسنجی, ساعت شنی اتوماتیک, شبکه عصبی کانولوشن, ماشین بردار پشتیبان, درخت تصمیم}
    Davud Beikihassan *, Masoud Esmailzadeh
    Nowadays, different Remote Sensing methods are one of the most practical methods in the field of mineral exploration in mountainous, border areas and without valid geochemical samples and waterway sediments in recognition phase. Spectral methods such as Mixture Tuned Matched Filtering, Spectral Angle Mapper and Linear Spectral Unmixing. The spectrum of each pixel in the image identifies different effects. This study was conducted to determine the areas of alteration, separation of different rocks and minerals, classification of images and finally to determine high potential areas of Ophiolite mineralization, Serpentinites, serpentinized harbors, Listvenites, Chromite and Manganese in Siahcheshmeh and Dizajj areas. In the processing stage, the new Automated Spectral Hourglass method based on spectral methods has been used in order to determine the altered areas and separate the minerals. In order to classify the images, Deep Convolutional Neural Network (CNN), Support Vector Machine (SVM) and Decision Tree J48 (DT) have been used. Finally, the performance of different models was compared based on different evaluation criteria and the CNN model with 98% accuracy compared to the two SVM and DT models with 96% accuracy has been used as the best model for preparing the classification map.
    Keywords: Remote Sensing, Automated Spectral Hourglass, Convolutional Neural Network, Support vector machine, Decision Tree}
  • هادی فرهادی، علی اسماعیلی، محمد نجف زاده*

    سیل یکی از بلایای طبیعی می باشد که به زیر ساخت های شهری، زمین های کشاورزی و منابع طبیعی خسارات جبران ناپذیری وارد می نماید. لذا دستیابی به اطلاعات جامع در مورد عوامل موثر بر میزان قدرت تخریب سیل می تواند در برآورد میزان خسارت وارده مفید واقع شود. از این رو، در این تحقیق، هدف ایجاد پایگاه داده پارامترهای تاثیر گذار در قدرت تخریب سیل به صورت موردی با بکارگیری تصاویر ماهواره لندست-7 با سنجنده ETM+ و داده های DEM ASTER می باشد که در آن از روش داده کاوی درخت تصمیم استفاده شده است. در این تحقیق پارامترهای محیطی نظیر پوشش گیاهی، شیب طبیعی زمین و جهت شیب به منظور ارزیابی قدرت تخریب سیل در منطقه مورد مطالعه در نظر گرفته شده اند و مدل درخت تصمیم با استفاده از این معیارها ایجاد شد. درنهایت براساس این پارامترها، تعداد پیکسل های تغییر یافته (بعد از وقوع سیلاب) در منطقه مورد مطالعه 692361 می باشد که بیانگر 49/62312 هکتار اراضی تخریب شده در منطقه مورد مطالعه است. با توجه به یافته های تحقیق حاضر، اراضی با ویژیگی های پوشش گیاهی کم، به عبارت دیگر دارای شاخص پوشش گیاهی تفاضلی نرمال شده (NDVI) بین 2/0 تا 4/0، شیب پایین 0 تا 45 درجه و جهت شیب جنوبی بیشترین تخریب ناشی از سیل را دارند. همچنین مناطقی که دارای NDVI متراکم، شیب زیاد و جهت شیب شمالی می باشند، کمترین تاثیر را از سیل می پذیرند. در نهایت، می توان نتیجه گرفت که روش داده کاوی درخت تصمیم با افزایش متغیرهای ورودی دقت و کیفیت بهتری در تعیین پارامترهای موثر در برآورد قدرت تخریب سیل ارایه می دهد.

    کلید واژگان: سیل, درخت تصمیم, داده کاوی, تشخیص تغییرات, لندست-7}
    Hadi Farhadi, Ali Esmaeily, Mohammad Najafzadeh *

    Floods, as one of the natural disasters, cause irreparable damages to urban infrastructures, agricultural lands, and natural resources. Therefore, access to comprehensive information on effecting factors the extent of flood damage can be useful in estimating the extent of damage. Therefore, the aim of this study was to create a database of Effective parameters on flood destruction power using case study of Landsat-7 satellite images with ETM+ sensor and ASTER DEM data using decision tree data mining method. In this study, environmental parameters such as canopy, natural slope, and slope direction were considered in order to evaluate flood degradation power in the study area and the decision tree model was created using these criteria. Finally, based on these parameters, the number of changed pixels (after the flood) in the study area is 692361 which indicates 62312.49 hectares of degraded land in the study area. According to the findings of the present study, lands with low canopy characteristics, namely normalized differential vegetation index (NDVI) between 0.2 to 0.4, low slope 0 to 45 degrees and Southern slope direction caused the most damage caused by floods. Also, areas with dense NDVI, high slope, and northern slope orientation have preventative influence on floods-caused-damages. Finally, it can be concluded that the decision tree, as data mining method is capable of yeilding better accuracy and quality in determining the effective parameters in estimating flood destruction power by increasing the input variables.

    Keywords: Flood, Decision Tree, Data Mining, Change Detection, Landsat-7}
  • محمد حمیدی نیا، محمد مهدی خبیری*، مهدی مخبری

    اجرای آسفالت یکی از مهم ترین پارامترهای کیفیت روسازی آسفالت بوده که همواره در هر پروژه پخش آسفالت باید به آن دقت نمود. هدف از این پژوهش، بررسی عملکرد شبکه عصبی مصنوعی و الگوریتم درخت تصمیم و پیش بینی پارامترهای طرح اختلاط و میدانی موثر بر تراکم روسازی بوده تا با شناسایی و کنترل این پارامترها بتوان مقدار پارامتر تراکم را کنترل نمود. در این تحقیق، با استفاده از داده های جمع آوری شده از گزارش تعیین تراکم نسبی آسفالت، گزارش منحنی دانه بندی و نتایج آزمایش های آسفالت گرم و گزارش طرح اختلاط آسفالت همچنین با به کارگیری الگوریتم درخت تصمیم و شبکه عصبی مصنوعی به پیش بینی پارامترهای موثر بر تراکم پرداخته شده است. نتایج نشان می دهد داده هایی که دارای دمای پخش بین 126 تا 155 درجه سانتی گراد، درصد شکستگی در دو جبهه بیشتر از 95.5%، استحکام (مقاومت مارشال) کمتر از 1417.5 کیلوگرم- نیرو و فضای خالی کمتر از 5.45% بودند، تراکم در آنها دارای مقدار مناسب (بیشتراز 97%) بود. در نتیجه، این پارامترها موثرترین پارامترها در طرح اختلاط آسفالت معرفی شد.

    کلید واژگان: روسازی آسفالتی, تراکم, داده کاوی, درخت تصمیم, شبکه عصبی مصنوعی}
    Mohammad Hamidinia, MohammadMehdi Khabiri *, Mehdi Mokhberi

    Asphalt construction is one of the most important parameters of asphalt pavement quality that should always be carefully considered in any asphalt pavement project. The purpose of this study was to evaluate the performance of the decision tree algorithm and artificial neural network in predicting mixture and field design parameters affecting pavement compaction in order to identify and control these parameters to control the compaction parameter value. In this study, we used data collected from relative asphalt compaction determination report, grain curve report and results of hot asphalt experiments and asphalt mix design report recovered from soil mechanics laboratory and using decision tree and artificial neural network algorithm have been proposed to predict the parameters affecting compaction. The results show that data with a distribution temperature between 126 and 155°C, fracture rates in two sides greater than 95.5%, strength (Marshall Resistance) less than 1417.5 kg-force, and Asphalt Void less than 5.45 had a good compaction rate (more than 97%). Also, three parameters of thickness, distribution temperature, and void were introduced as influence variables affecting compaction in the software.

    Keywords: Asphalt pavement, Density, Data Mining, Decision Tree, Artificial Neural Network}
  • امیررضا مهدوی*، مهرسا مبین، یاسر تقی زاده، علیرضا کهندانی تفرشی

    با توجه به چالش های زیست محیطی روزافزون، امروزه شیوه های حمل و نقل همگانی پاک بسیار مورد توجه قرار گرفته اند. برای بکارگیری اتوبوس های برقی باتری که از سوخت پاک بهره می برند محدودیت هایی همچون میزان پیمایش روزانه وجود دارد. از این رو در این پژوهش سعی بر آن شده که با استفاده از داده های 204 خط اتوبوسرانی شهر تهران (به جز سامانه اتوبوسرانی تندرو) و روابط پیشنهادی برای میزان مصرف انرژی، میزان پیمایش روزانه اتوبوس ها در تمامی خطوط شهر تهران با استفاده از شبیه سازی حرکت اتوبوس محاسبه شود. همچنین با استفاده از نتایج شبیه سازی، یک مدل درخت تصمیم نیز برای تعیین خطوطی که امکان بکارگیری اتوبوس برقی باتری را دارند، پرداخت می گردد. نتایج شبیه سازی حاکی از آن است که در 132 امکان بکارگیری اتوبوس برقی باتری وجود دارد که متوسط مصرف انرژی در این خطوط 9/92 کیلووات ساعت است. همچنین نتایج مدل درخت تصمیم بیانگر آن است که شیب مسیر بیشترین تاثیر را در امکان بکارگیری اتوبوس برقی دارد و متغیرهای سرعت متوسط و تعداد مسافران در رتبه های بعدی قرار می گیرند که این نتایج کاملا با نتایج تحلیل حساسیت مصرف انرژی مطابقت دارد.

    کلید واژگان: اتوبوس برقی, شبیه سازی مصرف انرژی, درخت تصمیم, اتوبوس برقی باتری}
  • محمد حمیدی نیا، محمد مهدی خبیری*، مهدی مخبری

    عوامل یا پارامترهای زیادی بر تراکم میدانی مخلوط آسفالتی، تاثیر می گذارد از آنجا که تعداد متغیرهای موثر بر تراکم زیاد و برخی بر یکدیگر اثر می گذارند، تعیین یک رابطه ی درونیابی ثابت تقریبا غیر ممکن است. داده کاوی و تکنیک های آن راهکاری برای کشف دانش پنهان بین متغیرهای وابسته و مستقل است، همچنین روابط غیر مستقیم و غیر خطی را می تواند با تقسیم بندی داده ها در گروه ها یا برگ، در درخت تصمیم شناسایی کند. در این مطالعه، تکنیک های رایج داده کاوی در مهندسی عمران، شامل شبکه عصبی، رگرسیون خطی و درخت تصمیم، به عنوان ابزار تحلیلی مورد استفاده قرار می گیرد. با تاکید بر کاربرد روش درخت تصمیم، با هدف بررسی مدل های کشف دانش و ارایه پیش بینی، سایر ابزار های داده کاوی نامبرده برای کمک به ساخت وارزیابی مدل ساخته شده، بکار گرفته می شوند. متغیر های توضیحی که در سه ابزار آماری این مطالعه مورد استفاده قرار می گیرند، شامل: درصدفضای خالی، مقاومت مخلوط آسفالتی، دانه بندی سنگدانه ها، درصدقیر، نرمی مخلوط آسفالتی می باشد. نتایج نشان می دهد متغیرهای درصدفضای خالی مصالح سنگی، درصد عبوری الک شماره ی 200 و شماره ی4 و درصدقیر تاثیر بیشتری بر نتایج تراکم و چگالی مخلوط آسفالتی داشته اند. همچنین مدل رگرسیون خطی چندگانه با ضریب همبستگی نزدیک به یک بین چگالی مخلوط آسفالتی و متغیرهای تاثیرگذار بر آن ارایه شد.

    کلید واژگان: طرح اختلاط, مخلوط آسفالتی, داده کاوی, کنترل کیفیت تراکم, خرابی روسازی, درخت تصمیم}
    Mohammad Hamidinia, Mohammad Mehdi Khabiri *, Mehdi Mokhberi

    Many factors or parameters influence the field density of asphalt mixes. Since the number of variables affecting a large and somewhat different compacts affects each other, it is almost impossible to determine a constant interpolation relationship. Data mining and its techniques are a way of discovering hidden knowledge between dependent and independent variables, as well as indirect and nonlinear relationships can be identified by dividing the data into groups or leaves in the decision tree method. In this study, commonly used data mining techniques in civil engineering, including the neural network, logistic regression and decision tree. By emphasizing the application of decision tree method, with the aim of exploring knowledge models and providing predictions, other data mining tools are used to assist in constructing and evaluating the developed satistical model. The explanatory variables used in the three models of this study are the percentage of void, asphalt mix strength, aggregate size, bitumen percentage, asphalt mix flow. The results show that the percentage of void content of stone materials, the percentage of passage of sieve 200 and 4, and the bitumen percentage had a greater effect on the density and compaction of asphalt mixture. Also, a multiple linear regression model with a correlation coefficient of nearly one between the density of asphalt mixture and variables were presented.

    Keywords: mixing design, Asphalt mix, Data mining, Concentration Quality Control, pavement failure, decision tree}
  • اردلان بادامی، روزبه قوسی، محمد سعیدی مهرآباد
    در این مطالعه داده های تخلفات شرکت اتوبوسرانی تهران با استفاده ازتکنیک های داده کاوی مورد بررسی و به کشف دانش پنهان میان داده ها پرداخته شده است. در ابتدا داده های تخلفات شرکت های پیمانکار اتوبوسرانی تهران در حدفاصل سال های 1391 تا 1394 جمع آوری و جهت ورود به نرم افزار آماده سازی گردید. در مرحله بعد با بهره مندی از الگوریتم های قوانین انجمنی و درخت تصمیم جهت استخراج دانش استفاده شده است. تعیین شرکت های با میزان عملکرد پایین و تخلفات با فراوانی زیاد و ارتباط رخداد آن ها در فصول مختلف از جمله نتایج قابل توجهی است که بعنوان خروجی الگوریتم های مورد استفاده محسوب می گردد. مدیران عالی سازمان ها به منظور تصمیم گیری در شرایط عدم قطعیت نیاز دارند که از سیستم های تصمیم یار بهره مند شوند. نتایج خروجی تحقیق این مکان را فراهم می نماید که به منظور دستیابی یکی از اهداف عالی سازمان که رضایت شهروندی است، مدیران سازمان را در تامین دانش برای اتخاذ تصمیم یاری نمایند. ریشه یابی علل رخداد تخلفات و تعیین فصول و ماه های پرتکرار از منظر تخلفات، می تواند باعث تدوین دستورالعمل ها و رویه های بهبود در شرکت اتوبوسرانی گردد که ضمن کنترل شرایط موجود، شرکت های پیمانکار را ملزم به اجرای دقیق قوانین و کاهش رخداد تخلفات می نماید. به هر حال این یک واقعیت است که به منظور دستیابی به شرایط باثبات و پایدار برای تمامی واحدهای تولیدی، صنعتی و خدماتی همانند مطالعه موردی موردنظر، توجه به رضایت مشتری لازم و ضروری است.
    کلید واژگان: داده کاوی, درخت تصمیم, سیستم پشتیبان تصمیم, قوانین انجمنی}
    Ardalan Badami, Rouzbeh Ghousi, Mohammad Saidi Mehrabad
    Using Data Mining techniques, the committed violations by Tehran Bus Company have been analyzed and consequently the hidden knowledge among data has been discovered in this research. First, the data from committed violations by Tehran Bus Company within 2012 to 2015 have been gathered and made ready for the program. The next stage is to extract knowledge through the algorithms of Association Rules and Decision Tree. Identifying the companies with poor performance and high rate of violations and considering the obvious correlation between them in different seasons are among the noteworthy results which are the outputs of the above-mentioned algorithms. The chief managers of organizations should use the Decision Support Systems (DSS) to make decisions in case of uncertainty. The results of the research help managers make decisions about achieving the ultimate organizational goal which is the satisfaction of people. Finding the root of the violations and determining the frequent seasons and months in which the violations are committed can be the cause of instructions and procedures which obligate contractors to precise implementation of regulations, decrease of committed violations and on the whole, improvement in Bus Company. It is a fact, attention to customer satisfaction as a significant and effective factor is essential for achieving stable and sustainable states in all production and industrial units and services firms such as research case study
    Keywords: Data mining, Decision Support systems, Association rules, Decision tree}
  • مسعود سمایی، مسعود رنجبرنیا *، مسعود زارع نقدهی
    شاخص تردی (شکنندگی) سنگ یکی از مهم ترین پارامترهای موثر بر حفاری های زیرزمینی به ویژه در حفاری با ماشین (TBM) به حساب می آید که محاسبه دقیق این پارامتر برای طراحی های ژئوتکنیکی بسیار مهم و کاربردی است. در این مقاله، شاخص تردی سنگ با استفاده از دو روش رگرسیون چند متغیره غیر خطی و همچنین درخت رگرسیون CART بر روی پایگاه داده شامل 48 ردیف داده ای از 30 پروژه تونل سازی مختلف پیش بینی شده است. این پایگاه داده ای بازه قابل قبولی از اعداد را در بر می گیرد که شامل مقاومت فشاری، مشاومت کششی و وزن مخصوص انواع مختلفی از سنگ ها است. علاوه بر مقاومت تک محوری سنگ، مقاومت کششی برزیلی و وزن مخصوص، جنس سنگ به عنوان پارامتر چهارم در ارائه معادله و توسعه درخت پیش بینی تردی سنگ لحاظ شده است. معادله پیشنهاد شده در این مطالعه دارای ضریب تشخیص 91/0R2= و درخت رگرسیون توسعه داده نیز دارای ضریب تشخیص 94/0 R2=است. با توجه به اعمال جنس سنگ به صورت کد عددی در پیش بینی ها مشاهده شد که اعمال این کد نه تنها باعث کاهش دقت در پیش بینی ها نمی شود، بلکه باعث افزایش آن و باعث درک بهتری از معادلات و روش های پیش بینی نیز می شود.
    کلید واژگان: شاخص تردی, شکنندگی, سنگ, رگرسیون چند متغیره, درخت تصمیم}
    Masoud Samaie, Masoud Ranjbarnia*, Masoud Zare Naghadehi
    From 1960s several attempts have been made to measuring the rock brittleness index BI. Schwartz (1964) using results of a series of triaxial tests on rock samples, stated that the rock’s behavior from frangibility to ductility happens in 4.3 ratios of principal stresses. Altindag (2002; 2003) introduced a new method for prediction of the BI by the division of the uniaxial compressive strength (UCS) of the rock to Brazilian tensile strength (BTS). In the late 1960s punch penetration test (PPT) introduced by Handewith (1971) to measure some physical properties of rock sample related to hardness and toughness of rock. Yagiz (2006) stated that the PPT’s results for measuring the BI have a very high correlation with TBM penetration rate. Although the PPT has very delightful results, application of this test is very expensive and needs much time as well.
    Since 2002, researchers have made some efforts to predict the BI results acquired by PPT. Yagiz (2009) using 48 sets of 30 different tunnel rock’s PPT test data, introduced a new linear multivariable equation for prediction of the BI. In that equation, 3 major rock’s physical properties as UCS, BTS and unit weight were used. Also, Yagiz (2010) introduced a new nonlinear multivariable equation and improved the accuracy of prediction from R2=0.88 to R2=0.89. As well Khandewal et al (2016) developed a new equation using Genetic Programming (GP) based on Yagiz (2009) data with R2=0.90, but none of these equations include the type of rock as a major factor that influences the BI. In the present study, the BI will be investigated by considering the rock type (or texture) as an important parameter, and a new nonlinear multivariable equation will be introduced. As well using a classification and regression tree (CART) a new attempt will be made to predict the PPT’s result for the BI.
    Keywords: Brittleness index, Rock, Nonlinear multivariable regression, Classification, Regression Tree (CART)}
  • عبدالرضا صفری، سعید همایونی، ایمان خسروی *
    تصاویر نوری و راداری با دریچه ی مصنوعی تمام قطبیده (PolSAR) ، منابع ارزشمندی برای طبقه بندی زمین های کشاورزی است. ویژگی های مستخرج از تصاویر نوری حاوی اطلاعاتی در مورد امضای بازتابی محصولات مختلف است. در مقابل، یک تصویر PolSAR فراهم کننده ی اطلاعاتی در مورد خصوصیات ساختاری و سازوکارهای پراکنش محصولات است. ترکیب این دو منبع قادر به ایجاد یک مجموعه داده ی مکمل با تعداد قابل توجهی از ویژگی های زمانی طیفی، بافت و قطبیده برای طبقه بندی زمین های کشاورزی است. با این حال، طبقه بندی زمین های کشاورزی ممکن است با دو چالش افزایش تصاعدی ابعاد داده و مساله ی داده های نامتوازن مواجه شود. در دهه ی گذشته، سیستم های طبقه بندی کننده ی چندگانه ی (MCS) درختی به ویژه روش مشهور جنگل تصادفی (RF) کارایی بالایی از خود برای حل چالش اول نشان داده است. با این حال، این روش ها به طور ذاتی برای حل مساله ی داده های نامتوازن طراحی نشده است. به تازگی دو روش نوین جایگزین RF به نام های جنگل پالایشی متوازن شده (BFF) و جنگل پالایشی هزینه حساس (CFF) برای طبقه بندی تصاویر راداری پیشنهاد شده است که قابلیت بالایی در حل همزمان دو چالش از خود نشان داده است. این پژوهش نیز قصد دارد تا از این دو روش نوین برای طبقه بندی زمین های کشاورزی از ترکیب تصاویر نوری و راداری استفاده کرده و کارایی و عملکرد آن ها را با روش های MCS درختی کلاسیک از جمله روش RF در مواجه با حل این دو چالش بررسی و مقایسه کند. نتایج نشان از افزایش دقت کلی تا حدود 10% بیشتر روش های نوین درختی نسبت به روش های کلاسیک و سرعت 6 برابر این روش ها نسبت به روش RF داشت. ضمن آن که در شناسایی محصولات کشاورزی، دقتی حدود 20% بیشتر از روش RF کسب کرد.
    کلید واژگان: سیستم طبقه بندی کننده ی چندگانه, درخت تصمیم, طبقه بندی زمین های کشاورزی, تصاویر نوری, تصاویر راداری}
    I. Khosravi*, A. Safari, S. Homayouni
    Optical and polarimetric synthetic aperture radar (PolSAR) earth observations offer valuable sources of information for agricultural applications and crop mapping. Various spectral features, vegetation indices and textural indicators can be extracted from optical data. These features contain information about the reflectance and spatial arrangement of crop types. By contrast, PolSAR data provide quad-polarization backscattering observations and target decompositions, which give information about the structural properties and scattering mechanisms of different crop types. Combining these two sources of information can present a complementary data set with a significant number of spectral, textural, and polarimetric features for crop mapping and monitoring. Moreover, a temporal combination of both observations may lead to obtaining more reliable results compared to the use of single-time observations. However, there are several challenges in cropland classification using this large amount of information. The first challenge is the possibility correlation among some optical features or radar features which leads to redundant features. Moreover, some optical or radar features may have a low relevancy with some or all crop types. These two challenges cause to increase complexity and computational load of classification. In addition, when the ratio of number of samples to the number of features is very low, the curse of dimensionality may be occur. Another challenge of classification is the imbalanced distribution among various crop types, the so called imbalanced data. Various classifier have been presented for cropland classification from optical and radar data. Among these classifiers, the multiple classifier systems (MCS) especially the random forest (RF). The main aim of this paper is an alternative to RF which is able to solve these two challenges, the curse of dimensionality and the imbalanced data, simultaneously. The proposed MCSs have other modifications in feature selection and fusion steps of RF. These two methods called as balanced filter forest (BFF) and cost-sensitive filter forest (CFF).
    The study area of this paper was the southwest district of Winnipeg, Manitoba, Canada, which is covered by various annual crops. The data used in this paper were bi-temporal optical and radar images acquired by RapidEye satellites and the UAVSAR system. RapidEye is a spaceborne satellite, which has five spectral channels: blue (B), green (G), red (R), NIR and RE. In this paper, two optical images were collected on 5 and 14 July 2012. Both these images were orthorectified on the local North American 1983 datum (NAD-83) with a spatial resolution of about 5 m. The UAVSAR sensor is an airborne SAR sensor, which operates in the L-band frequency in full polarization mode (i.e., HH, HV, VH and VV). The radar images used in this paper were simultaneously acquired with the optical images. They were orthorectified on the World Geodetic System 1984 datum (WGS-84) with an SRTM3 digital elevation model. They were also multilooked by 2 pixels in azimuth and 3 pixels in range directions. Moreover, the de-speckling process, using a 5 × 5 boxcar filter, was applied to the data in order to alleviate the speckle effect. The spatial resolution of these images was then approximately 15 m.
    The results indicated that the proposed methods could increase the overall accuracy to 10% and the speediness to 6 times more than the classical RF method.
    Keywords: Multiple Classifier System, Decision Tree, Cropland Classification, Optical Images, Radar Images}
  • ابراهیم رضایی نیک *، علیرضا کیانیان
    امروزه مدیران دولتی به دنبال هدایت افراد بیشتر به سمت استفاده از حمل و نقل عمومی، با ارائه ی خدمات بهتر هستند. این موضوع در مسائلی از قبیل کنترل ترافیک و کاهش آلودگی موثر است. یکی از بهترین روش ها برای ارزیابی کیفیت خدمات حمل و نقل عمومی، جمع آوری نظرات کاربران است. به این صورت می توان نقاط قوت و ضعف خدمات را ازنقطه نظر کاربران درک نمود و برای بهبود آن ها راهکارهایی اندیشید. اما یکی از مسائل مهم پیش رو، تفاوت نیاز مشتریان و ناهمگن بودن آن ها است. همچنین عدم ارائه چارچوبی برای پیشنهاد راهکارهای بهبود سیستم از شکاف های موجود در مطالعات پیشین است. در این مقاله، ابتدا با استفاده از تحلیل خوشه ایبه خوشه بندی مشتریان حمل و نقل عمومی (اتوبوسرانی مشهد)، بر اساس خصوصیات مشترک آنان پرداخته شده است. با استفاده از این روش، تحلیل دقیق تری بر کیفیت حمل و نقل عمومی خواهیم داشت که بر خصوصیات مشتریان و شخصی سازی استراتژی بازاریابی استوار خواهد بود. پس ازآن، با استفاده از داده های به دست آمده از پرسشنامه ی طراحی شده و ابزارهای داده کاوی، کیفیت خدمات حمل و نقل عمومی مورد ارزیابی قرارگرفته و عوامل مهم تاثیرگذار بر کیفیت برای هر یک از گروه های مشتریان تعیین و وزن آن ها مشخص می شود. پس ازآن با نظر خبرگان، الزامات فنی برای بهبود وضعیت، تعریف و با استفاده از ابزار خانه کیفیت و فرایند تحلیل شبکه ای این الزامات رتبه بندی و وزن دهی می شوند. تلفیق ابزار خانه کیفیت با تحلیل های به دست آمده از بخش داده کاوی، می تواند به مدیران در ارائه ی راهکارهای بهتر یاری دهد. نتایج بخش خانه کیفیت نشان می دهد که افزایش تعداد اتوبوس ها، بهبود و توسعه نرم افزاری و الگوریتم های مورد استفاده و آموزش کارکنان، از مهم ترین الزامات برای بهبود سطح کیفی موجود می باشند.
    کلید واژگان: تحلیل خوشه ای, خانه کیفیت, داده کاوی, درخت تصمیم, کیفیت خدمات اتوبوسرانی}
  • مهسا صفی*، سمیه علیزاده، عماد روغنیان
    سنجش عملکرد و کارایی ناوگان اتوبوسرانی از جمله مسائلی است که به جهت نیاز به ارتقا هر چه بیشتر سطح خدمت رسانی به شهروندان همواره مورد توجه سیاست گذاران و متولیان مدیریت شهری بوده است. از طرفی دستیابی به این دانش که چه شرایطی در افزایش کارایی خطوط اتوبوسرانی موثرند، از اهمیت بالایی برخوردار می باشد. داده های تاریخی مربوط به عملکرد خطوط اتوبوسرانی همه روزه توسط شبکه ارتباطی بیسیم در سطح شهر جمع آوری می شوند. در این پژوهش داده-های مذکور به کمک یک روش ترکیبی جدید مورد بررسی و پردازش قرار گرفته اند. کارایی خطوط توسط روش DEA سنجیده شده و در ادامه بر اساس کارایی یا عدم کارایی خطوط، به وسیله روش درخت تصمیم قواعد مستتر در داده ها که نشان دهنده ی وضعیت کارایی خطوط می باشند، استخراج شده است. در نهایت توانایی پیش بینی کارایی یا تاکارایی خطوط توسط الگوریتم های کارت2، C5.0 و مدل گروهی3 مورد ارزیابی قرار گرفته است. این روش ترکیبی تاکنون در حوزه حمل و نقل استفاده نشده است و در عین حال در این روش از قابلیت الگوریتم های گروهی جهت افزایش صحت4 مدل در پیش بینی کارایی خطوط استفاده شده است. به این ترتیب به وسیله ی ترکیب روش DEA و درخت تصمیم به عنوان دو روش ناپارامتریک، نقشه ی راهی جهت ارتقا کارایی ناوگان حمل و نقل در این حوزه، در اختیار مسئولان امر قرار می گیرد.
    کلید واژگان: حمل و نقل درون شهری, کارایی, تحلیل پوششی داده ها, داده کاوی, درخت تصمیم}
    M. Safi*, S. Alizadeh, E. Roghanian
    Bus fleet performance measurement is under scrutiny of the urban policy makers because of the critical need to enhance the service level for the citizens. However، the situations that are involved in bus line efficiency are very important. Historical data of bus line performance are gathered daily by a wireless network in the city. In this study، bus lines’ data are investigated and processed by a hybrid method. Lines’ efficiency is measured by DEA technique، and then hidden rules in the data set are extracted in regard to the efficiency or inefficiency of the bus lines. At the end، the prediction ability of being efficient or inefficient has been evaluated by CART، C5. 0 and ensemble algorithms. The hybrid method has not been used in transportation field before; also the ensemble model that leads to higher accuracy has been used for the first time in this hybrid method. In this way، the combination of DEA and decision tree as two nonparametric tools will result in a road map to help policy makers for efficiency enhancement in urban transportation.
    Keywords: Urban Transportation, Data Envelopment Analysis, Data Mining, Decision Tree}
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال