مدلسازی آلودگی خاک به فلزات سنگین با استفاده از روشهای یادگیری ماشین و داده های طیف سنجی
معادن و صنایع وابسته به آن، در زمان بهره برداری و پس از متروکه شدن، بر محیط زیست اطراف خود تاثیرگذارند. از جمله این تاثیرات می توان به آلودگی آب های زیرزمینی و سطحی، و نیز آلودگی خاک اشاره کرد. مدل سازی غلظت فلزات سنگین با استفاده از روش های مقرون به صرفه لازمه مدیریت و اصلاح آسیبهای واردشده به محیط زیست است. هدف این تحقیق ارایه چارچوبی به منظور مدل سازی فلزات سنگین در خاک با استفاده از طیف سنجی و نیز روش های مدل سازی آماری است. بدین منظور با استفاده از طیف سنجی، نمودار طیفی مربوط به 53 نمونه خاک مربوط به منطقه ای در اطراف یک معدن متروکه در ایالت نیوساوث ولز استرالیا در طول موج های مریی تا مادون قرمز میانی برداشت شد و مشتق دوم این داده ها محاسبه شد. سپس داده های طیفی مناسب برای مدل سازی غلظت فلزات سنگین شامل سرب، نقره، کادمیوم و جیوه با استفاده از روش انتخاب ویژگی جنگل تصادفی تعیین شدند و به عنوان ورودی برای مدل سازی غلظت فلزات سنگین با استفاده از روش های رگرسیون خطی چندمتغیره، جنگل تصادفی رگرسیون و ماشینبردار رگرسیون به کار گرفته شدند. نتایج نشان داد که طول موج های مادون قرمز میانی دارای اهمیت بیشتری به منظور مدل سازی غلظت فلزات سنگین در این تحقیق هستند. همچنین روش های غیرخطی یادگیری ماشین به خصوص جنگل تصادفی رگرسیون با مقادیر مجذور میانگین مربعات خطا ppm 8/0 و ضریب تعیین 51/0 برای سرب و ppm 4/9 و 46/0 برای کادمیوم دارای عملکرد بهتری نسبت به روش رگرسیون خطی چندمتغیره هستند.