Yayın: Makine Öğrenmesi Algoritmaları ile Hava Kirliliği Tahmini Üzerine Karşılaştırmalı Bir Değerlendirme
item.page.program
item.page.orgauthor
item.page.kuauthor
item.page.coauthor
Yazarlar
Danışman
Tarih
item.page.language
item.page.type
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Özet
Hava kirliligi, gunumuzun en buyuk sorunlarindan birini teskil etmektedir. Hava kirliligi, nufusun artmasi, kentsel gelisme ve buyume, endustrinin gelismesiyle giderek artan bir onem arz etmektedir. Genellikle hava kirleticilerinin insanlara, canlilara ve cevreye zararli etkileri zaman, mekan, etki suresi, konsantrasyon ve diger karakteristiklerine bagli olarak karmasik dagilim sekilleri gostermektedir. Bu karmasiklik, kirletici ornekleri ve egilimleri modelleme veya olcmede, ayrica insanlarin maruz kaldigi seviyeleri tahmin etmenin zor oldugu anlamina gelmektedir. Hava kirliliginin onlenmesi konusunda yapilacak calismalar icerisinde en onemli adimlardan biri kirlenme olayinin bir model icerisinde degerlendirilmesidir. Bu calismada Kastamonu ili ele alinarak, meteoroloji ve cevre uygulamalarinda oldukca yeni ve basarili sonuclar veren cesitli makine ogrenmesi algoritmalari ile hava kirliliginin tahmininde, bazi meteorolojik parametreler kullanilarak hava kirliligi modellenmesi amaclanmistir. Normalizasyon tekniklerinin sistem performansina etkisini gozlemleyebilmek icin veri setindeki degerler Minimum-Maksimum (Min-Max) normalizasyon teknikleri ile normalize edilmistir. Calismada elde edilen performans degerleri, literaturdeki benzer calismalarla kiyaslanarak problemin cozumune iliskin en uygun siniflandirma algoritmasi tespit edilmistir. Yapay Sinir Aglari (YSA) , Rastgele Orman (Random Forest), K-En Yakin Komsu (K-Nearest Neighborhood), Lojistik Regresyon (Logistic Regression), Karar Agaci (Decision Tree), Lineer Regresyon (Linear Regression) ve Basit Bayes (Naive Bayes) gibi yontemler kullanilarak ayri ayri modeller tasarlanmis ve sonuclar analiz edilmistir. Veri setinin %70’i egitim ve %30’si test verisi olarak ayrilmistir. Calisma sonucunda, yapay sinir aglari beklendigi gibi %91 oraninda basari gostererek en dogru tahmini yapan yontem olarak belirlenirken, siniflandirmalardan en basarisiz sonuc Lineer Regresyon ile %30 elde edilirken, en basarili sonuclar Rastgele Orman ve Karar Agaci ile %99 elde edilmistir. KastamonuDataSet uzerinde kullanilan yontemlerin performans degerlendirmelerinde kullanilan temel performans gostergeleri olarak Aciklayicilik Katsayisi (R 2 ), Ortalama Karesel Hata (Mean Squared Error-MSE), Ortalama Hata Kare Koku (Root Mean Square Error-RMSE) ve Ortalama Mutlak Hata (Mean Absolute Error-MAE) metrikleri bakimindan istatistiksel onemli farkliliklarin bulundugu tespit edilmistir.
Açıklama
item.page.source
Yayınevi
European Journal of Science and Technology
