Tesis
Identifikasi baku mutu air melalui metode multilayer stacking / Prasetya Widiharso
Abstrak
Klasifikasi kualitas air diperlukan bagi pemerintah dalam pengelolaan sumber daya air dengan tujuan menghindarkan manusia dan sumber makanannya dari kontaminasi limbah beracun. Metode yang digunakan dalam klasifikasi adalah metode Stacking. Metode pertama yaitu Parallel/Single Layer Stacking yang tersusun dari metode Random forest (RF) Adaptive Boosting (AdaBoost) K-Nearest Neighbors (KNN) Support Vector Classification (SVC) dan Logistic Regression(LR) sebagai Meta Learner. Metode kedua yang digunakan yaitu Multilayer Stacking tersusun dari RF-AdaBoost pada layer pertama dan LR-SVC pada layer kedua serta SVC sebagai Meta Learner. Pemilihan kedua metode bertujuan untuk menangani dataset kecil dengan distribusi kelas yang tidak seimbang. Penanganan jenis data tersebut kurang optimal jika menggunakan metode Single Classification Bagging dan Boosting. Parameter yang diukur terdiri dari temperatur TDS TSS pH COD BOD DO dan curah hujan. Data primer diambil dari lokasi pengamatan Sungai Cangkir Tambangan Sungai Muara Kali Tengah dan Waduk Sutami Hilir. Data curah hujan diambil dari Automatic Rain Recorder Kedurus Karang Pilang dan Sutami. Periode pengambilan data Januari 2019 sampai Desember 2021. Tujuan dari penelitian mengetahui performa Parallel/Single Layer Stacking dan Multilayer Stacking setelah dan sebelum penerapan feature selection dan rescaling dataset pada fitur Dissolve Oxygen (DO) untuk mengoptimalkan tugas klasifikasi. Melalui metode K-Means data diklaster ke dalam dua kelas. Kelas pertama untuk sarana rekreasi perikanan dan peternakan. Kelas kedua untuk budidaya pertanaman. Hasil pengujian metode Parallel/Single Layer Stacking diperoleh hasil recall 0.93 precission 0.97 f1 score 0.95 dan accuracy 0.95. Melalui Multilayer Stacking diperoleh recall 0.95 precission 0.97 f1 score 0.96 dan accuracy 0.96.