Skripsi
Analisa kinerja klasifikasi cerita rakyat Indonesia menggunakan metode gaussian naïve bayes / M. Anas Pandu Wijayanto
Abstrak
Cerita rakyat sangat berperan penting didalam pembentukan watak anak sejak kecil. Hal tersebut bisa terjadi karena didalam cerita rakyat terdapat nilai moral yang disampaikan oleh penulis (sastrawan) kepada pembaca. Orang tua maupun tenaga pengajar dituntut untuk memberikan cerita rakyat sesuai dengan umur siswa atau pembaca. Perlu diketahui bahwa karakter teks yang sulit dapat membuat siswa malas belajar dan frustasi sehingga perjenjangan buku sangat penting untuk dilakukan. Penulis mencoba mengusulkan klasifikasi cerita rakyat Indonesia menggunakan machine learning dengan melakukan ekstraksi fitur pada dataset dan menggunakan algoritma Gaussian Na ve Bayes (GNB). Dataset yang dipakai pada penelitian ini yaitu buku cerita rakyat Indonesia yang diperoleh dari situs milik Kemendikbud sehingga diperoleh sebanyak 190 data yang memiliki tiga kelas jenjang yaitu SD SMP dan SMA. Hasil dari penelitian ini yaitu terdapat enam skenario yang menggunakan data hasil resampling maupun data normal dan menggunakan tiga jenis na ve bayes seperti Gaussian Na ve Bayes Bernoulli Na ve Bayes dan Multinomial Na ve Bayes. Diantara skenario tersebut akurasi tertinggi diperoleh pada skenario yang menggunakan dataset yang sudah melalui preprocessing SMOTE dengan algoritma Gaussian Na ve Bayes yaitu sebesar 56.36%. Sehingga dapat disimpulkan bahwa proses resampling SMOTE dapat meningkatkan akurasi dari model. Selain itu dari hasil penelitian jenis na ve bayes menunjukan bahwa Gaussian Na ve Bayes cocok digunakan untuk jenis data bertipe numerik.