Skripsi
Penerapan teknik SMOTE untuk mengatasi imbalance class dalam klasifikasi berita online menggunakan algoritma KNN / Anis Nikmatul Kasanah
Abstrak
RINGKASAN Kasanah Anis Nikmatul. 2019. Penerapan Teknik SMOTE untuk mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online menggunakan Algoritma KNN. Skripsi Jurusan Teknik Elektro Fakultas Teknik Universitas Negeri Malang. Pembimbing (I) Dr. Muladi S.T. M.T. (II) Utomo Pujianto S.Kom. M.Kom. Kata kunci Klasifikasi KNN SMOTE Subjektif Objektif Banyaknya berita online belum diimbangi dengan kualitas objektivitas berita yang baik sehingga pembaca harus memilah sendiri berita online yang dibaca. Oleh karena itu diperlukan sebuah sistem untuk mengklasifikasikan berita berdasarkan objektivitas berita dengan tujuan untuk membantu pembaca dalam menentukan objektivitas dari sebuah berita. Pada penelitian ini algoritma klasifikasi yang diusulkan adalah algoritma K-Nearest Neighbour (KNN). Penelitan ini menggunakan metode eksperimen yang diawali dengan mengekstrak berita online yang dari portal berita kompas.com. Namun jumlah berita yang didapatkan dari kompas.com mengalami imbalance class sehingga dapat berpengaruh buruk pada performa algoritma klasifikasi. Berdasarkan hal tersebut diperlukan suatu teknik untuk menangani imbalance class yaitu dengan menerapkan teknik Synthetic Minority Over-sampling Technique (SMOTE). Setelah memperoleh data dilakukan proses pelabelan berita secara manual yang dilakukan oleh 3 ahli bahasa. Tahap selanjutnya adalah preprocessing data yang terdiri dari case folding data cleaning tokenisasi stopword pengelompokkan kata untuk dijadikan atribut dan menghitung jumlah kata sesuai dengan atribut yang telah ditentukan. Setelah preprocessing dilakukan klasifikasi menggunakan dua model yang berbeda yaitu klasifikasi algoritma KNN tanpa SMOTE dan klasifikasi algoritma KNN dengan SMOTE. Klasifikasi ini menerapkan evaluasi model menggunakan K-fold validation sebanyak 10. Hasil penelitian dengan menerapkan nilai k tetangga yang bervariasi yaitu 1 3 5 7 dan 9 diperoleh bahwa hasil klasifikasi algoritma KNN tanpa SMOTE akurasi terbaik pada k 7 dengan niali akurasi 86 5 dan untuk hasil klasifikasi algoritma KNN dengan SMOTE akurasi terbaik pada nilai k 1 dengan nilai akurasi 86 75. Penerapan SMOTE dapat meningkatkan performa akurasi algoritma KNN pada nilai k 1 dan k 3 dengan rata-rata peningkatan 3 36 dan pada nilai k 5 7 dan 9 algoritma KNN mengalami penurunan dengan rata-rata penurunan 6 76. Penerapan SMOTE meningkatkan nilai presisi dengan rata-rata peningkatan 0 114 dan penerapan SMOTE mengakibatkan penurunan pada nilai recall dan nilai F-measure dengan rata-rata penurunan nilai recall sebesar 0 304 dan penurunan F-measure sebesar 0 134. Berdasarkan hasil dari penelitian ini dapat disimpulkan bahwa algoritma KNN dengan SMOTE kurang efektif untuk klasifikasi objektivitas pada berita online.