UPT Perpustakaan UM

  • Beranda
  • Informasi
  • Repository UM
  • SIPADU UM
  • OPAC SIPADU

Pencarian Spesifik

Pencarian berdasarkan :

SEMUA Pengarang Subjek ISBN/ISSN Pencarian Spesifik

Pencarian terakhir:

{{tmpObj[k].text}}
No image available for this title

Skripsi

Analisis k-means clustering untuk ekstraksi stopword list bahasa jawa / Hidayah Kariima Fithri

Fithri, Hidayah Kariima - Nama Orang;

Abstrak
RINGKASAN Fithri Hidayah Kariima. 2019. Analisis K-Means Clustering untuk Ekstraksi Stopword List Bahasa Jawa. Skripsi. Jurusan Teknik Elektro Fakultas Teknik Universitas Negeri Malang. Pembimbing. (I) Aji Prasetya Wibawa S.T. M.MT. Ph.D. (II) Ilham Ari Elbaith Zaeni S.T. M.T. Ph.D. Keywords Stopword Clustering teks K-Means Bahasa Jawa Bahasa Jawa adalah bahasa daerah yang paling banyak digunakan di Indonesia. Bahasa ini terdiri dari tingkat bahasa yaitu Ngoko Krama dan Madya. Banyak dokumen teks yang ditulis dalam bahasa Jawa seperti berita cerita hingga naskah kuno yang telah melalui proses digitalisasi yang memuat banyak informasi penting. Salah satu cara untuk mengambil informasi dalam suatu dokumen teks adalah melalui metode yang ada pada teks mining. Akan tetapi tidak semua informasi dalam dokumen teks akan digunakan karena setiap dokumen teks pasti mengandung kata yang tidak memiliki makna. Kata ini pada teks mining akan dihapus melalui proses stopword removal. Namun stopword list bahasa Jawa belum tersedia. Tahapan penelitian pada pembuatan stopword list berbahasa Jawa terdiri dari 5 tahap yaitu pengambilan data cerita pendek berbahasa Jawa preprocessing pemberian label oleh ahli bahasa Jawa penerapan clustering dengan K-Means dan evaluasi. Pengumpulan data dilakukan pada website Ki-demang.com dengan isi cerita pendek berbahasa Jawa. Tahap preprocessing dilakukan dengan cleansing case folding tokenisasi dan menghitung frekuensi kata. Pemberian label oleh ahli bahasa Jawa digunakan sebagai kata kunci untuk pengujian karena pendapat ahli bahasa Jawa dianggap paling benar. Metode K-Means clustering untuk mengelompokkan kata berdasarkan frekuensinya. Evaluasi menggunakan tabel confusion matrix dan F-measure. Pada tabel confusion matrix hasil label ahli bahasa Jawa sebagai data sebenarnya dan hasil clustering sebagai data prediksi dengan output accuracy precision dan recall. Selanjutnya precision dan recall digunakan untuk menghitung nilai F-measure. Hasil pengujian terbaik diambil berdasarkan nilai paling tinggi F-measure yaitu sebesar 82 10% dengan accuracy 84 50% yang dimiliki oleh hasil cluster K 7. Untuk memaksimalkan hasil dari penelitian ini diharapkan pada penelitian selanjutnya menambah proses stemming dan mencoba nilai K yang berbeda pada saat proses clustering.


Informasi Detail
DDC
Rs 005.1 FIT a
Prodi
Universitas Negeri Malang. Program Studi Teknik Informatika, 2019.
Deskripsi Fisik
xiii, 48 lembar : il., tab.; 30 cm.
Bahasa
Indonesia
No Reg
00020/KI/20
Edisi
Skripsi (Sarjana)--Universitas Negeri Malang. 2019
Subjek
1. ALGORITMA KOMPUTER
2. K-MEANS CLUSTERING
3. COMPUTER ALGORITHMS

Pembimbing
1. Aji Prasetya Wibawa; 2. Ilham Ari Elbaith Zaeni
Lampiran Berkas
You must be logged in to get fulltext


UPT Perpustakaan UM
  • Berita

Tentang Kami

TIM IT Perpustakaan 2023

Cari

masukkan satu atau lebih kata kunci dari judul, pengarang, atau subjek

Donasi untuk SLiMS

Pilih subjek yang menarik bagi Anda
  • Karya Umum
  • Filsafat
  • Agama
  • Ilmu-ilmu Sosial
  • Bahasa
  • Ilmu-ilmu Murni
  • Ilmu-ilmu Terapan
  • Kesenian, Hiburan, dan Olahraga
  • Kesusastraan
  • Geografi dan Sejarah
Icons made by Freepik from www.flaticon.com
Pencarian Spesifik