Skripsi
Penerapan knowledge discovery in database (KDD) dengan algoritma k-means clustering untuk data tingkat pengangguran terbuka di Jawa Timur tahun 2020-2023 / Ananda Mazidah Shofiana
Abstrak
Di Jawa Timur tingkat pengangguran terbuka menunjukkan tren yang fluktuatif dari waktu ke waktu. Penelitian ini dilakukan untuk mengelompokkan tingkat pengangguran terbuka dan jumlah angkatan kerja berdasarkan kabupaten/kota untuk masing-masing tahun selama periode analasis dari tahun 2020 hingga 2023. Penelitian ini memanfaatkan algoritma K-Means clustering yang diterapkan dalam proses data mining menggunakan pendekatan Knowledge Discovery in Database (KDD). Sebanyak 152 data dianalisis dan dikelompokkan berdasarkan kabupaten/kota setiap tahunnya. Hasil penelitian ini menunjukkan bahwa tingkat pengangguran terbuka pada tahun 2020 terbagi menjadi 4 cluster tahun 2021 menjadi 5 cluster tahun 2022 menjadi 4 cluster dan tahun 2023 menjadi 4 cluster. Selain itu terdapat dua daerah yang berada dalam cluster yang dengan tingkat pengangguran terbukanya yang tinggi dan jumlah angkatan kerjanya juga tinggi yaitu Kabupaten Sidoarjo dan Kota Surabaya. Validasi jumlah cluster menggunakan Silhouette Score menunjukkan bahwa tahun 2020 dan tahun 2021 termasuk dalam interpretasi struktur yang dapat diterima sedangkan untuk tahun 2022 dan 2023 termasuk dalam interpretasi struktur lemah.