Skripsi
Penerapan pre-trained model pada speaker diarization untuk menentukan jumlah pembicara dalam rekaman rapat menggunakan algoritma spectral clustering / Muhammad Ferdiansa Hutabarat
Abstrak
Diarisasi pembicara merupakan teknik penting dalam pengolahan suara bertujuan untuk memisahkan setiap pembicara dalam rekaman audio. Penerapan model pre-trained Faster Whisper dan Pyannote Embedding digunakan karena hanya memerlukan memori sebesar plusmn 3 GB. Penelitian dilakukan dalam beberapa tahap mulai dari pengumpulan data implementasi model reduksi data klasterisasi menggunakan algoritma Spectral Clustering dan evaluasi klasterisasi menggunakan Davies Bouldin Index. Penelitian ini bertujuan untuk menentukan jumlah pembicara dalam rekaman rapat berdasarkan jumlah klaster optimal. Hasil penelitian menunjukan bahwa pendekatan yang dilakukan mampu menentukan jumlah pembicara dalam rekaman rapat. Jumlah klaster optimal yang dihasilkan adalah 11 dengan nilai Davies Bouldin Index sebesar 0.3776099386.