Skripsi
Implementasi text mining menggunakan algoritma k-means dalam pengelompokkan jenis konten untuk social media marketing (studi kasus pada twitter e-commerce blibli @bliblidotcom) / Raretha Maren
Abstrak
Pemasaran digital telah berkembang sebagai alternatif baru bagi para pengusaha untuk melebarkan bisnisnya dengan memanfaatkan media sosial karena keefektifan biaya pemasaran dan persebaran informasi yang semakin cepat. Salah satu media sosial yang marak digunakan adalah Twitter. Dilengkapi fitur retweets dan likes Twitter memudahkan pelaku bisnis untuk menyebarkan tweet untuk promosi sekaligus periklanan. Kesesuaian konten tweet terhadap minat pengguna Twitter harus diwujudkan agar pelaku bisnis dapat menjangkau lebih banyak konsumen dengan melihat tweet yang memiliki jumlah retweet dan like tertinggi. Penelitian ini bertujuan untuk mengaplikasikan text mining dan k-means untuk mengelompokkan jenis konten dari tweet sebuah akun Twitter e-commerce Indonesia yaitu Blibli. Selain itu penelitian ini mencakup tentang formulasi pemilihan parameter silhouette dan elbow dalam menjalankan algoritma k-means untuk dapat mencapai hasil paling optimal. Penelitian ini adalah penelitian eksperimen dimana data penelitian yang digunakan merupakan data primer yang diperoleh dari proses twitter crawling melalui software R Studio 1.4.1. Total tweet yang didapatkan berjumlah 491 tweet dengan tiga variabel meliputi satu variabel nominal berupa text dan dua variabel interval berupa frekuensi retweet dan like. Data diolah menggunakan software Anaconda 3.0 dengan pemrograman python. Algoritma k-means dilakukan sebanyak 15 kali dengan menetapkan rentang klaster 2 hingga 16 serta menyesuaikan dengan parameter yang didefinisikan. Hasil penelitian menunjukkan bahwa kombinasi algoritma k-means dengan silhouette coefficient menggunakan jarak cosine merupakan formulasi yang tepat untuk proses klasterisasi jenis konten dengan nilai davies bouldin index yang diperoleh yaitu 2 9623. Jumlah klaster terbaik yang dihasilkan adalah 15 klaster. Performansi hasil dari 15 klaster juga mengindikasi terbentuknya kualitas hasil klaster yang cukup baik didukung dengan silhouette coefficient 0 1981. Jenis konten yang ditemukan pada Twitter e-commerce Blibli ( bliblidotcom) berjumlah 17 kegiatan yang tersebar dalam 15 klaster. Kesimpulan yang didapatkan dalam penelitian ini menunjukkan bahwa mayoritas pengguna Twitter cenderung tertarik dengan tweet mengenai kuis berhadiah dan kolaborasi Blibli bersama sejumlah artis asal Korea Selatan. Dengan demikian hasil dari penelitian ini diharapkan mampu memberikan informasi kepada Blibli untuk memfokuskan strategi bisnis di Twitter dengan memperbanyak tweet yang berkaitan dengan konten tersebut.