Skripsi
Menentukan kepopuleran konten berdasarkan views dan topic extraction menggunakan decision tree dengan pendekatan tf-idf terms pada konten untuk aplikasi medisains / Henrico Verdiansyah Pramono
Abstrak
Konten merupakan hal yang sangat penting untuk saat ini karena sebuah informasiyang dimuat di media entah itu media elektronik atau tidak sangat berpengaruh pada era saat ini.Sebuah konten atau informasi adalah aspek penting yang harus dipertimbangkan tidak semuainformasi adalah informasi yang dibutuhkan atau konten yang dibutuhkan. Perlu beberapapengolahan informasi berdasarkan apa yang sedang populer saat ini agar informasi tersebutsesuai ringkas dan menyeluruh dan mampu dipahami dengan mudah oleh pencari informasi.Konten dari aplikasi medisains ini akan menjadi data yang digunakan pada penelitian ini. Tujuanpenelitian ini yaitu 1). Mengetahui sistem yang dibuat dapat digunakan guna mengisi pada listsaran pencarian konten pada aplikasi medisains. 2). Mengetahui bagaimana kineja metode TermFrequency-Inverse Document Frequency (TF-IDF) dengan topic ekstraksi dalam sistem. Batasandalam penelitian ini meliputi penelitian dilakukan menggunakan metode Term Frequency-InverseDocument Frequency (TF-IDF) dengan topic ekstraksi. Data yang digunakan dan di proses adalahdari aplikasi Medisains Data yang diambil dalam kurun waktu 2013-2020 Dataset yang digunakansebanyak 1161 dokumen. Metode penelitian yang digunakan adalah metode transfer learningskenario yang dilakukan dengan beberapa tahap tahap pertama merupakan proses pengumpulandata medisains. Tahap kedua pre-processing data berupa punctuation removal tokenizing stopwords removal dan stemming. Tahap ketiga merupakan klasifikasi menggunakan algoritma TF-IDF(Term frequency-inverse document frequency). Tahap ke-empat yaitu Tahap terakhir yaituproses evaluasi pada hasil klasifikasi menggunakan precison recall f1-score dan accuracy. Darihasil yang dilakukan penelitian ini