Please use this identifier to cite or link to this item: http://repository.uinjkt.ac.id/dspace/handle/123456789/51649
Title: Aplikasi latent dirichlet allocation melalui sistem temu cerdas: studi kasus wikipedia Indonesia Tahun 2018
Authors: Oktavian Wahyu Prabowo
Advisors: Taufik Edy Sutanto
Yanne Irene
Keywords: Coherence score;Search engine;Relevant sampling;Wikipedia
Issue Date: 19-May-2020
Publisher: Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta
Abstract: Sebuah sistem temu cerdas (search engine) diaplikasikan pada 617.411 artikel data Wikipedia Indonesia tahun 2018. Kumpulan dokumen tersebut kemudian dikelompokkan berdasarkan topik laten (tersembunyi) menggunakan metode Latent Dirichlet Allocation (LDA) yang terdiri dari delapan kombinasi preprocessing dan konsep relevant sampling melalui fungsi BM25. Data sampel tersebut diboboti berdasarkan kemunculan frekuensi kata menggunakan vektor Term Frequency (TF) menggunakan sistem dinamis yang terdapat dalam sistem cerdas. Dalam menentukan jumlah topik yang optimal, model akan dilakukan evaluasi berdasarkan nilai coherence menggunakan teknik Umass. Pada eksperimen yang dilakukan hasilnya menunjukkan bahwa berbagai topik dapat dihitung secara real time dengan waktu tidak lebih dari 5 detik. Hal ini mengindikasikan bahwa metode LDA dapat digunakan untuk melakukan pemodelan topik yang dapat diinterpretasikan dengan baik secara real time.
Description: xiv, 58 hlm; 29 cm.
URI: http://repository.uinjkt.ac.id/dspace/handle/123456789/51649
Appears in Collections:Skripsi

Files in This Item:
File SizeFormat 
OKTAVIAN WAHYU PRABOWO-FST.pdf1.81 MBAdobe PDFView/Open


Items in UINJKT-IR are protected by copyright, with all rights reserved, unless otherwise indicated.