Pembentukan Dataset Topik Kata Bahasa Indonesia pada Twitter Menggunakan TF-IDF & Cosine Similarity

Kristian Adi Nugraha; Danny Sebastian

PDF (English)

Diterbitkan: Dec 21, 2018

Kristian Adi Nugraha

Fakultas Teknologi Informasi, Universitas Kristen Duta Wacana

Danny Sebastian

Fakultas Teknologi Informasi, Universitas Kristen Duta Wacana

Abstrak

Social media is evidently the most popular platform compared to other web applications. Indonesians spend an average of 3 hours and 15 minutes every day to access social media, resulting in a substantial amount of information flow. Even though research on information retrieval with social media data is common, only an inconsiderable amount concentrate using social media content in the Indonesian language. Our research aims to form an Indonesian language topic dataset using social media data from Twitter. The methods used in this research include TF-IDF for data formation and cosine similarity to group the Twitter data. Based on the test we conducted, our system is able to produce a fairly accurate result with 64% as its most optimal percentage for the process of every 200 Tweets.

Unduhan

Data unduhan belum tersedia.

Cara Mengutip

[1]

K. A. Nugraha dan D. Sebastian, “Pembentukan Dataset Topik Kata Bahasa Indonesia pada Twitter Menggunakan TF-IDF & Cosine Similarity”, JuTISI, vol. 4, no. 3, hlm. 376–386, Des 2018.

Terbitan

Vol 4 No 3 (2018): JuTISI

Bagian

Articles

This is an open-access article distributed under the terms of the Creative Commons Attribution-NonCommercial 4.0 International License (https://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial used, distribution and reproduction in any medium.

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

Artikel paling banyak dibaca berdasarkan penulis yang sama

Danny Sebastian, Implementasi Algoritma K-Nearest Neighbor untuk Melakukan Klasifikasi Produk dari beberapa E-marketplace , Jurnal Teknik Informatika dan Sistem Informasi: Vol 5 No 1 (2019): JuTISI
Kristian Adi Nugraha, Analisis Sentimen Berbasis Emoticon pada Komentar Instagram Bahasa Indonesia Menggunakan Naïve Bayes , Jurnal Teknik Informatika dan Sistem Informasi: Vol 7 No 3 (2021): JuTISI
Danny Sebastian, Kristian Adi Nugraha, Sistem Perbaikan Kata Tidak Baku Bahasa Indonesia Menggunakan Metode Crowdsourcing , Jurnal Teknik Informatika dan Sistem Informasi: Vol 5 No 3 (2019): JuTISI
Christianti Angelin Maarende, Danny Sebastian, Restyandito Restyandito, Perancangan Antarmuka Berdasarkan Evaluasi Usabilitas Penggunaan Aplikasi KlikDokter Untuk Pralansia dan Lansia , Jurnal Teknik Informatika dan Sistem Informasi: Vol 7 No 3 (2021): JuTISI
Vievin Efendy, Kristian Adi Nugraha, Danny Sebastian, Implementasi Chat Room dan Push Notification pada e-Class Berbasis Mobile , Jurnal Teknik Informatika dan Sistem Informasi: Vol 5 No 2 (2019): JuTISI
Ruddy Cahyanto, Antonius Rachmat Chrismanto, Danny Sebastian, Pengelompokan Komentar Dataset Sentipol dengan Modified K-Means Clustering , Jurnal Teknik Informatika dan Sistem Informasi: Vol 6 No 3 (2020): JuTISI
Diyah Intan Pramitha Sari, Restyandito Restyandito, Kristian Adi Nugraha, Perancangan Aplikasi Monitoring Kalori Sebagai Upaya Pencegahan Penyakit Diabetes Mellitus Berbasis Android , Jurnal Teknik Informatika dan Sistem Informasi: Vol 8 No 1 (2022): JuTISI
Kristian Adi Nugraha, Laurentius Kuncoro Probo Saputra, Pemanfaatan Raspberry Pi untuk Sistem Penghitung Mobil Otomatis pada Kampus UKDW , Jurnal Teknik Informatika dan Sistem Informasi: Vol 3 No 3 (2017): JuTISI
Danny Sebastian, Rancang Bangun Website Klasikfikasi Untuk Pencarian Produk Pasar Online Berdasarkan , Jurnal Teknik Informatika dan Sistem Informasi: Vol 3 No 3 (2017): JuTISI
Kristian Adi Nugraha, Metode Background Substraction untuk Pencarian Tempat Parkir Menggunakan Kamera Pengawas , Jurnal Teknik Informatika dan Sistem Informasi: Vol 6 No 1 (2020): JuTISI

Bilah Samping Artikel

Isi Artikel Utama

Abstrak

Unduhan

Rincian Artikel

Artikel paling banyak dibaca berdasarkan penulis yang sama