ANALISA DAN DETEKSI KONTEN HOAX PADA MEDIA BERITA INDONESIA MENGGUNAKAN MACHINE LEARNING

Munirul Ula

Abstract


Sekarang  ini konten Hoax yang mengandung informasi tidak benar malah sering kali menjadi konsumsi massal pengguna internet. Hal ini merupakan sesuatu yang buruk karena dapat meningkatkan rasa tidak percaya terhadap berita dan informasi yang ada di internet hingga menimbulkan kebingungan pada masyarakat dalam menentukan informasi mana yang benar.

Dalam Penelitian ini, percobaan yang dilakukan bertujuan untuk memilih algoritma terbaik dalam membedakan berita hoax dan berita asli menggunakan metode text mining serta pendekatan dengan machine learning dan  150 artikel berbahasa Indonesia (50 artikel hoax dan 100 artikel asli) sebagai data yang akan digunakan.

Penelitian ini akan dimulai dengan tahap preprocessing teks yang terdiri dari tokenizing, case folding, filtering, stopword removal, stemming dan weighting TF-IDF menggunakan penggabungan fitur unigram dan bigram baru kemudian diolah menjadi teks klasifikasi. Hasil dari penelitian ini didapatkan kesimpulan bahwa  algoritma Random Forest memiliki akurasi terbaik dalam mengklasifikasikan berita hoax dan berita asli dibandingkan dengan algoritma Multilayer Perceptron, Naïve Bayes,dan Support Vector Machine dengan nilai akurasi 75.37%.

 

Kata kunci : Klasifikasi,  Berita, Hoax,  Text mining,  Machine learning


Full Text:

PDF


DOI: https://doi.org/10.29103/tts.v1i2.3263

Article Metrics

 Abstract Views : 1422 times
 PDF Downloaded : 436 times

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Jurnal Teknologi Terapan and Sains 4.0

(p)-ISSN : 2722-8428 - (e)-ISSN : 2988-3989