ANALISA DAN DETEKSI KONTEN HOAX PADA MEDIA BERITA INDONESIA MENGGUNAKAN MACHINE LEARNING

Munirul Ula

doi:10.29103/tts.v1i2.3263

ANALISA DAN DETEKSI KONTEN HOAX PADA MEDIA BERITA INDONESIA MENGGUNAKAN MACHINE LEARNING

Munirul Ula

Abstract

Sekarang ini konten Hoax yang mengandung informasi tidak benar malah sering kali menjadi konsumsi massal pengguna internet. Hal ini merupakan sesuatu yang buruk karena dapat meningkatkan rasa tidak percaya terhadap berita dan informasi yang ada di internet hingga menimbulkan kebingungan pada masyarakat dalam menentukan informasi mana yang benar.

Dalam Penelitian ini, percobaan yang dilakukan bertujuan untuk memilih algoritma terbaik dalam membedakan berita hoax dan berita asli menggunakan metode text mining serta pendekatan dengan machine learning dan 150 artikel berbahasa Indonesia (50 artikel hoax dan 100 artikel asli) sebagai data yang akan digunakan.

Penelitian ini akan dimulai dengan tahap preprocessing teks yang terdiri dari tokenizing, case folding, filtering, stopword removal, stemming dan weighting TF-IDF menggunakan penggabungan fitur unigram dan bigram baru kemudian diolah menjadi teks klasifikasi. Hasil dari penelitian ini didapatkan kesimpulan bahwa algoritma Random Forest memiliki akurasi terbaik dalam mengklasifikasikan berita hoax dan berita asli dibandingkan dengan algoritma Multilayer Perceptron, Naïve Bayes,dan Support Vector Machine dengan nilai akurasi 75.37%.

Kata kunci : Klasifikasi, Berita, Hoax, Text mining, Machine learning