Pre-processing dengan R / Pre-processing on R
Pre - pocessing merupakan proses untuk mempersiapkan data menjadi terstruktur dengan mengubah data menjadi bentuk yang mudah untuk diproses oleh sistem sehingga data dapat dianalisis. cleansing Membersihkan tweet dari noise berupa angka, username (@), Retweet, RT, HTML, link, hastag (#), emoticon, dan tanda baca lainnya seperti “,!$%^&*”. Case folding Mengubah semua huruf kapital ( uppercase ) menjadi huruf kecil ( lowercase ) Normalisasi Normalisasi merupakan tahapan merubah kata tidak baku yang terdapat pada data menjadi kata baku, daftar kata Normalisasi dapat diakses melalui https://github.com/nasalsabila/kamus-alay. Replace word Replace word merupakan tahapan merubah kata-kata asing menjadi kata-kata Bahasa Indonesia seperti “stay safe” menjadi “tetap aman” dan memperpendek kata-kata yang berlebihan seperti “gempaaaa” menjadi “gempa”. Kata-kata bisa ditambahkan sendiri sesuai kebutuhan pre-processing data Stemming Stemming merupakan proses men...