Klasifikasi Malware Menggunakan Teknik Machine Learning
Kata Kunci:
klasifikasi malware, machine learning, metode Random Forest, confusion matrix, akurasiAbstrak
Abstrak - Jaringan komputer yang terhubung dengan internet dapat mengakses informasi dari seluruh dunia dengan sangat mudah. Namun, koneksi antara jaringan dan Internet justru meningkatkan potensi kegagalan sistem. Salah satu metode yang bisa digunakan pada machine learning merupakan metode algoritma random forest. Random forest merupakan salah satu metode pada machine learning yang digunakan untuk memecahkan masalah klarifikasi, Berdasarkan permasalahan tersebut perlu dilakukan klasifikasi malware yang datanya diambil dari dataset malware agar dapat memudahkan dalam mempelajari dan membedakan jenis malware. Proses terdiri dari pengumpulan dataset, pre proseccing, melatih machine learning dan melakukan pengujian performa model atau kinerja. Penelitian ini bertujuan untuk mengetahui performa atau kinerja Machine Learning menggunakan algoritma random forest untuk klasifikasi malwarerandom forest. Pada proses ini pra pemrosesan data dilakukan dengan menginstal beberapa library python. Pandas adalah library python open source yang biasanya digunakan untuk kebutuhan data analisis. Model dilatih pada dataset dengan berbagai fitur dan hasilnya menunjukan akurasi yang tinggi sebesar 99%, yaitu berupa proses menganalisis sekumpulan data untuk meringkas karakteristik utamanya agar pengguna lebih memahami dataset yang akan digunakan. Model random forest memberikan hasil yang sangat baik tanpa preprocessing pada data. Hasilnya bagus meskipun datanya tidak seimbang. Tidak perlu menggunakan teknik apapun untuk menyeimbangkannya. Penskalaan/skaling tidak perlu dilakukan, model andom forest adalah model partisi rekursif yang bergantung pada partisi data karena ia bekerja pada pemisahan nilai fitur dan tidak melkukan perhitungan di dalamnya. Hasil penelitian menunjukkan bahwa model memiliki presisi 0,99.
