Please take a moment to complete this survey below
Library's collection Library's IT development CancelDengan meningkatnya pengguna internet khususnya website, memberikan celah bagi
para pelaku phishing untuk mendapatkan atau mencuri informasi pribadi dari para pengguna.
Pada setiap website akan terdapat banyak informasi yang akan dijadikan feature, feature
tersebut akan dimanfaatkan untuk mengklasifikasikan website phishing. Feature akan dibagi
menjadi 3 yaitu url feature, content feature, dan external feature.
Dalam penelitian ini akan menggunakan tiga metode yaitu C5.0, XGBoost, dan Random
Forest. Ketiga metode akan diuji kinerjanya untuk mencari metode terbaik dalam
mengklasifikasikan website phishing. Selain itu penelitian ini juga akan memanfaatkan feature
selection dengan tujuan untuk membuang feature yang tidak berpengaruh sehingga training
time dapat dipersingkat.
Berdasarkan hasil pengujian yang diperoleh menunjukan, bahwa C5.0 mampu
memberikan nilai accuracy, precision, recall, & f1-score dengan rata-rata sebesar 93,5%,
XGBoost dengan rata-rata sebesar 96,6%, dan Random Forest dengan rata-rata sebesar 95,7%.
Penggunaan feature selection pada ketiga algoritma juga menunjukan, bahwa training time
dapat dipersingkat dengan rata-rata sekitar 3,53 kali lebih cepat dengan hanya menggunakan
15 feature importance saja. Namun dengan penggunaan feature selection, performa pada nilai
accuracy, precision, recall, & f1-score terjadi sedikit penurunan walaupun penurunan yang
diberikan tidak signifikan atau tidak berdampak besar pada proses klasifikasi.