Please take a moment to complete this survey below

Library's collection Library's IT development Cancel

Analisis korelasi pada data Yahoo! properties dan instant messaging dengan menggunakan Hadoop

Dalam beberapa tahun terakhir, Big Data menjadi trend dalam dunia teknologi informasi. Sejalan dengan berkembangnya organisasi semakin banyak data bisnis yang dimiliki, beberapa dapat mencapai skala Terabytes hingga Pentabytes. Ketika sebuah organisasi ingin melakukan analisa terhadap sebuah Big Data maka waktu analisa menjadi sangat lama dikarenakan keterbatasan CPU dan memori. Untuk mengatasi hal ini, munculah sebuah paradigma yaitu distributed computing. Ada banyak tools yang bertujuan untuk mengolah Big Data seperti Apache Hadoop, Apache Spark, dan sebagainya. Akan tetapi, yang akan dianalisa adalah Apache Hadoop.
Rate adopsi Big Data di Indonesia adalah 20% untuk 2 sampai 3 tahun ke depan (Aggarwal, 2015). Melihat fakta tersebut, semakin banyak perusahaan yang berencana mengadopsi Big Data untuk analisa datanya. Melihat sedang berkembangnya penggunaan Big Data dan Apache Hadoop, maka dilakukan eksplorasi analisis terhadap korelasi data pada Apache Hadoop. Selain itu, dilakukan juga pengujian Apache Hadoop dengan menggunakan jumlah node yang bervariasi, jumlah mapper dan reducer, dan menggunakan jumlah block size yang berbeda.
Eksplorasi analisis korelasi data pada Apache Hadoop dilakukan dengan membuat 4 jenis aplikasi analisa data, yaitu dua aplikasi pencarian nilai korelasi untuk data Yahoo! Messenger dan dua aplikasi pencarian pohon klasifikasi. Berdasarkan hasil pengujian didapatkan bahwa untuk pencarian nilai korelasi aplikasi R lebih cocok untuk ukuran data yang lebih kecil sedangkan Hadoop lebih cocok untuk ukuran data yang besar. Untuk data yang besar, aplikasi R menggunakan persentase CPU dan memori yang lebih tinggi daripada hadoop. Kombinasi mapper dan reducer yang akan memberikan waktu eksekusi optimal adalah untuk mapper dalam rentan.

Creator(s)
  • (26413004) MIKIAVONTY ENDRAWATI M.
Contributor(s)
  • Henry Novianus Palit, S.Kom → Advisor 1
  • Andreas Handojo → Advisor 2
  • Adi Wibowo, S.T., M.T. → Examination Committee 1
Publisher
Universitas Kristen Petra; 2017
Language
Indonesian
Category
s1 – Undergraduate Thesis
Sub Category
Skripsi/Undergraduate Thesis
Source
Skripsi No. 03021611/INF/2017; Mikiavonty Endrawati Mirabel (26413004)
Subject(s)
  • DATABASE MANAGEMENT
  • ELECTRONIC DATA PROCESSING-DISTRIBUTED SYSTEMS
  • YAHOO MESSENGER (COMPUTER PROGRAM)
File(s)

Similar Collection

by creator, contributor, or subject