Please take a moment to complete this survey below

Library's collection Library's IT development Cancel

Penerapan metode web scraping menggunakan scrapy untuk pembuatan konten pada aplikasi pencari lowongan kerja

Banyaknya jumlah pengangguran di Indonesia beberapa tahun terakhir sangatlah memprihatinkan, meskipun Indonesia sendiri mengalami surplus ekonomi, terutama selama pandemi COVID-19. Kondisi ini mendorong untuk dibuatnya sebuah platform yang dapat menyatukan penyedia lowongan kerja dengan pencari kerja secara lebih efisien; di mana penyedia lowongan kerja perlu menyebarkan lowongan mereka ke khalayak yang lebih luas, sedangkan pencari kerja perlu mendapatkan akses ke lowongan kerja yang lebih banyak. Metode Web Scraping dapat membantu mengatasi masalah tersebut dengan mengambil data lowongan kerja dari berbagai situs penyedia lowongan kerja, dan kemudian menyajikan data tersebut ke pencari kerja melalui sebuah platform yang mudah digunakan.
Sebuah kontroversi besar mengenai proses web scraping pada situs lowongan kerja adalah legalitas dari proses tersebut dan aksi dari beberapa situs penyedia lowongan kerja yang memblokir proses web scrapin untuk melindungi kepentingan bisnis, seperti pada contoh kasus LinkedIn. Taktik pemblokiran yang umum digunakan adalah pembatasan request, penggunaan robots.txt, pelarangan user agent tertentu, dan juga blacklist alamat IP.
Penelitian ini dilakukan untuk membantu mengatasi masalah-masalah di atas, dengan cara mengambil data lowongan kerja dari berbagai situs penyedia lowongan kerja menggunakan web scraping, melakukan berbagai metode yang bertujuan untuk mencegah pemblokiran pada proses web scraping data, menyimpan data yang diambil tersebut pada sebauh sistem database yang tersentralisasi, dan menyajikan data lowongan tersebut ke pencari kerja melalui sebuah aplikasi mobile yang mudah digunakan. Adapun metode mitigasi pemblokiran yang digunakan adalah bandwidth autothrottling, user agent randomization, ignore robots.txt, dan juga melalui penggunaan proxy server.
Berdasarkan hasil pengujian yang telah dilakukan, program yang dibuat berhasil mengambil data lowongan kerja dari berbagai situs penyedia lowongan kerja yang diuji, meskipun terdapat beberapa kekurangan dalam proses pengambilan data tersebut. Metode-metode mitigasi pemblokiran yang dianjurkan juga berhasil menghindari blokir dari sebagian besar situs yang diuji, namun karena kurangnya fasilitas, satu metode tidak dapat dilakukan pengujian.

Creator(s)
  • (C14180045) ALVIN CHRISTIAN LORENCE
Contributor(s)
  • Agustinus Noertjahyana → Advisor 1
  • Alvin Nathaniel Tjondrowiguno, S.Kom., M.T. → Examination Committee 1
  • Justinus Andjarwirawan → Examination Committee 2
Publisher
Universitas Kristen Petra; 2023
Language
Indonesian
Category
s1 – Undergraduate Thesis
Sub Category
Skripsi/Undergraduate Thesis
Source
Skripsi No. 01022250/INF/2023; Alvin Christian Lorence (C14180045)
Subject(s)
  • PROGRAMMING LANGUAGES (ELECTRONIC COMPUTERS)
  • WEB APPLICATIONS
  • WEB SITES--DESIGN
File(s)

Similar Collection

by creator, contributor, or subject