Cara Scrape Lazada dengan Python
Cara Scrape Lazada dengan Python
Web Scraping Lazada
Web scrapping
pada salah satu situs online shop yaitu Lazada. Data Scrapping merupakan
kegiatan untuk menemukan data dan mengumpulkannya. Data diambil secara langsung
dari sebuah sumber, tidak hanya dari web tetapi bisa dari berbagai sumber
dimana terdapat data. Ini mencakup spreadsheets, storage devices, dll. Proses
ini diperlukan untuk menyaring (filtering) dan membedakan berbagai jenis data
mentah dari berbagai sumber menjadi sesuatu yang berguna dan informatif.
Sedangkan web scrapping sendiri merupakan proses data scrapping yang dilakukan
hanya dari sumber website.Web scrapping ini sangat berguna pada bisnis online
baik itu untuk riset pasar, riset kompetitor, atau mencari leads. Namun,
manfaatnya lebih dari sekedar itu.
Pada artikel kali ini saya akan
membahas langkah-langkah web scraping pada salah satu website online shop yang
cukup terkenal yaitu Lazada. Untuk melakukan web scraping pada situs Lazada ini
kita akan menggunakan bahasa pemrograman python karena bahasa python sendiri
yang mudah untuk diaplikasikan serta ketersediaan library-library pendukung
yang sangat melimpah. Data yang akan kita hasilkan pada proses scrapping ini
berupa data json. Untuk mendapatkan data dari web Lazada kita menggunakan Api
yang telah tersedia pada situs Lazada yang dapat kita lihat ketika kita
melakukan inspect elemen pada situs website Lazada.
Tutorial
web scraping Lazada
Sebelum memulai tutorial kali ini
pastikan anda telah menginstall python pada laptop atau pc kalian. Jika belum
kalian bisa mendownloadnya terlebih dahulu melalui situs python di python.org.
Untuk editor saya menggunakan jupyter notebook anda dapat menggunakan editor
lain seperti visual studio code atau pycharm atau editor lain sesuai dengan
kesenangan kalian tapi pastikan editor tersebut support untuk coding python.
Pada tutorial ini saya akan menggunakan library Beautiful Soup.
Beautiful Soup
Beautiful Soup merupakan sebuah library Python
yang memungkinkan kita untuk melakukan scraping dengan mudah dan cepat,
keunggulan Beatutiful Soup adalah :
- Beautiful
Soup hadir dengan metode-metode yang sederhana sehingga kita dengan mudah
melakukan proses navigasi, pencarian dan juga modifikasi struktur data
situs yang kita scraping.
- Beautiful
Soup secara otomatis mampu menkonversi dokumen ke dalam format UTF-8.
- Bekerja
dengan baik dengan library
Python lxml dan html5lib untuk melakukan parsing
dokumen.
Cara
Scrape Web Lazada dengan Python
Untuk memulai proses coding pertama-tama kalian harus
menginstall library Beautiful soup terlebih dahulu. Untuk menginstall library
Beautiful soup dapat dilakukan dengan mengetikkan perintah pip3
install beautifulsoup tapi sebelumnya pastikan anda telah menginstall
PIP terlebih dahulu dengan menggunakan perintah apt-get install
python3-pip . Untuk kalian yang menggunakan Anaconda kalian dapat
menginstall library Beautiful soup dengan menggunakan perintah conda untuk
menggantikan pip. Setelah itu buka editor kalian dan buat sebuah
file python baru pada editor yang kalian gunakan. Untuk yang menggunakan
jupyter notebook anda dapat membuat file baru dengan menekan tombol new pada
bagian pojok kanan atas kemudian pilih python3. Copykan script berikut pada
file python baru yang kalian telah buat serta pastikan indentasinya sudah benar
agar tidak terjadi error dikarenakan python sangat sensitif terhadap indentasi
.
- Langkah
pertama masuk ke Website www.lazada.com,
tentukan barang yang akan di Scrape.
- Langkah
kedua tentukan Json dan Beautiful Soup, setelah di proses hasilnya seperti tampilan dibawah ini
- Langkah
ketiga, keluar hasil Json
Komentar
Posting Komentar