Cara Scrape Lazada dengan Python

 

Cara Scrape Lazada dengan Python

Web Scraping Lazada

Web scrapping pada salah satu situs online shop yaitu Lazada. Data Scrapping merupakan kegiatan untuk menemukan data dan mengumpulkannya. Data diambil secara langsung dari sebuah sumber, tidak hanya dari web tetapi bisa dari berbagai sumber dimana terdapat data. Ini mencakup spreadsheets, storage devices, dll. Proses ini diperlukan untuk menyaring (filtering) dan membedakan berbagai jenis data mentah dari berbagai sumber menjadi sesuatu yang berguna dan informatif. Sedangkan web scrapping sendiri merupakan proses data scrapping yang dilakukan hanya dari sumber website.Web scrapping ini sangat berguna pada bisnis online baik itu untuk riset pasar, riset kompetitor, atau mencari leads. Namun, manfaatnya lebih dari sekedar itu.

Pada artikel kali ini saya akan membahas langkah-langkah web scraping pada salah satu website online shop yang cukup terkenal yaitu Lazada. Untuk melakukan web scraping pada situs Lazada ini kita akan menggunakan bahasa pemrograman python karena bahasa python sendiri yang mudah untuk diaplikasikan serta ketersediaan library-library pendukung yang sangat melimpah. Data yang akan kita hasilkan pada proses scrapping ini berupa data json. Untuk mendapatkan data dari web Lazada kita menggunakan Api yang telah tersedia pada situs Lazada yang dapat kita lihat ketika kita melakukan inspect elemen pada situs website Lazada.

Tutorial web scraping Lazada

Sebelum memulai tutorial kali ini pastikan anda telah menginstall python pada laptop atau pc kalian. Jika belum kalian bisa mendownloadnya terlebih dahulu melalui situs python di python.org. Untuk editor saya menggunakan jupyter notebook anda dapat menggunakan editor lain seperti visual studio code atau pycharm atau editor lain sesuai dengan kesenangan kalian tapi pastikan editor tersebut support untuk coding python. Pada tutorial ini saya akan menggunakan library Beautiful Soup.

Beautiful Soup 

Beautiful Soup merupakan sebuah library Python yang memungkinkan kita untuk melakukan scraping dengan mudah dan cepat, keunggulan Beatutiful Soup adalah :

  1. Beautiful Soup hadir dengan metode-metode yang sederhana sehingga kita dengan mudah melakukan proses navigasi, pencarian dan juga modifikasi struktur data situs yang kita scraping.
  2. Beautiful Soup secara otomatis mampu menkonversi dokumen ke dalam format UTF-8.
  3. Bekerja dengan baik dengan library Python lxml dan html5lib untuk melakukan parsing dokumen.

Cara Scrape Web Lazada dengan Python






Untuk memulai proses coding pertama-tama kalian harus menginstall library Beautiful soup terlebih dahulu. Untuk menginstall library Beautiful soup dapat dilakukan dengan mengetikkan perintah pip3 install beautifulsoup tapi sebelumnya pastikan anda telah menginstall PIP terlebih dahulu dengan menggunakan perintah apt-get install python3-pip . Untuk kalian yang menggunakan Anaconda kalian dapat menginstall library Beautiful soup dengan menggunakan perintah conda untuk menggantikan pip. Setelah itu buka editor kalian dan buat sebuah file python baru pada editor yang kalian gunakan. Untuk yang menggunakan jupyter notebook anda dapat membuat file baru dengan menekan tombol new pada bagian pojok kanan atas kemudian pilih python3. Copykan script berikut pada file python baru yang kalian telah buat serta pastikan indentasinya sudah benar agar tidak terjadi error dikarenakan python sangat sensitif terhadap indentasi .

  1. Langkah pertama masuk ke Website www.lazada.com, tentukan barang yang akan di Scrape.


  2. Langkah kedua tentukan Json dan Beautiful Soup, setelah di proses hasilnya seperti tampilan dibawah ini 


  3. Langkah ketiga, keluar hasil Json  


Komentar

Postingan populer dari blog ini

MENGENAL CARA KERJA KOMPUTER DAN BAHASA PEMROGRAMAN

Analisis Model IT Menggunakan Balanced Scorecard Untuk Pengembangan Sistem Teknologi Informasi