MENGENAL BEAUTIFULSOUP DAN REQUESTS
BeautifulSoup adalah library Web Paser untuk Python. BeautifulSoup memiliki banyak fungsi untuk melakukan navigasi obyek DOM pada HTML. Untuk install BeautifulSoup, gunakan perintah berikut pada command prompt: pip install beautifulsoup4 Lalu install lxml, library pendukungnya, dengan menggunakan perintah: pip install lxml soup = BeautifulSoup(file_html, 'parser') Syntax diatas adalah untuk menggunakan beautifulSoup. file_html adalah file html yang akan diparsing, parser dapat menggunakan lxml atau html.parser . Berikut adalah file html yang akan digunakan untuk contoh penggunaan BeautifulSoup. Perhatian, contoh dibawah dilakukan di REPL. >>> html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b>The Dormouse's story</b></p> <p class="story">Once upon a time there were three little sisters; a...