PEMANFAATAN FUNGSI FIND_ALL

Beautiful Soup punya banyak metode untuk mencari DOM tree. Berbagai metode tersebut sangat mirip dan menggunakan jenis filter yang sama sebagai argumen. Oleh karenanya, masuk akal jika sebelumnya harus dipahami dengan benar tentang filter yang berbeda sebelum membaca tentang metode. Saya akan menggunakan metode find_all() yang sama untuk menjelaskan perbedaan antara filter-filter yang berbeda.

Filter paling sederhana yang bisa dimasukkan ke metode pencarian apa saja adalah string. Maka Beautiful Soup akan mencari ke dalam dokumen untuk menemukan tag yang secara tepat sesuai dengan stringnya.

 

Anda juga bisa memasukkan suatu ekspresi regular objek ke metode find_all(). Kali ini, Beautiful Soup akan memfilter tree dengan mencocokkan semua tag terhadap ekspresi regular yang diberikan.

 

Code ini akan mencari semua tag yang dimulai dengan huruf "h" dan diikuti suatu digit dari 1 sampai 6. Dengan kata lain, akan mencari semua tag heading di dalam dokumen.

Daripada menggunakan regex, Anda bisa mendapat hasil yang sama dengan memasukkan daftar semua tag yang Anda ingin Beautiful Soup mencocokkannya dengan dokumen.

 Anda juga bisa memasukkan True sebagai parameter untuk metode find_all(). Kode tersebut akan mengembalikan semua tag yang dimaksud dalam dokumen. Keluaran di bawah ini menunjukkan bahwa ada 4.339 tag di halaman Wikipedia yang kita parsing


Jika Anda masih tidak mampu menemukan apa yang Anda cari dengan filter-filter di atas, Anda bisa menetapkan fungsi Anda sendiri yang menjadikan suatu elemen sebagai satu-satunya argumennya. Fungsi tersebut juga harus mengembalikan True jika cocok dan False jika sebaliknya. Tergantung kebutuhan, Anda bisa membuat fungsinya sekompleks yang diperlukan untuk menyelesaikan tugasnya. berikut adalah suatu contoh yang sangat sederhana : 

 

 

 

 

 

 

 

 

Komentar

Postingan populer dari blog ini

Cara Scrape Lazada dengan Python

MENGENAL CARA KERJA KOMPUTER DAN BAHASA PEMROGRAMAN

Analisis Model IT Menggunakan Balanced Scorecard Untuk Pengembangan Sistem Teknologi Informasi