Mengenal fungsi Find_all Beautifulsoup
Mengenal Fungsi Find_all BeautifulSoup
Hai para pembaca!!!
Pada kesempatan kali ini kita akan membahas sedikit tentang fungsi find_all yang terdapat pada library Beautifulsoup. Sebelum itu apakah kalian sudah mengenal apa itu library BeautifulSoup, library BeautifulSoup sendiri merupakan sebuah Python Library yang digunakan untuk melakukan ekstraksi file dengan format XML atau HTML. Library ini memiliki banyak fungsi yang kita perlukan untuk melakukan ekstraksi informasi dari file kita dan sangat mudah digunakan.
Di dalam library BeutifulSoup sendiri terdapat dua fungsi yang sering digunakan antara lain yaitu:
Fungsi Find
Digunakan untuk mengambil potongan kode HTML atau kode HTML secara spesifik (jika terdapat tag HTML atau class atau id yang sama lebih dari satu maka tag yang diambil adalah tag yang paling atas di halaman HTML) dan dapat digunakan untuk mengambil nilai dengan atribut tertentu.
Fungsi Find_all
fungsi ini untuk mengambil semua tag yang sama, dan hasilnya akan dikembalikan atau di return list contoh:
from bs4 import BeautifulSoup
import requests
for x in range(1, 11):
url = "https://quotes.toscrape.com/page/"+str(x)
print(url)
print("------------------------------")
html = requests.get(url)
html_soup = BeautifulSoup(html.content,'html.parser')
quotes = html_soup.find_all('div', class_ = 'quote')
for q in quotes:
quotes = q.find('span', class_ = 'text').text
author = q.find('small', class_ = 'author').text
tag = q
print(quotes)
print(author)
print("------------------------------")
Dari script diatas kita akan melakukan perulangan for 10x dan akan dimasukan dalam variabel url yang berisi alamat website yang akan kita scrape , selanjutnya kita akan melakukan requests dengan alamat yang pada bagin akhirnya kita beri looping ssebanyak 10x supaya bisa berganti page secara otomatis lalu kita menggunakan fingsi find_all untuk untuk mengambil atribut dengan tag seperti pada script diatas.
sebenarnya masih banyak fungsi yang dapat dipelajari tapi fungsi yang paling sering dan paling unum digunakan adalah fungsi find() dan findAll().
Terimakasih telah membaca blog ini sampai akhir semoga dapat menambah ilmu anda dan semoga bermanfaat.
Komentar
Posting Komentar