Python 06d scrap

 0    6 fiche    swiatangielskiego
laste ned mp3 Skriv ut spille sjekk deg selv
 
spørsmålet svaret
instalacja webscraping
begynn å lære
pip install beautifulsoup4
import webscraping oraz urllib oraz lxml
begynn å lære
import bs4 as bs import urllib. request import lxml
pobranie html z url
begynn å lære
url_content = urllib. request. urlopen('url'). read()
ekstrakcja linków do stron filmów
begynn å lære
find_url = bs. BeautifulSoup(url_content, 'lxml')
wyodrębnić wszystkie wystąpienia określonego tagu
begynn å lære
find_url_tds = find_url. findAll('td', {'class': 'titleColumn'})
jeśli wielokrotnie wyodrębniasz linki, możesz użyć poniższej funkcji:
begynn å lære
base_url + find_url_td. find('a'). attrs['href']

Du må logge inn for å legge inn en kommentar.