python自带的解析HTML很是复杂,从Google搜索中,发现BeautifulSoup这个第三方库在解析HTML轻便很多,几乎与jQuery选择器一样好用。
而且BeautifulSoup官方文档还有中文版 🙂
官方说明很详细,如果大家有要使用python解析HTML时,推荐用BeautifulSoup试试。
这里我举两个在代码用的例子:
from bs4 import BeautifulSoup # 此处代码省略 ... soup = BeautifulSoup(html) # 找class是nav的a标签 next_page = soup.select(".nav > a") # 找class是wm lh的a标签 picture = soup.select(".wm.lh > a")
# 很像jQuery的选择器吧?哈哈