python-BeautifulSoup-解析HTML利器

python自带的解析HTML很是复杂,从Google搜索中,发现BeautifulSoup这个第三方库在解析HTML轻便很多,几乎与jQuery选择器一样好用。

而且BeautifulSoup官方文档还有中文版 🙂

英文版 中文版

官方说明很详细,如果大家有要使用python解析HTML时,推荐用BeautifulSoup试试。

这里我举两个在代码用的例子:

from bs4 import BeautifulSoup

# 此处代码省略
...

soup = BeautifulSoup(html)
# 找class是nav的a标签
next_page = soup.select(".nav > a")
# 找class是wm lh的a标签
picture = soup.select(".wm.lh > a")

# 很像jQuery的选择器吧?哈哈

发表评论