python爬虫-批量下载图片

刚好有个要爬国内某大型网站图片库的需求(国内网站中有海量图片库的网站屈指可数哦),索性就用python练练手,也很久不写了。试试

思路看代码就好,某网站地址我用a_website过滤,你懂的 🙂

python 环境:ActivePython 2.7.2.5

下载图片需要wget,没有的请自行下载。…

Continue reading »

web.py 自定义404页面

被官方参考误解:http://webpy.org/cookbook/custom_notfound.zh-cn

不要使用notfound()方法就是了。

# coding:utf-8

import web

urls = (
    '/', 'index'
)

app = web.application(urls, globals())

render = web.template.render('templates/')

def my_notfound():
    return web.notfound("""
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<html>
<head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>pctools</title>
</head>
<body>
404
</body>
</html>
""")
web.webapi.notfound = my_notfound

app = web.application(urls, globals())

Continue reading »