1,spider原理 spider就是定义爬取的动作及分析网站的地方. 以初始的url**初始化request**,并设置回调函数.当该request**下载完毕并返回时,将生成**response ,并作为参数传给该回调函数. 2,实现python爬虫爬取图片 第一步:导入正则表达式模块import re #导入正则表达式模块 import requests # python http客户端编写爬虫和测试服务器经常用到的模块 import random #随机生成一个数,范围[0,1] 第二步:使用定义函数的方法爬取图片def spiderpic(html, keyword): print('正在查找 ' + keyword + '对应的图片,下载中,请稍后......') for addr in re.findall('"objurl":"(.*?)"', html, re.s): #查找url print('正在爬取url地址:' + str(addr)[0:30] + '...') #爬取的地址长度超过30时,用'...'代替后面的内容 try: pics = requests.get(addr, timeout=100) #请求url时间(最大10秒) except requests.exceptions.connectionerror: print('您当前请求的url地址出现错误') continue fq = open('h:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') #下载图片,并保存和命名 fq.write(pics.content) fq.close() .