基本信息

案例ID:236596

技术顾问:李志强 - 3年经验 - 亚信科技

联系沟通

微信扫码,建群沟通

项目名称:图片爬取

所属行业:工具 - 办公软件

->查看更多案例

案例介绍

1,spider原理 spider就是定义爬取的动作及分析网站的地方. 以初始的url**初始化request**,并设置回调函数.当该request**下载完毕并返回时,将生成**response ,并作为参数传给该回调函数. 2,实现python爬虫爬取图片 第一步:导入正则表达式模块import re #导入正则表达式模块 import requests # python http客户端编写爬虫和测试服务器经常用到的模块 import random #随机生成一个数,范围[0,1] 第二步:使用定义函数的方法爬取图片def spiderpic(html, keyword): print('正在查找 ' + keyword + '对应的图片,下载中,请稍后......') for addr in re.findall('"objurl":"(.*?)"', html, re.s): #查找url print('正在爬取url地址:' + str(addr)[0:30] + '...') #爬取的地址长度超过30时,用'...'代替后面的内容 try: pics = requests.get(addr, timeout=100) #请求url时间(最大10秒) except requests.exceptions.connectionerror: print('您当前请求的url地址出现错误') continue fq = open('h:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') #下载图片,并保存和命名 fq.write(pics.content) fq.close() .

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服