ID:274162

春日微风

python爬虫

  • 公司信息:
  • 北京阿提拉科技有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 海淀

技术能力

熟练网络爬虫、python编程语言、数据分析、django框架
熟悉html5、javaweb等常见编程语言
django架构,熟悉scrapy框架以及相关的扩展、熟练使用mysql和redis数据库

项目经验

链家网:
网站是静态网页数据,请求url地址是可以直接获取数据内容的
相关的数据内容价格、面积、地址、小区名等都包含在li标签里面,通过parsel解析库,进行解析提取数据
最后利用利用scrapy爬虫框架将数据入库到mysql数据库
安居客网:
网站是静态网页数据,请求url地址是可以直接获取数据内容的
在抓取安居客的房源数据时,发现其对ip地址有严格的访问限制
利用scrapy爬虫框架,redis数据库用来批量存储第三方代理ip形成ip池
scrapy爬虫每次爬取安居客数据时轮询的方式从redis中读取可用IP地址爬取数据

案例展示

  • 腾讯新闻首页

    腾讯新闻首页

    import requests from lxml import etree import re def xiangqi(data): html_=requests.get(data['link']) # print(html_)charset=utf-

  • 腾讯新闻首页

    腾讯新闻首页

    import requests from lxml import etree import re def xiangqi(data): html_=requests.get(data['link']) # print(html_)charset=utf-

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服