ID:216922

Defeat And Victory 身份已认证

爬虫工程师

  • 公司信息:
  • 宅仓网路科技有限公司
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 上海
  • 杨浦

技术能力

1.爬虫方面
熟练掌握Python语言,熟练使用Python标准库,可以快速学习上手流行的第三方库
熟练掌握MySQL,熟悉MongoDB,Redis等常见数据库
熟练使用Scrapy框架爬取数据
熟练掌握各种反扒机制
熟练使用requests等爬虫相关模块
熟悉HTML/JavaScript/CSS/Ajax等web技术知识
熟练掌握网页抓取原理及技术,熟悉基于正则表达式、XPath、CSS选择器、等网页信息抽取技术,从结构化的和非结构化的数据中获取信息
理解基于Cookie的登录原理,熟悉应用IP池、Headers认证等
熟悉scrapy-redis分布式,增量式爬虫
熟悉Django框架及web后端开发
熟悉Fiddler,charles工具抓取移动端APP数据

项目经验

1.爬虫方面
熟练掌握Python语言,熟练使用Python标准库,可以快速学习上手流行的第三方库
熟练掌握MySQL,熟悉MongoDB,Redis等常见数据库
熟练使用Scrapy框架爬取数据
熟练掌握各种反扒机制
熟练使用requests等爬虫相关模块
熟悉HTML/JavaScript/CSS/Ajax等web技术知识
熟练掌握网页抓取原理及技术,熟悉基于正则表达式、XPath、CSS选择器、等网页信息抽取技术,从结构化的和非结构化的数据中获取信息
理解基于Cookie的登录原理,熟悉应用IP池、Headers认证等
熟悉scrapy-redis分布式,增量式爬虫
熟悉Django框架及web后端开发
熟悉Fiddler,charles工具抓取移动端APP数据

案例展示

  • 唯品会scrapy

    唯品会scrapy

    项目一:对唯品会网站数据的抓取 责任描述:编写爬虫程序,想出反爬策略,数据清洗分表存储,维护代理IP池 项目简介: 项目概况: 爬取唯品会分类下所有女装. 遇到问题及解决方案如下: 1、爬取量较大,用scrapy-redis爬取,因为该框架实现url和数据去重、持久化

  • 58同城数据抓取

    58同城数据抓取

    项目一:对唯品会网站数据的抓取 责任描述:编写爬虫程序,想出反爬策略,数据清洗分表存储,维护代理IP池 项目简介: 项目概况: 爬取唯品会分类下所有女装. 遇到问题及解决方案如下: 1、爬取量较大,用scrapy-redis爬取,因为该框架实现url和数据去重、持久化

  • 京东数据抓取

    京东数据抓取

    根据公司要求提取京东任意一商品的数据,要求是商品图片,名称,价格,链接,以及详情界面的轮播图,根据品牌抓取分类

  • 对亚马逊数据对抓取

    对亚马逊数据对抓取

    根据公司要求,对亚马逊对任意一商品进行数据抓取,要求抓取品牌名称,商品图片,商品链接,价格以及详情界面的轮播图,商品详情图

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服