ID:134230

李明

爬虫工程师

  • 公司信息:
  • 北京锐安科技有限公司
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 全区

技术能力

1. 熟练使用Python urllib2、Requests等网络模块。
2. 熟练使用Selenium+PhantomJS实现动态HTML抓取。
3. 熟练掌握Scrapy框架、scrapy-redis分布式组。
4. 了解Django/Flask框架。
5. 熟悉Redis缓存技术。
6. 了解MySQL,MongoDB数据库。
7. 熟悉CSS,JS,HTML,能够完成简单的页面开发。
8. 了解JavaScript、Ajax、JQuery等WEB前端技术。

项目经验

项目名称:态势感知大数据平台系统
开发环境:Pycharm + Scrapy框架 + Scrapy-redis分布式组件 + Mongodb + Redis
项目工作:爬取贴吧、微博热门,明星,大V的微博,分析内容和客户公司相关信息,进行反馈, 实时抓取微博与客户有关的负面微博,及时汇报给客户
项目职责:负责爬虫的开发和维护
主要技术:
1、采用scrapy框架开发 scrapy-redis分布式实现
2、请求中加入cookie,获取登陆权限
3、对于图片登陆验证,使用Tesseract等第三方模块识别
5、分布式使用Redis做为缓存数据库,利用Redis的高并发和I/O读写来实现下载,将数据同步到Mongodb数据库里,并建立索引方便查询和管理
6、为了保证数据抓取的准确, 购买了IP代理池,每10次发送请求,更换一次代理ip

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服