ID:120529

18

python 后端

  • 公司信息:
  • 人人优活科技
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 深圳
  • 全区

技术能力

熟悉django的开发流程,
使用各种数据提取手段,js xpath 正则可以制定完整的爬虫方案,优化爬取效率
熟悉爬虫scrapy框架搭建分布式爬取
mysql数据的索引优化
Nginx加wsgi部署项目

项目经验

项目:淘宝页面抓取
职责:负责页面分析,抓取工作,将数据进行存储
技术名词:mongodb,selenim,chrome/phantomJS,xpath,scrapy
项目流程:1.搜索关键字:利用selenium驱动浏览器搜索关键字,得到查询后的商品列表
2.分析页面并完成分页:得到商品的页码数,模拟翻页,得到后续的商品列表
3.采用MongoDB作为本地数据库,将要提取的数据,保存在mongodb中,同时每次下载前会检查请求指纹,防止重复下载,避免资源浪费;
4.分析提取商品内容:利用PyQuery分析源码,解析得到商品列表

评价列表

该用户已被预约 1 次,预约方未评价,系统默认 5星 好评。

信用行为

  • 接单
    1
  • 评价
    0
  • 收藏
    0
  • 五星率
    100%
  • 退款
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服