ID:264213

か冷~ 有团队

爬虫工程师

  • 公司信息:
  • 珠江智联
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 600元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 广州
  • 海珠

技术能力

熟练python语言、C语言,具有良好的编程习惯及编程能力;
掌握Linux 基本操作;
熟悉 TCP/IP、HTTP、HTTPS等网络协议,熟悉HTML5、JavaScript,了解Bootstrap框架;
掌握使用Scrapy和Scrapy-redis框架爬虫框架,熟悉大规模高性能抓取技巧;
熟悉Fidder、Xpath、正则、自动化测试selenium;
熟悉HOOK、chrome油猴等脚本注入技术;
掌握MySQL、熟悉MongoDB、Redis数据库;
熟悉爬虫管理系统crawlab开发使用;
熟悉Django后端框架及Flask后端框架;
有大型网站数据采集、基本js混淆逆向开发及有过APP抓包分析能力;

项目经验

项目描述:起初公司招聘信息渠道并不完善,而公司业务与国家工信部之间合作针对职业教育发展做平台,数据的来源需要比较完善因此基于全国各大招聘信息,企业信息,进行数据分析操作。

项目技术:scrapy、scrapy-redis、aiosync、selenium、pyexcejs、nodejs、crawlab;

项目负责:

负责招聘网站的拓展与评估;
负责全国各大招聘网站爬虫脚本开发与维护;
负责企业信息采集,实现途径各大招聘网站注册信息进行采集
负责解决各个网站对应的反爬措施含验证码,cookies,post参数等风控问题
负责项目整体维护升级管理,纳入crawlab爬虫管理系统,优化定时采集策略;
项目总结:

网站数量过多难以维护,通过托于爬虫管理系统crawlab进行定时采集,邮箱发送是否采集失败;
部分网站出现有反人类验证码,需要通过自动化工具解决;
部分网站有加密参数,一般有先考虑小程序或者app入口是否存在加密参数,如果有就会采用对网站加密参数进行逆向。

团队情况

  • 整包服务: 其他开发   
角色 职位
负责人 爬虫工程师
队员 产品经理
队员 UI设计师

案例展示

  • 全国招聘网站采集

    全国招聘网站采集

    项目描述:起初公司招聘信息渠道并不完善,而公司业务与国家工信部之间合作针对职业教育发展做平台,数据的来源需要比较完善因此基于全国各大招聘信息,企业信息,进行数据分析操作。 项目技术:scrapy、scrapy-redis、aiosync、selenium、pyexcejs、

  • 全国教育厅网站采集

    全国教育厅网站采集

    项目描述:起初公司招聘信息渠道并不完善,而公司业务与国家工信部之间合作针对职业教育发展做平台,数据的来源需要比较完善因此基于全国各大招聘信息,企业信息,进行数据分析操作。 项目技术:scrapy、scrapy-redis、aiosync、selenium、pyexcejs、

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服