ID:127798

土豆

爬虫工程师

  • 公司信息:
  • 华中科技大学
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 可工作日驻场(离职原因)
  • 所在区域:
  • 武汉
  • 全区

技术能力

● 熟悉JavaSE相关的基础知识,熟悉常用的算法及数据结构
● 熟悉Linux,熟悉MySQL
● 熟悉JVM,熟悉常用的设计模式
● 熟练掌握TCP/IP、HTTP协议,有网络应用开发的经验
除此之外,对数据抓取有丰富的经验,可以应对数据抓取中出现的各种问题。

项目经验

2017/03—2017/06 专利信息采集 项目负责人
项目实现了对国家专利网专利信息数据采集的功能。
1、通过谷歌开发者工具对HTTP数据包进行分析,对加密数据经行解密,通过Python开源库对图片验证码做识别。
2、通过抓取频率控制,ip池匿名代理,vpn代理以及浏览器伪装成功应对网站的反爬取系统。
2016/04—2016/07 简历信息抓取 项目负责人
项目实现了百度百科、和讯人物、问财三大网站上人物简历信息的采集。
1、 基于jsoup实现人物信息匹配,基于POI生成EXCEL表文件;
2、 通过抓取-对比机制对有重名人物的实现信息筛选;
3、 通过工厂方法模式简化了项目架构,使程序便于扩展;
4、 通过线程池实现了并发下载;

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服