ID:402822

森林

爬虫工程师

  • 公司信息:
  • 有乐联盟
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 900元/8小时
  • 兼职时间:
  • 可工作日远程
  • 所在区域:
  • 其他
  • 全区

技术能力

① 了解什么是HASH,会简单地使用MD5,SHA1等算法对数据进行HASH一遍存储
②熟悉HTTP,HTTPS协议的基础知识,了解GET,POST方法,了解HTTP头中的信息,包括返回状态码,编码,user-agent,cookie,session等
③ 能设置user-agent进行数据爬取,设置代理等
④知道什么是Request,什么是response,会使用Fiddler等工具抓取及分析简单地网络数据包;
⑤对于动态爬虫,要学会分析ajax请求,模拟制造post数据包请求,抓取客户端session等信息,对于一些简单的网站,能够通过模拟数据包进行自动登录。
⑥ 对于一些难搞定的网站学会使用phantomjs+selenium抓取一些动态网页信息
⑦并发下载,通过并行下载加速数据爬取;多线程的使用。

项目经验

2)【中级爬虫工程师】

① 了解什么是HASH,会简单地使用MD5,SHA1等算法对数据进行HASH一遍存储
②熟悉HTTP,HTTPS协议的基础知识,了解GET,POST方法,了解HTTP头中的信息,包括返回状态码,编码,user-agent,cookie,session等
③ 能设置user-agent进行数据爬取,设置代理等
④知道什么是Request,什么是response,会使用Fiddler等工具抓取及分析简单地网络数据包;
⑤对于动态爬虫,要学会分析ajax请求,模拟制造post数据包请求,抓取客户端session等信息,对于一些简单的网站,能够通过模拟数据包进行自动登录。
⑥ 对于一些难搞定的网站学会使用phantomjs+selenium抓取一些动态网页信息
⑦并发下载,通过并行下载加速数据爬取;多线程的使用。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服