南京车链有限公司
个人
ID:215769
爬虫工程师
1年
500元/8小时
技术:1.勤奋认真,对工作兢兢业业
2.好的沟通和理解需求的能力,能对上级交代的任务准确无误完成
3.熟练掌握爬虫requests. scrapy. scrapy-redis爬虫流程.掌握正则表达式。xpath提取网页资源方法。
4.熟悉各个网站常见反爬策略,能根据网页分析出常见
项目:豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的Sheet ,采用User Agent伪装为浏览器进行爬取,并加入随机延时来更好的模仿浏览