ID:317500

寻风

爬虫工程师

  • 公司信息:
  • 邯郸
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 所在区域:
  • 北京
  • 海淀

技术能力

网络协议和页面解析:了解HTTP/HTTPS协议和网页HTML结构,能够利用网络请求库发送请求并解析返回的页面内容。

数据抓取与存储:熟练使用Python编程语言,能够编写爬虫代码实现数据的自动抓取,并灵活运用正则表达式或解析库(如Beautiful Soup)提取所需数据。同时,对于大规模数据的处理和存储也具备相关能力。

动态页面处理:熟悉浏览器自动化工具(如Selenium),能够模拟用户行为、加载动态页面、执行JavaScript脚本,实现对JavaScript生成内容的抓取。

反爬技术应对:了解常见的反爬机制,如验证码、IP封禁、限制访问频率等,能够运用代理、用户代理池、随机请求头等技术绕过反爬手段,提高爬取效率和稳定性。

分布式爬虫与调度:具备分布式爬虫框架(如Scrapy)的使用经验,能够设计和搭建分布式爬虫系统,并进行任务调度、数据去重、分布式存储等工作。

数据清洗与预处理:具备数据清洗和预处理的能力,能够针对爬取的数据进行去重、格式转换、缺失值处理等操作,确保数据的准确性和一致性。

爬虫策略优化:能够分析网站结构和爬虫需求,制定合理的爬取策略,包括请求频率控制、代理IP的选择、登录验证处理等,提高爬虫效率和稳定性。

项目经验

爬取网易新闻并保存数据
全权负责可公开数据爬取
会使用js逆向技术
运用fillder软件
运用postman软件
字体解密操作
专业,负责

案例展示

  • 爬取网易新闻

    爬取网易新闻

    爬取网易新闻并保存数据 全权负责可公开数据爬取 会使用js逆向技术 运用fillder软件 运用postman软件 字体解密操作 专业,负责

  • 爬取情话网

    爬取情话网

    爬取网易新闻并保存数据 全权负责可公开数据爬取 会使用js逆向技术 运用fillder软件 运用postman软件 字体解密操作 专业,负责

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服