ID:339883

寻道 身份已认证

爬虫工程师

  • 公司信息:
  • 成都某科技有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 成都
  • 郫县

技术能力

1. 精通python语言,能熟悉使用beautifulsoup,xpath来定位和提取网页中的特定信息。
2. 熟悉常见的反爬程序,并能处理大多反爬手段。
3. 了解常见的html结构,css样式,javascript脚本。能够分析网页的结构,提取目标数据。
4. 能运用多线程编程方式快速获取大量数据,提高工作效率。
5. 具有持续学习的能力,能不断学习新的技术和工具,跟进网络爬虫领域的发展和趋势来保证竞争力和适应性。

项目经验

熟练使用beautiful soup,xpath,正则表达式,对数据的定位与爬取有一定经验。
熟悉常见的反爬手段,如ip封禁,user-agent检测,ajax动态反爬等,并能够设计相应的应对策略,保证爬虫的稳定性和持续性
能运用多线程,异步编程的手段快速获取大量的数据信息并极大的提高工作效率。

案例展示

  • 对某招聘平台的招聘信息的爬取

    对某招聘平台的招聘信息的爬取

    对某招聘网站平台的许多招聘公司的招聘信息的爬取。该网站有一定的反爬能力,如设置了ajax反爬系统。我通过不断请求获取到了正确的json接口并成功获取到了相应的数据信息。然后通过beautiful soup等库精确定位特定数据并进行处理最后成功保存了下来。

  • 爬取某小说平台某部小说

    爬取某小说平台某部小说

    对某小说平台的某部小说内容进行爬取,运用了beautiful soup等库来精确定位数据并处理数据最后保存。

  • 爬取某评分网站某排行榜的电影信息

    爬取某评分网站某排行榜的电影信息

    该程序能爬取某评分平台某排行榜的电影信息,包括电影序号,名称,信息,评分和热评。该程序运用beautiful soup库来精确定位数据信息并处理数据将信息保存下来。总共爬取了10页共250条电影的评分内容。

  • 采用多线程爬取某站上千张图片

    采用多线程爬取某站上千张图片

    本次项目采用多线程的方式编写爬虫,爬取某动漫网站上千张cos图片。本次采用多线程爬取相较于单线程极大的提高了工作效率,同时此次项目代码采用模块化设计,层次分明,不仅爬取了图片,同时还将图片相关标题一并保存下来,项目质量高。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服