ID:235037

啦啦

爬虫工程师

  • 公司信息:
  • 贝壳
  • 工作经验:
  • 5年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

工作经历1
1.参与设计数据模型。
2. 搭建爬虫所需ip池以及设备池。
3.破解滑动验证码以及点触验证码进行自动化登录。
4. 维护广点通,快手,头条等媒体平台的上传人群包,下载报表自动化工具。
5. 开发B站,虎牙平台传包和报表下载工具。
6. 爬取淘宝直播,抖音直播相关数据支撑数据平台产品。
7. 开发京东,淘宝,天猫,拼多多到抖音小店的一键铺货工具。
7. 数据平台产品:http://data.livedesk.cn
8. 电商平台产品:http://distribution.livedesk.cn

工作经历2
1. 根据业务需求,提出intend,并设计数据模型。
2. 根据数据模型,制定数据采集策略。
3. 处理采集过程中遇到的反爬虫措施,验证码,流量限制,JS混淆加密等。
4. 将采集的数据进行清洗,去重等预处理。
5. 将预处理后的数据进行归档,并存储到数据库中。
6. 持续维护并更新现有数据,对抓取策略不断优化。
7. 项目接口:https://qa.s-knowledge-cn.com/api/question?q=张艺兴&key=jamlive

项目经验

个人项目1--验证码识别服务
1.识别并获取图形验证码的内容(数字+字母大小写)。
2. 识别并获取滑动验证码的缺口位移以及轨迹。
3. 识别并获取点触验证码的坐标。
4. 链接:http://8.140.131.97:6003

个人项目2--抖音快手签名注册服务
1.通过接口获得抖音注册过的设备信息。
2.通过接口获抖音app签名。
3.通过接口获得快手注册过的did。
4. 通过接口获快手app签名。
5. 链接:http://8.140.131.97:6001

公司项目1--星赏
1.参与设计数据模型。
2. 搭建爬虫所需ip池以及设备池。
3. 爬取淘宝直播,抖音直播相关数据支撑数据平台产品。
4. 开发京东,淘宝,天猫,拼多多一键铺货工具支撑电商平台产品。
5. 数据平台产品:http://data.livedesk.cn
6. 电商平台产品:http://distribution.livedesk.cn

公司项目2--DMP工具
1.破解滑动验证码以及点触验证码进行自动化登录。
2. 维护广点通,快手,头条等媒体平台的报表下载自动化工具
3. 维护广点通,快手,头条等媒体平台的上传人群包自动化工具。
4. 开发B站,虎牙平台传包和报表下载工具。

案例展示

  • 抖音快手无水印视频下载工具

    抖音快手无水印视频下载工具

    输入抖音或者快手app分享的视频链接,下载该视频,并保存视频的点赞,关注,评论等数据。 输入抖音或者快手app分享的个人主页链接,保存该用户的个人主页信息并下载该用户下所有视频,并保存视频的点赞,关注,评论等数据。

  • 验证码识别工具

    验证码识别工具

    通过接口传入图片的二进制流的base64加密后的字符,获得图片的识别结果 1.数字+字母大小写的图片-->获得图片识别结果 2.滑块验证码-->获得位移距离以及位移轨迹 3.点触验证码-->获得字符坐标未知

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    2
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服