ID:208623

DongBlack℘

Java开发工程

  • 公司信息:
  • 西安电子科技大学
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 西安
  • 全区

技术能力

语言:python,java,js,
数据库:redis,mongodb,mysql,elastic search,
后端:django,springBoot+Mybatis,node.js
前端:vue.js

项目经验

Scarpy- -s redis 实现知乎用户信息的分布式爬取与存储:
具体实现:通过对知乎用户“轮子哥”的关注列表与粉丝列表信息的爬取与解析,获得这些用户的 url-token,得
到其个人主页,关注列表,粉丝列表,从而进行裂变式的迭代爬取,理论上可获得所有较为活跃的知乎用户。使用
scrapy-redis 组件实现分布式爬取。项目还在改进,计划通过 ElasticSearch 来进行查询,索引,搭建搜索引擎,
进行关键字查找。

案例展示

  • 知乎用户信息的分布式爬取与存储

    知乎用户信息的分布式爬取与存储

    通过对知乎用户“轮子哥”的关注列表与粉丝列表信息的爬取与解析,获得这些用户的 url-token,得 到其个人主页,关注列表,粉丝列表,从而进行裂变式的迭代爬取,理论上可获得所有较为活跃的知乎用户。使用 scrapy-redis 组件实现分布式爬取。项目还在改进,计划通过 E

  • 亚马逊用户评价数据分析

    亚马逊用户评价数据分析

    通过对用户评价数据的清洗与挖掘,找出用户评价的星级,用户评论之间的关系,从评论中找到 潜在的商品间竞争的影响因素与可改进功能。 处理过程:python 进行数据清洗,关联度分析,特征降维,数据归一化处理,特征 one-hot 编码,BP 神经网络分类 预测

  • 亚马逊用户评价数据分析

    亚马逊用户评价数据分析

    通过对用户评价数据的清洗与挖掘,找出用户评价的星级,用户评论之间的关系,从评论中找到 潜在的商品间竞争的影响因素与可改进功能。 处理过程:python 进行数据清洗,关联度分析,特征降维,数据归一化处理,特征 one-hot 编码,BP 神经网络分类 预测

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服