知乎用户信息的分布式爬取与存储

基本信息

案例ID:145265

技术顾问:DongBlack℘ - 3年经验 - 西安电子科技大学

联系沟通

微信扫码,建群沟通

项目名称:知乎用户信息的分布式爬取与存储

所属行业:企业服务 - 数据服务

->查看更多案例

案例介绍

通过对知乎用户“轮子哥”的关注列表与粉丝列表信息的爬取与解析,获得这些用户的 url-token,得
到其个人主页,关注列表,粉丝列表,从而进行裂变式的迭代爬取,理论上可获得所有较为活跃的知乎用户。使用
scrapy-redis 组件实现分布式爬取。项目还在改进,计划通过 ElasticSearch 来进行查询,索引,搭建搜索引擎,
进行关键字查找。

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服