新浪微博分布式爬虫

猿急送>深圳兼职程序员>YL>

案例列表

基本信息

案例ID：168586

技术顾问：YL - 5年经验 - 南京智能生动科技有限公司

微信扫码，建群沟通

项目名称：新浪微博分布式爬虫

所属行业：人工智能 - 其他

->查看更多案例

案例介绍

此项目实现将单机的新浪微博爬虫（见《新浪微博爬虫分享（一天可抓取 1300 万条数据）》）重构成分布式爬虫。
Master机只管任务调度，不管爬数据；Slaver机只管将Request抛给Master机，需要Request的时候再从Master机拿。
开发语言：Python2.7
开发环境：64位Windows8系统，4G内存，i7-3612QM处理器。
数据库：MongoDB 3.2.0、Redis 3.0.501

（Python编辑器：Pycharm；MongoDB管理工具：MongoBooster；Redis管理工具：RedisStudio）

爬虫框架使用 Scrapy，使用 scrapy_redis 和 Redis 实现分布式。
分布式中有一台机充当Master，安装Redis进行任务调度，其余机子充当Slaver只管从Master那里拿任务去爬。原理是：Slaver运行的时候，scrapy遇到Request并不是交给spider去爬，而是统一交给Master机上的Redis数据库，spider要爬的Request也都是从Redis中取来的，而Redis接收到Request后先去重再存入数据库，哪个Slaver要Request了再给它，由此实现任务协同。

案例图片

点击查看他的更多案例

相似案例推荐

其他人才的相似案例推荐

智能文本标注训练平台

文本标注训练与可视化基于文本类的结构化、半结构化和非结构化数
工业设备故障知识图谱平台

基于变压器故障知识整合，整合电力设备故障检修领域内的海量、离
医疗影像检测研究

基于反复注意力机制残差网络的新冠肺炎医疗影像自动诊断模型，由
道路目标检测

利用剪枝优化技术对基于YOLOv4的道路目标检测模型进行轻量
养老软件

独立开发前后台功能，使用fastadmin框架，包含产品需求
企业级聊天机器人对话系统

前台基于Java springboot实现，连接MySQL数
自动化爬取

通过人机交互的方式进行目标数据的爬取，实现模拟人为动作，避开
消息批量发送

从人机交互的角度，实现批量发送消息，全程仅需确认要发送的内容
知识产权的原因，无法上传

您已在“基本信息”中填写过联系方式，需求方如选中您简历，会通
MES系统

对商品销售和库存进行数据报表。主要有五大模块；库存管理（出入
车牌识别项目（涉密，上传图片来源网络）

主要职责: (1) 完成车牌检测算法在NVIDIA
单反效果算法的优化

功能：手机上完成单反效果算法的落地，拍照和预览

联系需求方端客服

热门标签列表

程序员接私活程序员兼职企业外包外包案例

热门城市人才

北京兼职程序员上海兼职程序员广州兼职程序员深圳兼职程序员杭州兼职程序员成都兼职程序员天津兼职程序员重庆兼职程序员武汉兼职程序员西安兼职程序员南京兼职程序员长沙兼职程序员苏州兼职程序员厦门兼职程序员福州兼职程序员合肥兼职程序员济南兼职程序员青岛兼职程序员大连兼职程序员长春兼职程序员沈阳兼职程序员哈尔滨兼职程序员石家庄兼职程序员太原兼职程序员无锡兼职程序员南昌兼职程序员洛阳兼职程序员郑州兼职程序员南宁兼职程序员珠海兼职程序员宁波兼职程序员昆明兼职程序员东莞兼职程序员贵阳兼职程序员温州兼职程序员佛山兼职程序员中山兼职程序员海口兼职程序员常州兼职程序员兰州兼职程序员呼和浩特兼职程序员乌鲁木齐兼职程序员海外兼职程序员其他兼职程序员山东兼职程序员远程兼职程序员

热门城市职位

北京程序员招聘上海程序员招聘广州程序员招聘深圳程序员招聘杭州程序员招聘成都程序员招聘天津程序员招聘重庆程序员招聘武汉程序员招聘西安程序员招聘南京程序员招聘长沙程序员招聘苏州程序员招聘厦门程序员招聘福州程序员招聘合肥程序员招聘济南程序员招聘青岛程序员招聘大连程序员招聘长春程序员招聘沈阳程序员招聘哈尔滨程序员招聘石家庄程序员招聘太原程序员招聘无锡程序员招聘南昌程序员招聘洛阳程序员招聘郑州程序员招聘南宁程序员招聘珠海程序员招聘宁波程序员招聘昆明程序员招聘东莞程序员招聘贵阳程序员招聘温州程序员招聘佛山程序员招聘中山程序员招聘海口程序员招聘常州程序员招聘兰州程序员招聘呼和浩特程序员招聘乌鲁木齐程序员招聘海外程序员招聘其他程序员招聘山东程序员招聘远程程序员招聘

热门人才推荐

热门职位推荐

iOS工程师Android工程师前端工程师后端工程师嵌入式工程师UI设计师产品经理测试工程师运维工程师游戏工程师运营/编辑其它

找人才 | 接项目 | 招聘专员 | 京ICP备16030138号-1 | Copyright © 2015-2026 猿急送