基本信息

案例ID:145911

技术顾问:税憨憨 - 2年经验 - 百度科技园k2

联系沟通

微信扫码,建群沟通

项目名称:作品集见git链接

所属行业:人工智能 - 其他

->查看更多案例

案例介绍

在作品中负责角色有 爬虫
使用 python 的 Scrapy 爬虫框架来实现对页面信息的抓取
根据万方的反爬机制,提出针对性的意见和应急性的处理
它是根据每页最大数量返回信息条数和共返回页数来限制用户获取信息量
由于此网页分旧,新两版 在旧网页没有对返回数据作出限制
用正则取出旧版详情 id 与新版详情 url 拼接
为了实现对商品信息的自动化爬取,利用 Scrapy 框架中的 CrawlSpider 模块对 url 进行过

使用 MySQL 数据库进行信息存储

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服