技术:1.熟练使用xpath、re、json模块进行数据抓取 2.熟练使用MySQL数据库,熟悉Navicat、MongoDB等数据库 3.有充足的编程能力,了解计算机网络、数据结构,Http/Https协议 4.掌握常见的爬虫、反爬虫知识及应对措施;了解Linux系统 5.熟
项目:项目:Spider Book 项目描述: 爬取各个大型图书网站,如新华书店图书网,在线网上图书一号店等。获取它们图书的名称,简介,购买量,评论量,评论数据,价格等,存入数据库。 项目技能: requests,Xpath,json,Redis,MongoDB,re
案例: Spider Book新闻资讯