技术:就基本的爬虫操作,比如使用requests模拟访问网站,xpath,bs4,正则表达式,进行数据提取和数据清洗 cookies登入,批量数据,图片下载,核心以外的一些细节上的处理不是很好。还有一些基本的保存方式,TXT,json,xlsx,mysql不是很熟练。
项目:现在暂时还没有,自己的话有爬过京东,淘宝,图片网站,股票网站等的数据,希望有机会可以继续增加下自己的实战经验。就基本的爬虫操作,比如使用requests模拟访问网站,xpath,bs4,正则表达式,进行数据提取和数据清洗 cookies登入,批量数据,图片下载,核心以外的一些细
案例: 淘宝