逸盛科技
个人
ID:327002
数据分析师
2年
500元/8小时
技术:该项目需要爬取百度新闻推荐版的内容数据,要对不同板块的数据占比进行分析比较,需要通过 分析网页结构,对不同的板块分类的数据进行分类爬取存储,完成数据清洗工作,并进行定时爬取。
责任描述:
1.根据公司需求,负责爬取互联网,科技,财经分类,使用用Scrapy完成代码,用xpat
项目:项目名称:小红书数据爬取
项目简介:
根据公司需求,要获取小红书APP推荐中的美食信息,例如:封面logo,标签,文章标题,文章内容,文章标签,文章内容URL等。
责任描述:
1.制定爬取策略,手机APP端的小红书带有不可逆的加密策略,转向微信公众号内的小红书APP爬取数