自由职业
个人
ID:300690
自由职业
3年
500元/8小时
技术:掌握自动化框架Selenium、DrissionPage的使用,对Playwright框架有一定的了解,能够熟练使用xpath, beautifulsoup,re正则表达式对页面数据进行提取和解析
掌握Scrapy框架的整体架构及其核心组件,对其各个部件在逻辑上所处位置、作用以
项目:某大数据平台品牌数据采集
项目简介:本项目旨在对大数据平台的品牌列表页进行大规模自动化采集,获取品牌招商相关的核心信息。该平台为商业地产数据服务商,对反爬有一定防护机制,包括请求频率限制、IP风控等。本项目的核心任务是基于Scrapy框架构建高并发采集爬虫,通过IP代理池与