技术:本人熟练掌握 Python 爬虫开发,能够独立完成从需求分析、数据采集到清洗存储的全流程工作。在静态页面抓取方面,熟练使用 requests进行高效解析和数据提取;对于动态渲染、Ajax 异步加载的页面,熟练掌握 seleium模拟浏览器操作,并能结合抓包工具(Fiddler/C
项目:独立开发了一个针对某主流电商平台的商品评论爬虫。该网站采用动态加载且具有简单的反爬机制(如请求频率限制、偶尔出现的滑块验证)。我通过抓包分析定位到评论数据接口,利用 requests 模拟请求并动态添加 cookies 和 headers,结合 time.sleep 随机间隔规避
案例: 简单 图片爬取 视频爬取数据爬取