熟练使用 Python 进行各类网络数据采集,精通 Requests、Scrapy、Selenium、Playwright 等主流爬虫框架与工具,能高效完成网页爬取、API 接口抓取与批量数据导出。具备扎实的反爬对抗能力,可处理 IP 封禁、Cookie 登录、JS 加密、字体反爬、滑块验证码等常见限制,兼顾爬取效率与稳定性。
熟悉数据清洗、结构化解析与 Excel/CSV/ 数据库存储,可按需求定制定时爬虫、增量更新与可视化交付方案。注重合规与安全,只承接合法公开数据采集项目,不涉及隐私、涉密及违规爬取。做事严谨,沟通顺畅,能快速理解需求并按时交付,擅长解决复杂采集场景问题,长期承接各类爬虫外包与数据服务项目。
使用 Python、Scrapy、Playwright 完成某电商平台商品信息全量爬取,处理登录验证、动态渲染、接口签名等反爬策略,采集商品价格、销量、评价、参数等多维度数据。通过 Pandas 进行数据清洗、缺失值处理与异常值剔除,构建竞品分析指标体系,完成价格趋势对比、销量排行、用户评论情感分析与热销属性挖掘,最终输出可视化图表与分析报告,为客户选品与定价提供数据支撑。