精通Python编程语言,熟练运用Selenium库进行Web自动化开发,擅长构建高健壮性的网页数据采集爬虫。针对电商平台动态页面特性,掌握无结构依赖的全页文本扫描、正则解析与数据清洗技术,可实现订单去重、无效数据过滤等核心功能。熟悉ChromeDriver配置与反爬策略,能处理动态渲染、HTML纯文本提取、字段精准解析等场景。掌握pandas数据处理与Excel文件读写,精通正则表达式、XPath定位,可快速开发定制化数据采集、自动化脚本开发及后端轻量级开发任务。
淘宝订单精准采集系统开发项目:独立开发淘宝订单聚焦爬虫,解决传统定位失效问题,实现全页纯文本扫描、正则精准解析核心字段。完成去重、数据清洗、无效订单过滤功能开发,限定提取10条目标订单,适配电商动态页面结构,解决HTML标签干扰、字段提取不全等问题,最终输出干净的Excel订单报表,适配多场景接单需求。
| 角色 | 职位 |
| 负责人 | Python爬虫工程师 |
| 队员 | 后端工程师 |