熟练掌握 Python 全栈开发,擅长使用 requests、BeautifulSoup、Playwright 进行公开数据定向采集与处理,能稳定实现中小规模数据抓取任务,具备完善的反爬适配与频率控制能力。精通 Pandas 数据清洗、结构化归档与基础数据可视化,可快速完成从数据采集、清洗、入库到可视化的全流程项目开发。熟悉 OCR 文字识别、公开工商信息匹配等自动化工具开发,能根据需求定制各类自动化脚本、数据处理工具与数据归档方案,交付稳定、可维护的代码与完整的使用说明文档。
1.全国主要城市历史天气数据采集与分析项目:通过定向采集公开气象数据,完成数据清洗、入库与可视化分析,覆盖完整的数据采集、处理、存储与展示流程,实现了数据的结构化归档与直观展示。
2.企业公开活动数据整理工具开发:通过公开渠道采集企业高管公开活动信息,实现了活动照片中的关键信息识别、提取与自动归档,可自动匹配企业公开信息并补全地址,完成结构化数据整理与输出,为市场分析提供基础数据支持。