熟练掌握 Python 后端开发,擅长自动化脚本、数据处理、工具开发类项目。
核心技术栈:
- Python(3.8+),熟悉标准库及主流第三方库生态
- 自动化与脚本开发:文件批处理、目录监控、定时任务、流程自动化
- 数据采集与处理:网页数据抓取(requests/Selenium)、API对接、数据清洗转换(pandas)、正则表达式提取
- 文档解析:PDF提取(pdfplumber/tabula)、Excel读写(openpyxl)、Word生成、OCR图像识别(Tesseract)
- 数据库:MySQL、SQLite、MongoDB基本操作与数据导入导出
- 接口开发:Flask/FastAPI 搭建轻量级 Web 服务和API
- 部署交付:PyInstaller 打包exe、Docker 容器化、Linux 服务器部署
注重代码可维护性,交付物配备配置文件和使用文档,确保客户可独立运行。能快速理解业务需求,沟通高效,按时交付。
项目一:企业数据自动化处理平台
为多家中小企业开发定制化数据处理工具。涵盖批量PDF账单解析与
汇总、Excel多源数据合并清洗、文件智能分类归档等场景。采用YAML
配置驱动,客户可自行调整处理规则无需改代码。支持增量处理与
异常重试机制,全程日志记录便于问题追溯。最终打包为独立exe
交付,客户开箱即用。
项目二:行业数据采集与分析系统
开发自动化数据采集脚本,对接多个数据源(网页、API、本地文件),
实现数据抓取、清洗、去重、结构化存储的全流程自动化。内置字段
校验和异常检测规则,输出标准化JSON/Excel报告。应用于金融风控、
电商选品、市场调研等多个业务场景。
项目三:轻量级业务API服务
基于FastAPI为客户搭建内部业务接口服务,包括数据查询、报表
导出、第三方系统对接等功能。支持Token鉴权、请求限流、日志
审计,部署于Linux服务器稳定运行。
一款面向中小企业的桌面端文档批量处理工具,支持Excel和PDF两大类文件的自动化处理 。 核心功能: 1. Excel批量处理:自动扫描目录下所有Excel文件,执行多表合并、数据去重、 数值列统计(求和/均值/极值),输出合并后的汇总表。 2
为金融机构开发的本地化自动审核工具,用于批量处理客户进件材料, 替代人工逐份核查,提升审核效率。 核心功能: 1. 目录自动监控:定时扫描指定目录,自动识别新提交的客户进件包, 支持配置扫描间隔和文件夹命名规则。 2. 多格式附件解析:支持PDF