1、深度掌握 影刀RPA(持有影刀高级认证)及 来也UiBot 自动化平台,具备独立设计、开发、测试与部署复杂端到端业务流程自动化解决方案的能力
2、精通Excel自动化与数据处理(openpyxl, pandas)自动化操作Excel文件(读写、格式、公式、多Sheet、批量处理)
3、熟练掌握 Selenium 与 Playwright 进行高级Web浏览器自动化(元素精准定位与操控、页面导航、网络请求拦截与监控、异步处理)
4、熟练运用 Pywinauto 实现 Windows桌面应用程序的自动化控制与交互。
5、精通使用 Python 进行数据操作,尤其擅长利用 Pandas 与 NumPy 库进行数据清洗、转换、整合与分析,为自动化流程提供高效数据支撑。
6、深入理解HTTP协议原理(请求/响应结构、状态码、方法、Header、Session/Cookie机制)
7、熟练运用 Requests 库处理HTTP(S)请求,结合 BeautifulSoup 等工具对HTML页面进行高效解析与元素定位,实现数据抓取或自动化交互。
8、熟悉OCR技术,具备使用 Pytesseract 等框架进行图像文本识别的实际经验,应用于自动化处理扫描文档、图片信息提取等场景。
9、熟练掌握 SQL,能高效操作 MySQL/PostgreSQL/SQL Server 等关系型数据库;了解 MongoDB 等 NoSQL 数据库基础。
为某保险公司开发的端到端理赔自动化系统,日均处理500+医疗票据,实现从票据识别、数据核验到系统录入的全流程无人化:
1、OCR智能识别(Pytesseract)
通过图像预处理增强模糊票据识别率,使用轮廓检测算法精准切分票据条目
关键字段(患者ID/药品名称/金额)识别准确率达98.5%
2、跨平台数据核验(Playwright)
用Playwright拦截医院官网API请求,实时爬取最新药品定价目录
构建药品名称模糊匹配算法(Pandas字符串处理),自动校正OCR识别误差
3、自动化数据处理中枢(Python核心能力展示)
输出带条件格式的Excel风控报表(Openpyxl):自动标红高风险票据
4、多系统自动化录入(Pywinauto)
按理赔规则拆分Excel数据(私人保险/社保)
调用Pywinauto操作医保老旧桌面系统(控件精准定位)
处理系统弹窗异常(自动重试机制)
5、数据闭环(SQL)
最终数据持久化到SQL Server