编程语言:Python
数据处理:pandas、openpyxl
文件处理:Excel(.xlsx)、CSV
开发工具:PyCharm、Cursor
可独立完成:数据清洗、缺失值处理、去重、格式统一、手机号脱敏、多表合并、报表生成
项目名称: 客户信息表自动化清洗与脱敏处理
项目时间: 2026.01 - 至今
项目描述:
针对企业日常积累的客户数据(姓名、手机号、地址等),开发Python自动化清洗脚本,解决数据格式混乱、重复记录、缺失值等常见问题,并生成标准化报表。
责任描述:
使用pandas读取Excel/CSV格式的原始数据
实现手机号格式统一(去空格、去横杠、去+86)及中间4位脱敏
基于指定字段(如姓名+手机号)进行去重,剔除无效记录
对地址等非标准字段进行补全与规范化
将清洗后的数据导出为结构化Excel文件,并生成清洗日志
技术栈: Python、pandas、openpyxl
日常工作时段集中在傍晚至凌晨,白天为休息时间。如有需求可留言,傍晚醒来后第一时间回复并开始处理。习惯夜间集中交付,适合需要快速拿到结果的任务
Excel 数据清洗与脱敏工具 本工具主要解决企业日常运营中积累的 Excel 数据杂乱问题,适用于客户信息表、销售订单、员工花名册等常见业务场景。 原始数据通常存在以下问题: - 手机号格式不统一(含空格、横杠、+86等特殊符号) - 地址信息缺失省份或市级单位
Excel 数据清洗与脱敏工具 本工具主要解决企业日常运营中积累的 Excel 数据杂乱问题,适用于客户信息表、销售订单、员工花名册等常见业务场景。 原始数据通常存在以下问题: - 手机号格式不统一(含空格、横杠、+86等特殊符号) - 地址信息缺失省份或市级单位
Excel数据处理工具集 本作品集包含两个已完成的实战案例,覆盖企业日常数据处理中的高频场景: 【案例一】数据清洗与脱敏 针对客户信息表中常见的格式混乱问题,实现: - 手机号自动去空格/去横杠/去+86,并完成中间4位脱敏 - 地址信息智能补全省份前缀 -