【Python爬虫/RPA】京东200家店铺财务账单自动抓取+Excel合并+飞书对接
项目背景:
我方运营约200家京东店铺(店群模式),目前需要人工登录后台下载财务报表,效率极低。需要开发一套Python自动化脚本,实现每日定时抓取、数据清洗合并、并推送到飞书。
核心功能需求:
1. 多店自动登录与会话维持:
脚本需支持导入200个店铺的账号/Cookie信息。
方案偏好: 建议采用 Selenium/Playwright 模拟浏览器,或通过提取 Cookie 的方式维持登录状态。需提供简易的“Cookie提取工具”方便运营人员定期更新。
抗风控: 代码需加入随机等待时间(Random Sleep)和异常重试机制,防止触发京东频繁访问限制。
2. 财务账单批量导出(Batch Export):
自动进入京东商家后台“结算管理”或“报表中心”。
按日期(如昨日T-1)生成并下载《财务结算日报》Excel文件。
异步处理: 需处理京东后台“生成报表中”的等待逻辑,确保下载成功。
3. 数据清洗与合并(Pandas处理):
利用 Python Pandas 库,自动读取下载的200个Excel文件。
合并: 将所有店铺数据合并为一个《总财务汇总表.xlsx》。
字段增加: 在总表中增加“店铺名称”列,用于区分数据来源。
清洗: 自动剔除无数据的空表或无效行。
4. 对接飞书(Feishu Integration):
多维表格写入: 将汇总后的核心指标(如:店铺名、总销售额、退款额、推广费、佣金)通过飞书 Open API 写入指定的多维表格中。
文件推送: 将生成的《总财务汇总表.xlsx》通过飞书机器人推送到指定的群。
5. 交付要求:
源代码: 必须交付完整、未加密的 Python 源代码。
部署: 需协助我方在本地电脑(Windows)或阿里云服务器(Linux)上部署运行。
售后: 要求交付后 3个月内,若因京东页面微调导致脚本报错,需免费维护修复。