Python 本地自动化程序开发:定时抓取数据 + AI 审核 + 短信通知
项目背景与形态
开发一个运行在我个人 Windows 电脑上的后台程序。无需部署到云端服务器,开机自启后即可 7x24 小时无人值守运行。
核心流程:
1. 每10分钟自动访问某内部网页系统,抓取特定任务及附件。
2. 调用大模型 API 对内容进行合规审核。
3. 将审核出的问题通过短信发送至责任人手机。
4. 用本地数据库记录处理状态,避免重复。
详细功能要求:
1.网页自动化:从目标 app 定时获取任务列表,下载 Word、PDF、Excel 等格式的附件。
2.AI 审核:将提取的文本及附件内容送入大模型,结合我方提供的规章制度知识库(采用本地向量检索方式),返回结构化的违规项清单。
3.短信/通知:优先对接阿里云短信服务;若实施困难可降级为企业微信群机器人推送(免费)。
运行形态:
Windows 环境下支持开机自启,后台静默运行,提供简洁的日志文件以便查看运行状态。
技术栈限定(确保本地可维护)
- Python 3.9 及以上版本,所有依赖需整理至 requirements.txt。
- 自动化框架:优先使用 Playwright,备选 Selenium。
- AI 编排:LangChain + Chroma(本地向量库)。
- 任务调度:APScheduler。
- 数据库:SQLite。
我方准备的素材(可直接使用):
- 大模型 API Key。
- 完整的 AI 审核提示词(Prompt)。
- 整理好的规章制度知识库 Markdown 文件。
预算与工期:
预算范围:6000+(有意向可私聊详谈)。
工期:一个月内完成。
期望开发者:
- 具备 RPA(机器人流程自动化)实战经验,能够处理常见网页反爬机制。
- 善于用通俗语言向非技术人员解释技术操作细节。
- 有耐心,愿意在交付后提供 1-2 次答疑辅导。