产品是面向海外市场的早期MVP,目前重点是验证:能否稳定解析不同来源的财务PDF,并按内部统一口径清洗和展示数据。
需要的能力:
- Python 后端(或你擅长的语言)+ 熟悉LLM API(Claude / OpenAI 等)
- 有处理PDF/Excel等财务类文档经验优先
第一阶段主要工作:
1. 用户上传不同格式的财务PDF(以损益表、费用明细为主),系统提取核心财务数据
2. 设计一层“外部科目 → 内部统一科目”的可配置映射(不能全部写死在代码里)
3. 对提取结果做进一步清洗和标准化(规则 + LLM),包括去重、简单拼写纠正、字段补全、分类等
4. 输出到数据库,并提供一个简单前端看板方便验收结果(表格能看、分类能区分即可)
5. 如有时间,可继续做历史数据导入 + 同比/环比 + 中位数 + 超阈值异常标记
工程规范:
- 公司为海外注册一人公司,目前人在国内,后续会组建跨国远程团队
- 代码变量名、数据库字段名、注释需使用英文
- 须签署NDA (保密协议)