技术栈:
开发语言:python、Java
大数据方向:HDFS、HBASE、HIVE、MAPREDUCE、SPARK、Flink、Doris、StarRock、Hologress
传统数据库:Oracle、Mysql、Progress
向量化数据库:Milvus等
数据质量化管理:Datahub; 数据可视化查询:superset
AI方向:传统算法(sklearn)、OCR、多模态应用
Agent: 基于Hermes原生构建多租户的Saas agent平台
## 工作经历
### 金蝶中国 | 算法架构师 | 2018.06 - 至今
- 主导小微数仓从0到1建设,覆盖百万级客户、日均处理数据亿条,基于Flink CDC+Hadoop/Doris构建分布式数仓底座,通过DataHub实现数据治理与资产标签化,赋能经营决策与精准获客
- 落地大模型应用(Qwen/DeepSeek基座,微调+RAG+Skill MCP):自定义报表(NL2SQL,文本+语音→SQL)、智能生单(多模态→进销存单据,准确率90%+)、发票流水转凭证(多模态→财务凭证,准确率80%+),均已产品化输出至多条产品线
- 供应链智能化:打通工厂制造→运输→仓储→零售终端全链路协同,销量预测(准确率80%,节省成本约30%),智能选仓优化仓储选址与库存周转率,智能数据协同减少生产端与批发端的牛鞭效应,降低供应链各环节风险,已上线与客户联合验证
- 智能推荐系统:上线后小微企业服务提单与投诉显著下降
- 基于Hermes框架搭建多租户Agent平台,提供统一会话/记忆体/上下文管理,支持ReAct等规划策略,业务可快速搭建Agent并交互验证,已服务智能生单、发票与流水转凭证等AI原生场景
- 解决Agent企业落地核心痛点:可靠性采用混合架构(关键路径确定性代码+LLM理解/生成)、安全采用两道防线(Tool过滤+运行时拦截)与权限分级、成本采用快路径+按需加载Tools+Token预算、可观测性基于SSE事件流+决策链可视化+全链路Trace追踪
### 深圳市至尊量化投资管理有限公司 | 高级分析师 | 2015.06 - 2018.06
- 构建机器学习策略平台,完成多因子选股、期权复制、Alpha对冲、跨品种套利等多套量化策略,均已用于产品或进入策略库
- 搭建策略评估系统,从收益、回撤、稳定性、风险归因等多维度统一评估标准,被公司推广为策略评审规范
- 构建基本面因子池与交易性因子池,基于SVM/随机森林/XGBoost等模型进行因子有效性评估与策略建模
### 宜搜科技 | 高级技术经理(带11人) | 2011.12 - 2015.05
- 主导数据处理底座从Oracle向Hadoop迁移,搭建Hive分析平台与HBase分布式内容存储平台,支撑全公司数据业务
- 基于维度建模构建数仓,覆盖访问/搜索/下载日志、内容/订购/用户等核心数据,满足产品运营与各产品线数据需求
- 搭建数据分析可视化平台,推动运营与产品从经验决策转向数据驱动
- 构建内容推荐系统,上线后用户转化率提升约**25%**
- 组建8人Hadoop技术团队,培养2名技术骨干和1名数据分析业务骨干
### 华为技术有限公司 | 系统分析师 | 2010.03 - 2011.12
- 基于Hadoop开源生态搭建华为大数据处理底座,深入分析HDFS/MR/ZK源码,验证企业级场景下的技术痛点
- 针对早期Hadoop无热备、无法满足7×24小时可靠性等痛点,负责提出**HDFS HA方案**(同事负责JobTracker HA),并设计**HBase二级索引方案**
- 支撑中国移动流媒体数据分析与工商银行交易数据验证系统的落地,方案得到客户认可
| 角色 | 职位 |
| 负责人 | 系统分析师 |
| 队员 | 后端工程师 |
在老板参谋产品:主要职责是负责整个数仓方案的设计,负责实时数仓、数据资产化和诊断归因的落地 在智能记账:主要负责Agent平台方案设计,核心包括基于hermes agent构建多租户的agent平台,优化记忆体和上下文,双层权限控制,提升agent处理性能及防止token暴躁,
老板参谋的职责:主要负责底层实时数仓和数仓建模的方案,确保实时数仓落地,且基于数仓进行数据资产化,及基于AI的数据分析、数据诊断和归因分析
熟练掌握模型微调技术:如SFT-full 全参数微调、SFT-lora 可选参数微调、SFT-qlora 向量化可选参数微调,还有DPO、PPO和GRPO偏好对齐训练。 也可以做蒸馏训练,及把大模型向量化后,以满足端设备的需求