具备端到端大模型落地与AI应用架构经验:熟悉GPT、GLM、Llama系列模型微调、LoRA/QLoRA高效训练、DeepSpeed分布式加速及RLHF对齐流程;精通Prompt Engineering、RAG检索增强、向量数据库FAISS/Milvus与LangChain框架,可快速打造对话、知识库、Copilot类场景。后端方面,熟练用Python+FastAPI/Flask构建高并发微服务,掌握Docker、K8s、CI/CD、灰度发布与监控告警;数据库层面,能独立设计MySQL/PostgreSQL高可用方案,优化索引、事务与分库分表,熟悉Redis、Kafka、Elasticsearch等中间件。同时具有业务洞察与跨团队沟通能力,曾主导零售、金融、教育等多行业AI顾问项目,从需求调研、数据治理、原型验证到生产上线全程负责,持续跟踪前沿技术并以最小可行成本驱动业务增值。
项目1:课程设计《校园知识问答大模型》——基于ChatGLM-6B与LoRA微调,在单张RTX3060上完成训练,自建2万条教务、社团、生活FAQ语料,BLEU-4达42,已封装成FastAPI服务,支持微信小程序调用,日均PV 3k+。
项目2:数据库综合实验《二手书交易平台》——独立搭建PostgreSQL主从+Redis缓存,设计分库分表与倒排索引,实现秒级搜索;压测500并发QPS下P99延迟120ms。
项目3:AI实训《城市公交客流预测》——融合LSTM与XGBoost,处理GPS+天气共600万记录,MAPE 8.7%,结果可视化系统用Flask+ECharts实现,被导师推荐参加省级大数据竞赛并入围决赛。