第一,大模型全栈技术。 精通Transformer架构及主流开源模型(LLaMA、Qwen、DeepSeek等)的SFT、RLHF及DPO微调,熟练使用LoRA、QLoRA等高效参数微调方法,具备千亿级模型的分布式训练与模型并行经验。在Watson期间,曾主导多语言NLP任务(文本分类、实体抽取、语义检索)的模型选型与迭代优化。
第二,AI工程化与MLOps。 深入掌握PyTorch、TensorFlow及JAX框架,具备Kubeflow、MLflow等MLOps工具链的实战经验,擅长构建自动化数据处理、模型版本管理与持续集成流水线。同时精通LangChain、LlamaIndex等Agent编排框架,能够将LLM与外部工具、API、向量数据库(Milvus、Pinecone)深度整合,构建具备记忆、推理与工具调用能力的复杂智能体系统。
第三,云计算与高性能计算。 熟练使用AWS/Azure/GCP云原生AI服务,具备GPU集群调度与推理加速(vLLM、TensorRT-LLM、FlashAttention)优化能力,可保障企业级应用的高吞吐与低延迟。
第四,业务对齐与技术价值转化。 我坚持“技术服务于业务”的顾问原则,擅长将复杂的AI能力抽象为可复用的产品模块,协助客户设计技术验证方案(PoC)、评估ROI并制定AI治理策略。凭借在Watson积累的企业级AI落地经验,我能够有效弥合前沿研究与工程落地之间的鸿沟,提供兼具前瞻性与稳健性的解决方案。
项目一:冰箱冷库温度无线监控系统(Watson)
在该项目中,我担任AI算法与系统架构负责人,主导设计了一套端云协同的冷链温度智能监控方案。系统采用LoRa无线传感网络采集数千个冷库和冰箱的实时温度、湿度及压缩机振动数据,边缘端部署轻量化异常检测模型(基于Isolation Forest和LSTM自编码器),实现秒级本地告警,减少云端传输延迟。云端则构建时间序列预测模型(Informer+Prophet),结合制冷设备历史工况与环境气象数据,提前48小时预测设备故障风险与能耗拐点,辅助运维人员主动维护。我负责从数据清洗、特征工程(提取周期波动、斜率变化等)到模型蒸馏(将1.5GB的LSTM压缩为适合边缘MCU的TFLite微型模型),并搭建基于Grafana+Prometheus的实时监控大屏。最终系统使故障漏报率从12%降至2.3%,年均节能约18%,获得客户“技术落地扎实”的高度评价。
项目二:志询AI志愿填报系统(iopt)
作为核心技术顾问,我负责构建智能推荐引擎与交互式问答模块。系统覆盖全国3000+高校及专业数据,我设计了一套融合协同过滤与知识图谱的混合推荐策略:利用Transformer编码器对历年招生简章、专业课程描述进行语义嵌入,构建“专业-职业-兴趣”三元组知识图谱,实现基于学生兴趣画像(通过多轮对话采集)的个性化院校匹配;同时开发基于检索增强生成(RAG)的志愿答疑机器人,用LangChain接入实时招考政策PDF,结合向量数据库(Chroma)提供高精度政策解读。我主导了推荐算法的离线评估(NDCG@10达0.87)和线上A/B测试,并优化索引结构使Top-50推荐响应时间低于200ms。系统上线后辅助超5万考生完成填报,志愿匹配满意度较传统工具提升34%,充分验证了AI在垂直教育场景的赋能价值。