. 机器学习与深度学习
经典算法:精通LR、SVM、GBDT/XGBoost/LightGBM、随机森林等,主导过金融风控、用户分群等场景的建模,AUC提升15%+。
深度学习:熟悉CNN/RNN/Transformer架构,实现过CV(目标检测、图像分割)、NLP(文本分类、机器翻译)、时序预测(LSTM/TCN)等任务,某电商搜索排序模型通过BERT优化点击率提升12%。
大模型与LLM:具备GPT/LLaMA等大模型微调经验,搭建过行业知识问答系统,结合LoRA/P-tuning优化推理成本30%。
2. 推荐与广告算法
设计过多目标排序模型(MMoE/ESMM),在信息流推荐中平衡点击率与停留时长,DAU增长20%。
熟悉CTR/CVR预估(DeepFM/DIN),通过特征交叉与用户行为序列建模提升广告ROI。
3. 大数据与分布式计算
熟练使用Spark/Flink处理TB级数据,构建实时特征管道,延迟控制在秒级。
优化过TensorFlow/PyTorch分布式训练(Horovod/FSDP),千亿参数模型训练效率提升50%。
4. 算法工程化与优化
主导模型从实验到上线的全流程:特征工程(Feature Store)、模型部署(TF Serving/Triton)、A/B测试(Pyro)。
精通模型压缩(量化/剪枝/蒸馏),某端侧AI应用体积缩减70%,推理速度提升3倍。
5. 前沿技术探索
跟踪扩散模型、强化学习(PPO/SAC)在游戏AI的应用,研究联邦学习在隐私计算中的落地。
熟悉AutoML(NAS/HyperOpt),自动化调参节省80%人力成本。
1. 电商大模型搜索推荐系统(2023)
技术栈:LLM(GPT-4微调)+ 多模态检索(CLIP)+ 实时特征工程(Flink)
创新点:
结合用户历史行为与大模型语义理解,重构搜索相关性模型,解决长尾查询匹配问题,搜索转化率提升18%。
部署低延迟推理框架(ONNX Runtime + Triton),P99响应时间<100ms,支撑千万级QPS。
商业价值:年增GMV超5000万元,获客户技术创新奖。
2. 金融风控实时反欺诈引擎(2022)
技术栈:图神经网络(GAT)+ 动态规则引擎(Drools)+ 毫秒级流计算(Kafka/Flink)
创新点:
构建交易关系图谱,识别团伙欺诈模式,欺诈拦截率从75%提升至92%,误杀率降低40%。
设计特征漂移监控模块(KS/PSI),模型迭代周期缩短至1周。
商业价值:减少欺诈损失约3000万元/年,方案复制至3家银行。
3. 工业缺陷检测AI平台(2021)
技术栈:自监督学习(SimCLR)+ 轻量化部署(TensorRT)+ 边缘计算(NVIDIA Jetson)
创新点:
针对小样本缺陷数据,采用迁移学习+数据合成(GAN),检测准确率达99.3%(行业平均95%)。
模型蒸馏至200MB以下,在工厂边缘设备实现实时推理(30FPS)。
商业价值:替代传统人工质检,客户成本下降60%,落地5条产线。