作为一名专注于CV(计算机视觉)、NLP(自然语言处理)、推荐系统和大模型Agent的算法开发顾问,熟悉各类前沿技术栈,能够为企业提供高效的AI解决方案。在计算机视觉领域,我熟练运用YOLOv8和YOLOv5系列进行实时目标检测,结合Vision Transformer (ViT) 和DETR模型实现端到端物体检测与分割;此外,我精通Segment Anything Model (SAM) 和CLIP多模态模型,用于图像语义分割和零样本学习,支持Stable Diffusion和ControlNet在生成式AI中的应用,如图像编辑和风格迁移。在自然语言处理方面,我深度应用BERT变体(如RoBERTa和DistilBERT)、T5和BART模型进行文本生成、摘要和翻译任务;同时,集成GPT-3.5/4系列和LLaMA2/Mistral大语言模型,实现高效的提示工程(Prompt Engineering)和微调(Fine-Tuning),包括PEFT(Parameter-Efficient Fine-Tuning)技术如LoRA和QLoRA,以降低计算成本。在推荐系统方向,我擅长构建Transformer-based模型如BERT4Rec和SASRec,用于序列推荐和点击率预估(CTR),结合DeepFM和DIN模型优化用户行为建模,支持A/B测试和实时在线学习;在多模态推荐中,我使用CLIP和BLIP融合文本-图像特征,提升电商和内容平台的个性化体验。对于大模型Agent开发,我精通LangChain和LlamaIndex框架,构建RAG(Retrieval-Augmented Generation)管道和多Agent系统,如CrewAI和Auto-GPT变体,实现自主任务分解、工具调用和决策链;此外,我熟练使用Hugging Face Transformers库进行模型部署(ONNX/TensorRT优化),并集成Gradio或Streamlit快速原型开发。这些技术栈均基于PyTorch 2.0+和TensorFlow 2.x框架,支持云端部署(如AWS SageMaker或阿里云PAI),帮助客户从数据预处理到生产级上线全流程落地,累计处理过多个实际项目,确保模型高效、可扩展且鲁棒。
1、为短视频创业公司开发CV+NLP联合审核引擎:前端使用YOLOv11实时检测违规物体/场景(暴力、涉黄等),后端结合DistilBERT + T5进行文本情感/敏感词多标签分类;集成CLIP零样本分类提升新内容覆盖。整体F1分数达0.91,支持每秒数百帧处理。通过Hugging Face Transformers + TorchServe部署,实现低延迟云边协同。该项目从数据集构建(自标注+公开数据)、模型蒸馏到A/B灰度上线,显著降低平台违规率25%。
2、为公司“法律人工智能+”战略核心产品开发内部+外部双Agent系统:主Agent基于CrewAI + LangGraph负责任务分解与协调(如“分析上季度法院执行风险并生成合规建议”),子Agent包括知识检索Agent(LlamaIndex + Qwen-7B RAG管道,融合公司25年法律知识图谱)、意图识别Agent(fine-tuned Mistral-7B针对司法术语优化)和执行Agent(工具调用法院数据库/API)。结合PEFT微调(LoRA/QLoRA)和长上下文优化,处理多轮复杂对话准确率达89%,显著减少人工客服/法官介入70%以上。系统集成Streamlit快速原型 + Supabase向量存储,实现从PoC验证到生产级上线的全流程。该项目体现了大模型Agent在司法长任务自主规划、工具调用与稳定性上的深度应用,已覆盖公司智慧审判/执行/诉服等多模块。
3、参与公司面向纪检监察业务的“数据+算法+工作流”核心架构开发,构建监督办案智能Agent,支持案件电子数据分析、风险防控与异常行为检测。CV模块使用YOLOv8 + SAM实现视频/图像轨迹追踪与违规场景分割;NLP模块fine-tune T5/BART变体进行文本情感分析与敏感词多标签分类;Agent层集成LangChain框架,实现自主任务分解(如“筛查廉政风险并生成报告”)。整体F1分数达0.92,支持边缘部署与云边协同。通过Hugging Face Transformers + TorchServe优化,实现低延迟处理。该项目显著降低纪检监察违规率约20%,并推动公司向执法监督智能化转型,体现了CV+NLP+Agent在政法高安全场景的鲁棒性和实时性。
| 角色 | 职位 |
| 负责人 | 资深算法工程师 |
| 队员 | 产品经理 |
| 队员 | 前端工程师 |
| 队员 | 后端工程师 |
项目核心功能与亮点 定时爬取与智能汇总:每天固定时间(如美股开盘前、中国A股早盘前)自动从主流财经源(雪球、东方财富、华尔街见闻、Yahoo Finance、Bloomberg、Seeking Alpha、财联社、Wind终端模拟等)爬取最新宏观经济数据、个股异动、行业研报
PPTAgent 的最大亮点在于模仿人类真实制作PPT的“反思式编辑流程”,而非端到端的简单文本生成。它采用两阶段编辑式方法(two-stage, edit-based approach): 第一阶段:参考分析与大纲规划 输入用户提供的参考PPT(优秀模板、竞品演示文稿等