我专注于大模型的深度定制与知识增强,核心是通过微调与数据工程,将通用模型转化为精准服务于特定领域的智能体。我熟练掌握全参数微调和高效参数微调技术,能够依据任务需求与计算资源,合理运用LoRA、QLoRA等方法直接优化模型权重,使其内化专属知识或技能。同时,我深谙“数据决定上限”的道理,擅长设计数据构造策略,能通过多种方法生成高质量的指令、问答及思维链数据,为微调成功奠定坚实基础。
面对具体需求,我能提供两种核心解决方案:对于需固化能力或要求低延迟的场景,我通过微调让知识成为模型本身的一部分;对于知识频繁更新或需严格溯源的场景,我采用检索增强生成技术,为模型挂载外部知识库。我擅长根据业务的实际状况,在“模型调参”与“外部挂载”之间做出权衡,甚至设计融合方案,以最具性价比的路径打造真正懂业务、可信赖的专属模型。
曾在小米集团担任高级算法工程师,以SP offer加入,主要负责大模型技术在智能客服场景的深度应用与系统优化。主导设计了端到端的客服对话智能摘要方案,基于自研的大模型构建语音识别与对话理解模块,创新性地融合意图识别、情感分析与领域知识进行联合建模,显著提升人工客服处理效率。该系统已广泛应用于小爱同学客服场景,实现对用户属性、核心诉求及情绪信息的自动化、结构化提取,有效支撑了千万级用户的智能服务需求。
此前,我在中国移动以“金种子”身份从事大模型与自然语言处理研发工作,重点负责大模型在智能对话系统中的技术攻关与工程落地。主导设计基于预训练模型的对话理解框架,并结合业务场景优化多轮对话与语义解析能力,相关成果获年度创新项目奖并在多个省公司客服系统中落地。期间,我于顶级会议NAACL发表大模型相关论文一篇,主导申请多项高价值技术专利,为后续在小米从事小爱同学等产品的研发奠定了坚实的理论及工程基础。
全开源作品 基于多智能体协作与大模型技术,实现从需求文档自动解析到结构化测试设计全流程自动化。支持五种黑盒测试方法、多文档融合和质量评审机制。 ✨ 核心特性 🤖 六阶段全自动流程:文档解析 → 资料提取 → 需求融合 → 场景设计 → 数据生
本程序可以一键执行多种任务,包括简单网页前后端开发,文件解压并提取发票等相关数据并整理到表格,也可以快速进行服务器管理操作,如创建文件夹或者创建角色等等,还可以分析数据并按照要求生成美观的数据看板,多种能力等待自行探索。作品图片为生成的游戏界面和分析文件生成的数据看板。