ID:422873

Yang

算法工程师

  • 公司信息:
  • 菜鸟
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 700元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 贵阳
  • 全区

技术能力

1. 拥有2 段 NLP项目、1 段 LLM SFT 项目、1 段 Agent 项目经历,拥有1 篇 CCF-B 类会议论文,熟悉Python, SFT, Agent, Spark, Java 等。
2. 拥有一篇论文: Yang S, Yu L. CoSPA: An Improved Masked Language Model for Chinese Spelling Correction. UAI 2022: 2225-2234,第一作者。

项目经验

2024.8 – 2025.1 任务型对话机器人 算法应用
1. 小灵:1.1)意图识别:Spark 拉历史对话,GPT4o 预标注(含 prompt 调优)准确率 96%,微调 Qwen2-1.5b 准确率从 74%升至 91%。
1.2)优化 DM Agent:1)判断用户意图是否明确,87.56%,提升 11%;2)判断识别意图是否正确,93.06%,提升 17%。
2. 货车宝营销机器人:基于 LangChain/SalesGPT 创建 Multi-Agent 货车司机机器人,分别是 state 和 memory 提取信息、stage 引导
对话流程、strategy 输出策略、driver 生成话术。
--------------------------------------------------------------------------------------------
2023.11 – 2024.3 兵工商城的商品搜索和推荐 算法工程
1. 推荐:1)挖掘用户历史行为。2)召回商品:构建易混淆负样本对,对比学习 SimCSE。3)重排:faiss 计算相似度。P@5=0.93。
2. 搜索:1)意图识别,用 ChatGPT 提取 query 实体构建词库,映射类目、品牌。2)ElasticSearch 召回。3)bm25 粗排,业务精排。
--------------------------------------------------------------------------------------------
2020.11 – 2021.5 中文拼写纠错 算法工程
1. 数据优化:1)数据增强,BERT 生成错别字。2)数据去噪,NNLM 过滤伪正例,Co-teaching 解决不完全/不正确标注(伪负例)。
2. 解决过纠正:1)BERT 首次引入 CopyNet 机制,生成时动态加大原输入字的生成概率,F1 值提高 2%。2)检测&纠正联合模型。
3. 解决连续错字:1)预测层多轮解码,recall 提 2%。2)Beam search + NNLM +阈值筛选,F1 提 1%。3)对比学习,F1 提 1%。
4. 错别字粗召回:在纠错模型前过滤不含错别字的句子。用 ERNIE 蒸馏 RoBERTa_tiny,训练方式为“序列标注+句子级别二分类”
的多任务。在保召回率 95%下,相比蒸馏前,过滤比例从 39.41%降到 29.43%,但推理性能提升 20 倍,模型可实用。

案例展示

  • 货车宝营销机器人Agent

    货车宝营销机器人Agent

    基于 LangChain/SalesGPT 创建 Multi-Agent 货车司机机器人,分别是 state 和 memory 提取信息、stage 引导对话流程、strategy 输出策略、driver 生成话术。

  • 中文拼写纠错

    中文拼写纠错

    1. 数据优化:1)数据增强,BERT 生成错别字。2)数据去噪,NNLM 过滤伪正例,Co-teaching 解决不完全/不正确标注(伪负例)。 2. 解决过纠正:1)BERT 首次引入 CopyNet 机制,生成时动态加大原输入字的生成概率,F1 值提高 2%。2)检测&a

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服