ID:421324

HC

算法

  • 公司信息:
  • 毅思北京互联网科技有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 可工作日远程
  • 所在区域:
  • 上海
  • 杨浦

技术能力

熟练掌握大模型微调、多模态语音合成相关技术,精通Qwen、CosyVoice等阿里开源大模型与TTS框架;熟练使用LoRA/PEFT轻量化微调方案,可针对TTS模型做音色、韵律、多音字发音定制优化。熟练Python、PyTorch、vLLM推理加速,能够完成流式Streaming-TTS改造、WebSocket实时音频流开发;熟悉FastAPI后端服务封装、Docker容器化部署,具备高并发推理优化经验,可通过混合精度、动态Batch优化提升服务吞吐。掌握文本归一化TN规则开发,能处理数字、量词、多音字等中文发音问题,熟悉客服场景TTS生产落地全流程,可独立完成模型调优与工程上线。

项目经验

1. Qwen-TTS生产级落地优化项目:基于Qwen-TTS与CosyVoice完成生产化改造,针对原生模型发音不准、长文本韵律生硬问题,构建客服领域标注数据集,采用LoRA微调优化多音字、数字读音;自研文本归一化模块统一输入文本格式,优化长文本智能分句逻辑,改善断句与自然度。完成流式TTS推理改造,实现边生成边播放,依托vLLM优化推理速度,通过FastAPI+WebSocket搭建实时语音合成服务,Docker打包部署,完成压测优化,满足客服机器人低延迟、高并发生产需求。

2. 参与LLM数据抽取开发项目,基于大模型实现PDF财报结构化信息提取,完成数据清洗入库与前端可视化对接。

案例展示

  • 算法

    算法

    本项目基于Qwen-TTS、CosyVoice开源模型,面向客服机器人场景完成生产级落地优化。负责前端文本归一化模块开发,通过规则+小样本LLM方案解决多音字、数字、计量单位发音错误问题;采用LoRA轻量化微调方案,依托客服场景语料优化音色、停顿与韵律表现,优化长文本智能分句逻辑

  • 算法

    算法

    本项目为海外物业SaaS定制财报智能解析管线,依托大模型完成PDF财务报告自动化结构化提取。使用Pdfplumber搭建PDF解析Pipeline,完成不规则财报文本、表格内容提取;通过自研LLM提示词工程,将非结构化财务文本转换为标准化字段数据,区分营收、成本、资产等类目。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服