ID:314552

奇文王语 身份已认证

高级NLP算法工程师

  • 公司信息:
  • 百度时代网络技术(北京)有限公司
  • 工作经验:
  • 9年
  • 兼职日薪:
  • 800元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 海淀

技术能力

一、大模型技术能力
1. 具备丰富的大模型落地应用经验,能够结合实际业务场景将大模型技术应用于公文写作、Text2SQL 转换、标书生成等多个方向,推动业务智能化升级。
2. 熟悉主流大模型体系,包括 DeepSeek-R1、Qwen3、ChatGLM 等,掌握其在训练、推理、私有化部署以及国产化环境适配等方面的实践方法和优化策略。
3. 深入理解大模型训练与调优技术,熟练掌握增量预训练、全量微调、LoRA 轻量化训练、强化学习(如基于人类反馈的强化学习 RLHF)等关键技术路径,具备较强的工程实践能力和模型优化能力。

二、自然语言处理能力
1. 熟悉语言学基础知识,掌握语法结构、语义理解、句法分析等 NLP 核心概念。
2. 精通常见的 NLP 任务与算法,包括:
(1)序列标注与实体识别:命名实体识别(NER)、词性标注、条件随机场(CRF)等。
(2)句法与语义分析:依存句法分析、语义角色标注等技术。
(3)情感分析与分类:能够基于机器学习方法开展文本情绪识别与分类。
(4)问答系统与对话建模:熟悉基于规则及机器学习的问答系统构建方法。
(5)机器翻译:了解规则、神经网络等多种机器翻译技术。
(6)多模态理解:了解将图像、语音等信息与文本结合进行多模态任务建模。

三、语言模型与迁移学习能力
1. 熟悉语言模型在文本生成、补全和翻译等任务中的应用。
2. 理解统计语言模型与神经语言模型的原理与差异。
3. 掌握主流预训练语言模型(如 BERT、GPT)及其在下游任务中的微调方法。
4. 理解并实践迁移学习,能够将一个任务中的知识迁移至其他相关任务。

四、数据处理与工程实现能力
1. 熟练处理和清洗大规模文本数据,包括分词、去除停用词、缺失值处理等。
2. 具备使用GPU加速训练与分布式计算框架(如 PyTorch Distributed、Spark 等)处理大模型与海量数据的经验。
3. 熟悉模型评估方法,掌握准确率、召回率、F1 值、BLEU、ROUGE 等核心指标的使用。

五、学术素养与技术研究能力
1. 具备持续学习与研究能力,能够及时追踪 NLP 领域最新研究成果和技术趋势。
2. 注重理论与实践结合,善于将前沿技术应用于真实业务场景中解决问题。

项目经验

一、基于大模型的落地应用(写作,问答、摘要等)
(1)熟悉大模型进行增量预训练的操作(continue pretrain)
(2)熟悉基于DeepSeek、Qwen1.5,Qwen2,Chatglm3、Chatglm4、Baichuan等大模型的微调。
(3)熟悉大模型进行DPO、SIMPO等强化学习的训练过程。
(4)熟悉对标书、text2sql、法律等领域数据集的处理策略。
(5)熟悉对大模型进行推理加速(rtp-llm、vllm)量化(GPTQ)等操作,显著降低显存占用
(6)熟悉检索增强生成技术RAG,配合大模型一块使用,提高模型的生成质量。
(7)有大模型在实际场景的落地应用经验。

二、基于大模型进行内容写作的落地应用
项目简介:基于大模型进行公文内容自动生成。
工作内容:(1)收集最新的公文数据集,对数据集进行清洗。(2)选用Baichuan-7B,Qwen1.5-7B、ChatGlm4作为基础模型,基于基础模型,在大量的数据预处理的公文数据上持续预训练。(3)收集大量的 instruction pairs 数据,包括非公文的和公文的,然后进行有监督的微调(Supervised Fintune)获得领域模型.

三、基于PEGASUS模型的文本摘要算法
项目简介:对公文的全文内容进行简要描述,形成能概括公文主旨的一小段文字内容。
工作内容:(1)基于textrank算法抽取公文中的重要句子:对文章内容进行分句和分词处理、基于分词结果构建有向无权图、计算句子权重、根据句子权重值对句子进行排序、抽取文章标题与重要句子拼接作为关键句。
(2)以mT5模型为基础架构和初始权重,通过类似PEGASUS的方式进行训练,模型定义为t5-pegasus。对标注的文本摘要数据集进行清洗获得3万多条有效数据,基于这些数据进行模型训练

四、基于预训练模型的翻译模型算法
项目简介:利用大量的单语数据进行预训练,通过知识蒸馏算法从预训练模型中获取知识来提高翻译模型的效果。
工作内容:(1)基于fairseq深度学习框架,进行翻译模型的研发。(1)对平行语料进行预处理主要包含unicode_normalize;html_unescape;remove_other_symbols(2)设计知识蒸馏的算法主要包含word-level和sentence-level以及sequence-level三种类型的知识蒸馏方法。(3)利用大量的单语数据进行模型的预训练。(4)探索多语言模型XLM-R、MBART等多语言模型的训练和推理方法。

五、猫耳虚拟偶像机器人系统
项目简介:设计一个知识渊博的虚设偶像男友,通过与该偶像男友进行聊天获得想了解的答案。
工作内容:(1)设计算法架构流程图,主要包含意图识别、QA问答、阅读理解、闲聊生成、实体识别等模块。(2)设计基于BERT预训练语言模型的意图识别、QA问答模块模型的研发和部署。

六、个人技能
英语水平:CET-6
熟练Python、C#、Java等面向对象语言开发,MySQL、ES的应用,有良好的编程习惯
熟悉Linux操作系统下常用命令,熟悉shell、git、Visual Studio的使用
熟悉数据结构和算法设计、机器学习、数据挖掘等专业知识,了解TCP/IP通信协议
熟悉机器学习scikit-learn、深度学习库Tensorflow、pytorch、paddlepaddle的使用
熟悉CNN,GRU,Transformer等神经网络和BERT、Roberta、GPT等预训练模型的使用
熟悉大模型Qwen、Baichuan、ChatGLM基于full、freeze、lora等算法的训练和推理

案例展示

  • 虚拟偶像机器人系统

    虚拟偶像机器人系统

    虚拟偶像机器人系统 项目简介:设计一个知识渊博的虚设偶像男友,通过与该偶像男友进行聊天获得想了解的答案。 工作内容:(1)设计算法架构流程图,主要包含意图识别、QA问答、阅读理解、闲聊生成、实体识别等模块。(2)设计基于BERT预训练语言模型的意图识别、QA问答模块模型的研发

  • 手机商城导购机器人系统

    手机商城导购机器人系统

    ●手机商城导购机器人系统 项目简介:针对华为手机商城业务,设计一个手机导购机器人,该机器人系统主要包含文本分类、文本分类的人机协同、信息抽取模块、阅读理解、知识图谱、指代、容错、补全以及推荐模块等。 工作内容:(1)设计开发文本分类和人机协同任务的代码逻辑,包含价格的分类、手

  • 公文领域大模型研发

    公文领域大模型研发

    基于大模型进行公文和大纲自动生成。 工作内容:(1)收集最新的公文数据集,对数据集进行清洗。(2)选用Baichuan、Qwen、ChatGLM作为基础模型,基于基础模型,在大量的数据预处理的公文数据上训练领域大模型。(3)负责开发公文领域大模型自动评测功能。(4)负责开发公文

查看案例列表(含更多 0 个案例)

评价列表

猿急送用户    2024-05-24 10:01    5星

【该评论为5星(满分)好评,评论人选择不公开展示】

    2024-04-26 16:57    5星

技术挺好 ,服务也不错,期待下次合作

猿急送用户    2024-01-23 17:43    5星

【该评论为5星(满分)好评,评论人选择不公开展示】

信用行为

  • 接单
    6
  • 评价
    3
  • 收藏
    6
  • 五星率
    100%
  • 退款
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服