ID:260498

峰峰009

NLP高级工程师

  • 公司信息:
  • 百度
  • 工作经验:
  • 4年
  • 兼职日薪:
  • 800元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

1.熟练网络爬虫技术,利用beautifulsoup、selenium实现静态和动态网页爬取、模拟登陆。 熟悉爬虫框架scrapy。
2.熟悉常见词袋模型、TF-IDF、N-gram以及word2vec、glove、bert来训练词向量表示。 
3.掌握面向文本的CNN、RNN、LSTM、transformer、Bert、Albert以及衍生的bert家族模型。 
4.熟练文本挖掘场景:文本情感分类、实体识别、实体关系提取、文本纠错、文本相似度匹配、事件抽取等技术模型。 
5.熟练知识图谱和图计算:信息抽取 、实体链接、知识图谱构建等技术方案,熟悉图数据库neo4j、ArangoDB。
6.掌握问答场景方案:KBQA场景,多轮对话。包括query解析,意图识别,槽位填充,问答查询。
7.熟练Tensorflow、Keras、pytorch框架和linux命令。
8.熟悉Docker运用,应用和部署。

项目经验

知识图谱产品研发:公司知识图谱产品的底层算法研发。包括抽取算法调研,技术选型,方案制定,项目落地,都是核心的参与人员。并且有后期的算法的更新迭代。

文本分类产品研发:公司文本分类产品的底层算法研发。包括全流程的文本分类方案制定,低门槛的算法设计,包括多分类、多标签、层次分类三种应用场景。

项目1: 智慧医疗项目模块--信息提取。研究实体抽取和实体关系抽取算法,针对医疗指南和医疗药品说明书数据,实现了基于 Bert 模型的 NER 算法和基于 Attention 机制+BiGRU 模型的 RE 算法。
主要工作: 
(1)分析医疗指南和药品说明书数据,根据项目需求,从众多类别中筛选训练实体类别(10 类)和关系类别(14 类)。 
(2)研究 Bert 模型,尝试添加 BiLSTM 结构以及 CRF 层,实验表明,效果提升不明显。最终,在 Bert 模型输出层 之后添加全连接层,MicroF1 score 在 90%左右。 
(3)将句子中的每一个中文字符转化为 character embedding,与位置信息 concate 之后,输入到 BiGRU 模型,同时 加入字级别的 attention。 
然后对每一种类别的句子输入做共同训练,加入句子级别的 attention。 
联合字符级别 attention 和句子级别的 attention,同时调整模型参数。最终 MicroF1 score 在 81%左右。


项目2: 扬州市市公安局信息中心---智察系统的部分模块研发。该模块主要是在公安内网中做报警地址精确匹配 任务:地址分析、地址碰撞、地址纠错等。在此过程中,涉及到报警地址分词,地址纠错、自建 POI 库等核心技术,并 通过 ES(Elastic Search)搜索引擎实现检索。
主要工作: 
(1)地址分词。对报警地址进行标注,借助 BiLSTM+CRF 模型,识别出报警信息中的地址实体。最终的 F1 值在 0.9 以上。曾利用 ES 自带分词器 IK 分词,但是效果不佳。 
(2)对已识别的地址实体进行地址错写修正。通过分析地址错写类型,结合汉字音形和字形特征,设计研发了音形 码算法。首先对汉字进行编码存库,利用地址对应的音形码在标准地址库中匹配候选实体,然后利用 KMP 字 符串算法给候选实体计算匹配度,根据预先设定阈值筛选候选实体。 
(3)自建 POI(Point of Interest)库。分析 POI 所需的地址要素,调研各大地图查询接口。通过编写爬虫脚本,爬取图

案例展示

  • 文本合同解析

    文本合同解析

    知识图谱平台是一款具有闭环自学习能力的知识图谱构建平台,通过知识抽取、知识表示、知识融合、知识推理等各类人工智能关键技术,提供4步构建知识图谱的能力,即图谱配置、数据接入、图谱构建、图谱查验。 平台将知识图谱构建门槛很高的几个核心步骤进行了封装,将复杂的知识图谱问题转化为业务人

  • 档案归档方案

    档案归档方案

    文本分类系统在本项目中的主要作用是对档案室库存档案数据进行文本分析,提取档案文件特征信息,构建分类模型,自动确定归档文件分类和保管期限。文本分类系统要能独立运行,不依赖于其他系统。 本人在此方案中承担的角色如下:整体的方案设计,算法部分的开发和部署。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    2
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服