ID:298841

weikangzhao

广告推荐算法工程师

  • 公司信息:
  • vivo软件技术有限公司
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 600元/8小时
  • 兼职时间:
  • 下班后
  • 可工作日远程
  • 所在区域:
  • 北京
  • 朝阳

技术能力

1、熟悉 Python\Scala\Java,了解 C++;熟悉 linux 和 shell;熟悉常用的数据结构和算法;
2、熟悉 Spark\MapReduce\Hadoop\HIVE 等大数据处理工具和原理,并熟练使用;
3、熟悉 LightGBM/XGB,GBDT+LR,RF,Adaboost 等传统机器学习算法原理,并熟练使用;
4、熟悉 Tensorflow 开源框架,了解 DNN,DeepFM/FFM/FNN,DSSM,ESMM,DIN 等推荐系统常用网络;

项目经验

2020.06-至今 vivo 智能平台部 效果广告组
背景介绍: vivo 在手机浏览器的信息流广告中,为了快速迭代,引入头条 toB 的算法部门,与 vivo 算法团队,进行广告
效果的比稿。在与头条团队 pk 中,将信息流广告效果不到头条 90%迭代到现在 ctr\arpu\广告主价值 97%左右。
信息流广告 CXR 预估
 实时模型的推进:生成低延迟样本,模型从天级模型迭代成小时级模型,有效降低预估偏差,提升点击率。
 特征工程优化:特征体系的熟悉,并在用户特征和广告特征的交叉上做了很多尝试和优化,挖掘用户兴趣
特征,离在线都取得了收益,并将有效特征推广到其它场景(浏览器推荐页、详情页、短视频、联盟)
 模型优化:基于 tf 训练框架,离线尝试用 DIN 和 DeepFM 模型优化推荐页 CTR 模型,在 AUC 和偏差以
及先后验上都拿到了收益。
 模型蒸馏:粗排的 CTR\CVR 模型学习精排线上打分,可以迂回学习隐藏的特征,CTR\CVR 多网络的训
练方式,底层 Embedding 共享机制让 CVR 网络也可以从曝光未点击样本中学习信息,扩充样本量,减
少样本偏差问题。
信息流召回框架构建
 参与 Vivo 信息流召回框架从无到有,采用 DSSM 模型,pair-wise 的建模方式,基于未曝光数据构建样
本,学习队列的序,正样本为精排模型排序 Top 的 item,负样本在精排\粗排队列根据排序卡点采样;从
数据流的建设,离线评估指标,模型代码开发到上线一致性验证整个流程独立完成,最终上线取得 3 个点
广告主价值收益,在推荐页以及其它场景(详情页、短视频)推全
 样本优化:改进负样本采样方式,融合 hard negative 和 easy negative,对热门 item 作负样本时过采
样,新的样本构建方式离在线都取得稳定收益
2018.09-2018.11 DC TCBD 数据挖掘竞赛 小微企业失信预测 冠军
 通过分析苏州市几十万家小微企业各方面留下的行为足迹信息,理解企业失信的司法定义,分析数据,构
造基本统计特征、交叉特征、业务特征、规则特征,最终使用(Adaboost、随机森林、LightGBM、XGB
等模型) + LR 的 stacking 模型融合方式进行融合,给出企业失信概率。

案例展示

  • 数据挖掘竞赛冠军

    数据挖掘竞赛冠军

    本人于就读北京科技大学研究生期间多次参加天池、DataCastle等知名平台数据挖掘竞赛,并于2018.09-2018.11 DC TCBD 数据挖掘竞赛中小微企业失信预测项目 作为队长 带队获得冠军 通过分析苏州市几十万家小微企业各方面留下的行为足迹信息,理解企业失信的司法

  • 天池数据竞赛 网络图像的文本识别 第五名

    天池数据竞赛 网络图像的文本识别 第五名

    本人于就读于北京科技大学研究生期间多次参加天池、Datacastle等平台数据挖掘竞赛 并于2018年 在天池数据挖掘竞赛平台上ICPR MTWI 2018 挑战赛一:网络图像的文本识别 项目 于1370支队伍角逐中获得第五名。 网络图像的文本行(列)识别: 识别单文本行(列

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服