数据分析工具:Python, Hive等
可视化工具:Tableau
异常检测算法模型:DBSCAN,孤立森林等
回归/分类算法:LR, SVM,随机森林,Xgboost,CatBoost, LightGBM等
文本处理:了解textCNN, Word2Vec等
深度学习:了解CNN, RNN, RCN等神经网络,了解Transform
华为技术有限公司
负责风控算法模型方案设计,模型建设及工程化落地。完成30+算法模型工程化建设,10+模型试算,从0-1搭建图风控。
1. 工程采购中,判断供应商间是否存在风险,对询价行描述文本相似度判断,模型准确率90%以上,节省业务作业时间,提升了风险覆盖率;
2. 代表处稽查项目中,搭建图风控,梳理2千万+的节点,14类边;图风控应用5个场景(黑黄名单换壳,异常关联关系识别,围串标等),模型准确率87% 以上;提供图可视查询,快速帮助业务查看实体间关联关系及风险提示(根据历史及黑黄名单)。
3. 资金日清日结项目,每日的交易数据量百万级别,通过无监督+有监督的方法,降低业务分析数据量,提高业务分析效率。
4. 销售业绩压力大,出现提前确定收入,建假项目冲收入等。通过识别文档中的印章,是否存在章盖字,字盖章,图片章等情况判断文档真实性,利用外部招投标数据,判断项目招中标单位,中标时间等与内部数据进行比对,判断项目的真实性等
顺丰科技有限公司
1. 完成50+风控规则及模型开发;
2. 业务账号盗用风控策略搭建,从数据清洗,数据加工,模型建设,黑名单,上线测试,结果反馈及模型优化策略的制定,减少千万损失,修复5个系统BUG;
3. 以客户,员工,网点等维度,从风控的视角,建设公共数据层;
4. 借助tableau从不同角度分析(客户,员工),输出分析报告(10+)及可视化。