资深数据分析师与后端开发工程师,数学+计算机复合背景,精通Python全栈开发。
核心技能:
1. 数据分析/挖掘
- 熟练运用Pandas/NumPy/Scikit-learn实施数据清洗、统计分析及挖掘;
- 精通Tableau/Power BI可视化,可独立完成用户行为分析报告与埋点方案设计。
2. 数据建模/机器学习
- 掌握回归/聚类/神经网络等监督/无监督模型,擅长预测分析与用户分群;
- 熟悉Transformer、BERT等NLP模型,具备PyTorch/TensorFlow2工程化开发能力,支持算法调优与部署。
3. 后端开发
- 熟练使用Java/Spring Boot构建高并发业务系统;
- 精通Flask/Django开发数据API接口及ETL数据管道。
4. 交付保障:
- 严格执行需求对齐与进度管控
项目 1:用户增长分析
技术栈:Python(Pandas+PySpark)、AWS EMR、Tableau
成果:构建司机行为预测模型,通过时空特征分析优化派单策略,驱动区域司机月留存率提升23%,节约运营成本超300万/年。
项目 2:NLP欺诈检测
技术栈:PyTorch(BERT+BiLSTM)、Docker、Redis
成果:设计多模态风控模型,融合用户文本合同与交易行为数据,实现92%欺诈召回率,误报率压降至行业最优水平(<5%)。
1. 问卷量化:针对两种商旅模式设计多层指标体系,通过Likert 5级量表收集300+企业用户反馈,采用信效度检验(Cronbach's α>0.85)确保数据可靠性 2. AHP建模:构建准则层(成本/效率/体验/安全)+ 方案层权重矩阵,一致性检验(
1. 用户画像及数据可视化 对脱敏数据进行可视化,并基于 shiny 实现可视化整体方案 2. 求解传染病模型,并进行可视化,支持用于自定义传染病模型参数,并绘制对应可视化效果