我长期从事机器学习与数据挖掘方向的技术研发,具备扎实的算法基础与丰富的项目实践经验,能够为企业提供从数据处理到模型落地的全流程技术支持。熟悉经典机器学习方法、深度学习模型、时间序列预测、自然语言处理、推荐系统等方向,能够根据业务需求选择合适的算法方案并进行系统性优化。
在工程实现方面,熟练使用 Python 及主流机器学习框架,能够完成数据清洗、特征工程、模型训练、参数调优、效果评估与可解释性分析。同时具备将模型部署到实际业务场景的能力,包括模型服务化、性能优化与监控体系搭建。对数据质量管理、实验设计、A/B 测试等流程也有成熟经验。
我擅长将复杂问题拆解为可执行的技术路径,并以结果为导向推动项目落地。注重沟通与需求理解,能够在项目周期内保持高频同步,确保交付物与业务目标一致。无论是算法咨询、模型开发还是数据分析类任务,都能提供专业、可靠且可持续迭代的技术支持。
我独立完成过一个“基于社交媒体数据的舆情话题分析与用户画像系统”,涵盖数据采集、异步任务调度、主题建模、文本聚类、传播关系分析等完整算法链路。系统能够根据用户输入的关键词自动抓取大量博文,并对话题热度、传播结构、评论主题、关键词云等多维度进行分析,最终生成可用于用户画像构建的主题标签。
在算法层面,项目实现了多种文本聚类与主题分析方法,包括基于 MGP 的短文本聚类算法、LDA 主题模型、Single-Pass 在线聚类等,用于处理不同粒度的舆情结构与用户行为模式。同时构建了传播树、关键节点识别等图结构分析模块,用于刻画信息扩散路径。
在工程方面,系统采用前后端分离架构,后端基于 FastAPI 构建服务,结合 Celery 与 Redis 实现分布式异步任务处理,前端基于 Vue 实现可视化界面。整体项目展示了我在算法设计、数据处理、系统架构与工程落地方面的综合能力。目前该项目在GitHub上已经有接近500的star.
在该项目中,我独立完成了一个基于社交媒体数据的舆情话题分析与用户画像系统,涵盖数据采集、异步任务调度、主题建模、文本聚类、传播关系分析等完整算法链路。系统能够根据用户输入的关键词自动抓取大量博文,并对话题热度、传播结构、评论主题、关键词云等多维度进行分析,最终生成可用于用户画像构
该项目围绕云平台供应链安全展开,构建了一个面向实际业务场景的供应链风险评估系统,重点解决云平台在组件依赖复杂、风险传播链条长等情况下难以进行系统化风险识别的问题。项目以 SBOM 为核心数据源,结合官方文档、开源社区信息以及大模型生成内容,构建了覆盖组件、漏洞、依赖关系、风险事件