编程语言:
• Python:熟练掌握数据分析库(Pandas、NumPy、Matplotlib、Seaborn)和机器学习框架
• MATLAB:具备数值计算和数据可视化能力
• SQL:熟练使用数据库查询和数据处理
AI/机器学习:
• 深度学习:熟悉TensorFlow/PyTorch框架,实践过CNN、RNN等模型
• 自然语言处理:了解BERT、GPT等预训练模型应用
• 计算机视觉:有图像分类、目标检测项目经验
• LangChain:熟悉RAG应用开发,构建过智能问答系统
开发工具:
• 版本控制:Git/GitHub项目管理和协作开发
• 数据库:MySQL、向量数据库(Chroma/Pinecone)
• 大模型:ChatGPT、Gemini、Claude等API集成开发
数据分析:
• 数据处理:Excel高级应用、Python数据清洗和预处理
• 可视化:Matplotlib、Seaborn、Plotly制作交互式图表
• 统计分析:描述性统计、假设检验、回归分析
项目经历
基于LangChain的智能文档问答系统 | 2024.03-2024.05
项目描述:构建企业级文档智能问答平台,支持多格式文档解析和语义检索
技术栈:Python、LangChain、向量数据库、OpenAI API、Streamlit
核心贡献:
• 设计文档解析模块,支持PDF/Word/Markdown等格式,文档处理准确率达95%
• 实现基于向量相似度的语义检索,检索相关性提升30%
• 开发Web界面,用户查询响应时间控制在2秒内
• 部署至云服务器,支持并发用户访问
电商用户行为数据分析项目 | 2023.09-2023.12
项目描述:分析某电商平台用户购买行为,构建用户画像和推荐系统
技术栈:Python、Pandas、Scikit-learn、Matplotlib、MySQL
核心贡献:
• 处理100万+用户行为数据,完成数据清洗和特征工程
• 使用RFM模型进行用户分层,识别高价值客户群体
• 构建协同过滤推荐算法,推荐准确率达75%
• 制作数据可视化报告,为业务决策提供数据支持
社交媒体情感分析系统 | 2023.06-2023.08
项目描述:基于深度学习的中文社交媒体情感分析和舆情监控
技术栈:Python、PyTorch、BERT、Jieba、Flask
核心贡献:
• 收集并标注5万条微博数据,构建情感分析数据集
• 基于BERT模型进行情感分类,准确率达87%
• 开发实时监控系统,支持关键词追踪和情感趋势分析
• 使用Flask框架开发API接口,支持批量数据处理
上海理工大学学报智能管理系统 项目概述 《上海理工大学学报》智能管理系统是一个基于 Django 框架开发的学术期刊管理平台,旨在实现学术稿件的提交、审稿、编辑、出版和数据分析全流程的自动化管理。该系统支持多角色用户(投稿人、审稿人、编辑、管理员),提供编号设计、通知中心、数据可
纽约市共享单车需求预测系统 项目简介 本项目是一个基于机器学习和深度学习的纽约市共享单车需求预测系统,通过分析历史骑行数据、天气数据和时空特征,实现对未来单车需求的精准预测。 功能特性 🚴 多维度数据分析: 时间、空间、天气等多维度特征分析 🤖 多模型预测: 集成8
纽约市共享单车需求预测系统 项目简介 本项目是一个基于机器学习和深度学习的纽约市共享单车需求预测系统,通过分析历史骑行数据、天气数据和时空特征,实现对未来单车需求的精准预测。 功能特性 🚴 多维度数据分析: 时间、空间、天气等多维度特征分析 🤖 多模型预测: 集成8