1. 编程与数据分析:熟练掌握 Python 与 SQL,能够高效完成数据提取、清洗、建模及可视化任务。具备实际项目经验,包括使用 Python 进行自然语言处理(NLP)建模(TextCNN、BiLSTM 等)和基于 SQL 的数据库系统开发与管理。
2. 机器学习与建模:掌握常见机器学习算法及文本分析技术,如特征提取(TF-IDF、Word2Vec)、模型训练与评估、迁移学习与知识蒸馏,具备实际项目中的参数调优与模型优化经验。
3. 数据系统与办公工具:熟悉 Access 数据库开发及 SQL 数据处理,有能力完成数据存储、管理及系统设计;熟练使用 Visio、Excel、Word 和 PPT,能清晰呈现数据分析结果与项目报告。
4. 业务洞察与实践能力:兼具业务理解力与数据洞察力,能将分析结果有效转化为优化建议与决策依据,具备出色的信息整合与归纳分析能力,以支持数据驱动决策。
5. 英语及沟通能力:具备良好的英语沟通能力,能适应跨文化协作环境,并在团队项目中承担协调和汇报职责。
1. 中国科学院(北京) – 数据分析实习生 – 2024/7/24 至 2024/11/1
开展自然语言处理(NLP)相关研究,主要涉及文本分类、多模态情感分析及迁移学习技术,项目聚焦于茶叶评价文本的多标签与多分类任务。
使用python数据分析技能,进行数据清洗、标准化与预处理,运用TF-IDF、Word2Vec及预训练Wikipedia词向量进行文本特征提取,构建并训练TextCNN、TextRNN、BiLSTM等多种神经网络模型。
通过F1分数与ACC分数评估模型性能,进行参数调优与工程优化,并探索迁移学习与知识蒸馏技术,以提升数据稀缺场景下的模型表现与轻量化部署能力。
实现茶叶评价的自动化多维度情感分析,从质量、价格、服务等多个方面解析用户评价,为茶叶品牌分析当前客户消费倾向与提供可操作的决策支持,助力产品与服务优化。
2. 鼎校教育科技有限公司(合肥) – 大数据实习生 – 2025/2/24 至 2025/5/16
主导英语词汇量检测逻辑优化项目,通过统计分析多次学生测试结果及竞品调研,重新设计分级测试机制:将单词按难度分级,基于正确率动态调整测试难度,并建立分数与词汇量等级的映射关系,提升词汇量检测的科学性与准确性。
构建测试词库,基于学生历史识记单词数据筛选和补充测试词库,为检测逻辑提供数据基础。
开发教练销课风险评估模型,创新设计包含销课占比、变异系数和协同系数三大维度的计算公式,通过加权整合输出风险评分,协助合伙人和交付中心识别异常表现并制定改进策略。
完成多项专项数据分析,包括IP登记误差分析、俱乐部品牌孵化追踪、高校合作项目的上课与耗课统计等,为运营决策提供数据支持。
开展自然语言处理(NLP)相关研究,主要涉及文本分类、多模态情感分析及迁移学习技术,项目聚焦于茶叶评价文本的多标签与多分类任务。 使用python数据分析技能,进行数据清洗、标准化与预处理,运用TF-IDF、Word2Vec及预训练Wikipedia词向量进行文本特征提取,构
开展自然语言处理(NLP)相关研究,主要涉及文本分类、多模态情感分析及迁移学习技术,项目聚焦于茶叶评价文本的多标签与多分类任务。 使用python数据分析技能,进行数据清洗、标准化与预处理,运用TF-IDF、Word2Vec及预训练Wikipedia词向量进行文本特征提取,构