掌握 Python、Java 基础,有良好的面向对象编程思想和注释习惯;
掌握 TensorFlow、Pytorch 深度学习框架的基本使用;
熟悉逻辑回归、贝叶斯、聚类、决策树、fasttext等主流机器学习模型;
熟悉 CNN、RNN、LSTM、Attention、Transformer 、Bert 等深度学习模型;
熟悉分词、词性标注、情感分析、文本分类、信息抽取、NER 等常见 NLP 问题;
熟悉爬虫、数据分析相关库,如 Pandas、Numpy、Matplotlib 等;
具备良好的数据清洗、建模与可视化的能力;
熟练掌握 Linux 开发环境和常用命令;
熟悉掌握 Oracle、MySQL 数据库的增删改查,具有良好的 SQL 功底;
掌握LLM、agent智能体开发等。
【基于深度学习的短文本分类项目】
开发环境:python,tensorflow,pandas,numpy, scikit_learn
模型工具:text-cnn, FastText, bert等
项目描述:该项目数据集非常庞大并且训练机器和训练时间有限,综合对比后采用的是 text-cnn 和 FastText 模
型,经过本地训练后将模型持久化保存,用于下游分类任务,进而可以用于个人信用风险评估、个性化营销、风
控管理等场景,具有非常高的应用价值。
项目效果:该项目原采用的是决策树模型,后面由我和同事对项目进行了重构,采用深度学习模型,其中主要涉
及分词、词性标注、语义相似度分析、模型优化等,无论从训练速度还是准确度上都有了大幅提升,准确度更是
从 85%提升到了 96%,更好的应用于公司的下游任务。
【爬虫+数据分析】
项目描述:利用python爬取电商平台数据,进行数据分析挖掘,制作可视化报表,增大获客来源和挖掘潜在价值。
【其他大模型智能体项目】
本人是专业的算法工程师+数据挖掘工程师,从事项目较多,不再赘述