我是一名高级算法工程师,专注于自然语言处理(NLP)领域,具备丰富的经典算法和大模型算法经验。熟练掌握Transformer、BERT、GPT等主流模型架构,并在大模型应用如检索增强生成(RAG)方面有实际项目经验。能够高效处理文本分类、序列标注、机器翻译、问答系统等任务,熟悉预训练、微调及模型优化技术。同时,具备扎实的编程基础,精通Python、PyTorch、TensorFlow等工具,能够结合分布式计算框架进行大规模数据处理与模型训练。致力于通过技术创新解决复杂的NLP问题,提升模型性能与应用效果。
1. **RAG系统开发**:主导开发了一个基于检索增强生成(RAG)的智能问答系统,用于企业知识库的高效检索与生成。通过结合稠密检索与生成模型,显著提升了问答的准确性与上下文相关性。系统支持多轮对话,能够从海量文档中快速定位信息并生成自然语言回答,已成功应用于多个企业客户,大幅提升了知识管理效率。
2. **教育行业智能批改系统**:设计并实现了一个面向教育行业的AI批改系统,基于Transformer架构实现了作文自动评分与语法纠错功能。系统通过预训练语言模型捕捉语义特征,结合规则引擎进行细粒度错误检测,支持多维度评分与个性化反馈,帮助教师减轻批改负担,同时为学生提供即时学习指导。
技术框架 1、文档预处理模块:对文档进行分块、清洗和向量化处理,使用BERT等预训练模型生成稠密向量,并存储于向量数据库中以支持高效检索; 2、稠密检索模块:基于用户查询,利用embedding模型从向量数据库中检索Top-K相关文档片段; 3、生成式问答模块:自己部署大模
技术框架 1、学习资源预处理模块:对教材、课件、习题等学习资源进行分块、清洗和向量化处理,使用BERT等预训练模型生成稠密向量,并存储于向量数据库中,支持高效检索。 2、智能检索与推荐模块:基于学生的学习需求或教师的教学目标,利用embedding模型从资源库中检索最相关的学