技术:履历背景:长期从事自然语言处理(LLM/RLHF)、sympy符号计算、lean4形式化证明的研究,掌握NLP实用技术并利用lean4语言对arXiv论文的观点进行求证,工程实践经验丰富,有完整NLP项目实施与交付经验,获交互式机器证明的软件著作权。 工程实践:精通C/C+
项目:工作概述:主导自然语言处理研发(C++/Java/Python),承担专利技术检索数据库等有关文本处理与聚类、段落切割与句法分析、大模型训练以及算法研究与优化工作,赋能公司技术变革与信息服务产品性能提升。 文本聚类(Java算法):使用Kmeans++算法,通过初始化聚类中心优
案例: 算法形式化定理库
技术:作为人工智能专业大模型方向的顾问,我在技术层面有深厚积累。在模型架构理解上,深入掌握 Transformer 架构及其在大语言模型中的应用,熟悉诸如 GPT 系列、BERT 等经典大模型的原理与优化策略。 编程实操中,熟练运用 Python 进行模型开发与训练,灵活驾驭 PyT
项目:参与华为大语言模型训练、对齐等任务。曾参与公司内部的智能写作大模型研发项目。负责数据预处理模块,从海量文本中筛选、清洗出高质量语料,构建了超百万条的训练数据集。还参与模型的微调工作,针对特定领域的写作风格进行优化,最终实现模型生成内容的流畅度和专业性大幅提升,该模型已成功应用于智
案例: 语言模型CLIP多模态模型微调