熟悉TensorFlow和PyTorch等主流深度学习框架,熟悉python语言;熟悉Linux操作系统
了解RAG(检索增强生成)技术原理及应用流程 ,熟悉主流Embedding模型
熟悉大模型部署与推理加速工具,如Ollama、SGLang和vLLM ;熟悉大模型微调,SFT、LoRA、QLoRA微调技
术;熟悉大模型应用框架,LangChain、LlamaIndex
个人知识库助手项目
2025.03-2025.05
• 项目描述:利用大型语言模型的强大处理能力,结合用户的实际需求,打造一个能够理解自然语言查询并提供
精确答案的智能助手。
• 主要工作:针对四种大模型 API 实现了底层封装,基于 Langchain 搭建了可切换模型的检索问答链,并实现 API
以及 Gradio 部署的个人轻量大模型应用。