【岗位职责 (Your Mission)】
作为AI核心团队的早期成员,您将主导或深度参与以下工作:
智能知识库构建:
负责设计并实现一套自动化流程,将非结构化的备考资料(PDF、Word教材、讲义)解析并转化为结构化的知识库。
应用NLP和LLM技术,对文档进行章节划分、知识点原子化切分、关键信息抽取(定义、公式、考点等)。
主导知识图谱的构建,利用算法自动挖掘知识点之间的内在逻辑关系(如依赖、分类、对比关系)。
核心算法研发与实现:
设计并实现基于RAG(检索增强生成)架构的智能问答系统(AI私人导师),确保回答的专业性、准确性与可追溯性。
研发用户能力诊断模型,通过分析用户答题行为数据,精准评估其对知识点的掌握程度。
与后端工程师协作,开发智能题目推荐算法,为用户提供“举一反三”和“查漏补缺”的个性化练习。
模型工程化与迭代:
负责将算法模型封装成稳定、高效的API服务,并与后端业务系统进行集成。
建立模型监控与评估体系,持续追踪线上效果,并通过数据反馈进行快速迭代优化。
探索和实践模型量化、蒸馏等优化手段,平衡效果、成本与响应速度。
【任职要求 (Your Expertise)】
我们希望您具备以下硬核实力:
教育背景: 计算机、人工智能、软件工程、统计学等相关专业本科及以上学历。
NLP与大模型实战经验 (核心要求):
3年以上NLP相关算法研发与项目落地经验。
精通大语言模型(LLM)应用开发,有丰富的Prompt Engineering实战经验,熟悉思维链(CoT)、ReAct等高级Prompting技巧。
必须具备基于LLM API(如OpenAI/Claude/文心一言)开发复杂应用的实际经验,特别是RAG(检索增强生成)项目经验者优先。
熟悉常用的NLP技术和工具,如文本分类、信息抽取(NER)、文本向量化(Embedding),并了解其原理。
文档智能与知识图谱经验:
有处理非结构化文档(特别是PDF)的经验,熟悉PyMuPDF、pdfplumber、OCR等相关工具。
对知识图谱有深入理解,具备图谱构建、知识抽取、图存储(如Neo4j)等相关项目经验者优先。
扎实的编程与工程能力:
精通Python编程,熟悉Pandas、NumPy等数据科学库。
熟悉至少一种深度学习框架(PyTorch/TensorFlow)。
具备良好的软件工程素养,能编写出结构清晰、可维护、可测试的代码,并能将模型封装为RESTful API。
综合素质:
强大的问题分析与解决能力,能够独立负责一个完整的算法模块。
优秀的沟通协作能力,能与产品、前后端工程师等角色高效协同。
对新技术充满好奇心,具备快速学习和自我驱动的能力。