1、拥有8年测试经验,涵盖功能测试、性能测试、AI业务测试等领域。
2、精通测试全流程管理,擅长跨部门协同作战。
3、精通测试流程优化,熟练使用TAPD、禅道等测试管理工具提升团队效率。
4、擅长测试团队管理和项目统筹,能有效把控项目风险和质量,推动团队效率提升30%,线上严重故障率保持为0。
5、具备完整的测试体系建设经验,从需求评审到发布上线的全流程质量管理。
6、在测试环境搭建、测试工具开发和性能测试方面有丰富的经验。
7、精通多种测试工具和Java、python编程语言,具备强大的测试开发能力。
8、精通JMeter二次开发(封装10+通用组件)及自动化框架搭建(springBoot)。
9、参与搭建并维护测试环境K8S集群,集成Jenkins,部署测试开发工具6个、后端业务服务30多个。
10、掌握AI智能体的效果、功能及性能测试,具备丰富的结构化数据、多模态效果评估经验。
11、熟练应用ES、Spark、Redis、Kafka等技术进行AI推荐算法的精准测试。
12、拥有超过10场部门级测试培训经验,能够有效提升团队测试能力。
一、APP内容运营平台
该项目用于提升土巴兔 APP 的整体内容质量,对优质内容进行个性化推荐,提升内容消费体验,增加 app 的活跃和留存。通过基于标签的用户协同过滤、机器学习等算法,按照 CTR 进行推荐排序,对生产内容进行个性化推荐、广告精准推荐,根据用户浏览内容偏好、内容生产时间、用户互动率等条件帮助用户持续地获取最新的订阅内容。
主要职责:
1.负责app所有内容信息流的的 AI 算法测试,版本维护;
2.编写造数脚本批量往ES生成百万数据,测试内容推荐规则、推荐算法是否符合要求;
3.使用 spark 基于标签+用户协同过滤算法进行生产环境数据采集(脱敏)、打标签,生成测试集,进行内容推荐模型测试;
4.测试ES数据仓库内容是否正确标注、机器自学习标注效果是否达标,是否满足数据一致性要求;
5.个性化推荐算法性能测试,在高并发下Kafka限流削峰效果、接口响应速度、TPS值、99值,保证 api 网关服务 在高消费下的服务稳定性;
6.通过Redis工具测试redis 数据队列消费情况、内容热度值情况,测试内容推荐精准度及CTR热度值排序正确;
7.编写内容推荐 AI 算法测试技术、测试方法与业务实现文档,并组织测试组内培训,供组内人员借鉴经验;
二、AI对话助手:
该项目是一个通用的对话式AI智能体,底层为Kimi大模型,在kimi模型上进行了微调,主要功能:一对一对话答疑、智能回复、智
能分析、文档解析、ppt生成、图文对话等功能。
主要职责:
1、执行高维特征提取的数据采样与标注,覆盖边缘场景,确保测试样本多样性(如用户意图复杂性、多模态输入组合)。
2、主导制定数据采集规范与鲁棒性测试策略,设计对抗样本注入机制(如语义扰动、噪声干扰),提升模型泛化能力。
3、 执行多维度模型评测:对话连贯性(上下文推理准确率)、意图识别率、回答相关性,构建量化打分矩阵。
4、 建立统一竞品评估框架,通过自动化脚本拉取竞品API输出,主导横向对比分析,输出模型能力短板报告。
5、 压测接口吞吐量(TPS)、响应延迟(P99<3s),监控CPU负载,统计tokens处理效率(千token/分钟成本)。
6、主导研发AI自动评分系统(技术架构):
标准化测试集管理(Git版本化)→ 多模型API并行调用(异步IO) → 结果向量化存储。
集成权重因子+余弦相似度计算 → 权重动态打分引擎(精准度60%+时效性40%)→ 生成竞品分析图。
AI视觉识别审核系统:
该项目是一个使用AI审核图片内容正确性的平台,底层模型为自研,使用OCR识别手段,识别图片中所有的标志和文字的大小、位置、文字规范是否符合要求,开发采用训练集对模型进行训练和参数调整,使用验证集验证图片识别效果,测试对模型进行系统测试。
主要职责:
1、执行海量场景数据采集(室内/强光/遮挡等),预标注关键实体(文字/Logo位置框)。
2、设计场景腐蚀因子库(旋转/缩放/雾化),构建模型鲁棒性评估矩阵(如45°旋转时召回率>92%)。
3、计算精确率(Precision)与召回率(Recall),定位AI识别结果与实际图片标注结果的误差是否<=20%。
4、测试模型增强技术在:旋转、缩放、翻转等不同场景下的准确率、泛化能力,提高模型的鲁棒性。
5、编写回答数据自动标注脚本,自动标注提交的测试数据集的实际结果,以方便测试人员对结果进行计算和统计。
对优质内容进行个性化推荐,提升内容消费体验,增加 app 的活跃和留存。通过基于标签的用户协同过滤、机器学习等算法,按照 CTR 进行推荐排序,对生产内容进行个性化推荐、广告精准推荐,根据用户浏览内容偏好、内容生产时间、用户互动率等条件帮助用户持续地获取最新的订阅内容。
AI对话助手: 该项目是一个通用的对话式AI智能体,底层大模型支持hunyuan\deepseek,主要功能:一对一对话答疑、智能回复、智能分析、文档解析、ppt生成、图文对话等功能。 AI视觉识别审核系统: 该项目是一个使用AI审核图片内容正确性的平台,使用OCR