编程语⾔:熟练使⽤python以及C++语⾔
数据结构与算法:熟练掌握常⻅数据结构和算法,能够解决中等难度算法问题,⼒扣刷题300+机器学习与深度学习:熟悉常⽤机器学习和深度学习框架,如pytorch
⼤模型的架构:对transformer的架构有⼀定的了解
数据库管理:熟练使⽤SQL数据库,进⾏过ETL模型的搭建
数学与统计学基础:掌握线性代数,概率论和数理统计,能够应⽤于数据分析和机器学习
项⽬1:基于半监督的细粒度⻝品图像分类系统
项⽬⽬标:构建⼯业级⻝品识别引擎,实现包含11类别的Food-11数据集精准分类,解决跨⽂化⻝品形态差异带来的识别难题。
优化亮点:1.⾃设计⼀个卷积神经⽹络模型结构,在Food-11数据集实现Top-1准确率86.2%;2.设计多阶段迁移学习⽅案,结合半监督训练,利⽤少量标注数据和⼤量未标注数据,使模型在4千张图像规模下的训练时间缩短;3.通过混合数据增强策略使跨⽂化⻝品分类错误率下降14.6%。
项⽬2:基于时序特征融合的新冠感染⼈数预测模型
项⽬⽬标:构建端到端回归预测系统,通过前两⽇新冠阳性病例数(t-2, t-1)及当⽇社会特征向量,预测第三⽇(t)感染⼈数,实现传播趋势的量化评估。
优化亮点:1.通过相关系数分析与特征选择将输⼊维度从93维降⾄30维,训练效率提升42%;2.采⽤L2正则化防⽌模型过拟合,在交叉验证中取得平均MSE=18.7的稳定表现;3.提出动态学习率策略,AdamW优化器替代SGD,相⽐固定学习率训练,模型收敛速度提升,验证集预测误差降低19%。
项⽬1:基于半监督的细粒度⻝品图像分类系统 项⽬⽬标:构建⼯业级⻝品识别引擎,实现包含11类别的Food-11数据集精准分类,解决跨⽂化⻝品形态差异带来的识别难题。 优化亮点:1.⾃设计⼀个卷积神经⽹络模型结构,在Food-11数据集实现Top-1准确率86.2%;2.设计多
探究恋爱次数与颜值,内涵,财富之间的关系;看其与各个因素之间是否存在某种线性的相关性。根据给到的数据,发现恋爱次数与颜值之间的线性相关性最高。