ID:407034

Always 有团队

高级高性能计算工程师

  • 公司信息:
  • 北京大学长沙计算与数字经济研究院
  • 工作经验:
  • 6年
  • 兼职日薪:
  • 2000元/8小时
  • 兼职时间:
  • 可工作日远程
  • 可工作日驻场(离职原因)
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 长沙
  • 全区

技术能力

+ 熟悉 训练框架pytorch
+ 熟悉 机器学习中间表示 ONNX
+ 熟悉 图优化框架 onnx/optimizer,onnx-simplifier
+ 熟悉 量化框架 PPQ
+ 熟悉 推理框架 TNN,Tengine,了解OpenVino,TensorRT,MNN,ONNXRuntime,CoreML,Tf-Lite
+ 了解 AI编译器 TVM
+ 熟悉 ppl.cv,了解 OpenCV
+ 熟悉算法落地的全流程

项目经验

### 算法工程化框架
+ 描述:解决算法落地的低效率、低性能、稳定性问题
+ 业绩:算法中台所有算法(多种类型、多个平台)基于该框架落地与优化
+ 职责:软件架构搭建与核心开发
+ 从0到1的架构设计
+ 接口设计 - 算法接口、推理数据Blob、图像数据Mat
+ 多端推理模块 - 适配TNN/TensorRT/MNN/ONNXRuntime/TVM/(OpenVino/TF-lite/Core-ML)
+ 异构设备模块 - 支持CPU/ARM/X86/CUDA/OpenCL/OpenGL
+ 高性能算子 - NEON CV算子
+ 算法落地 - 数十个单点算法、组合算法的落地与优化,从工程角度提出算法优化方向
+ 工具集 - 性能测量工具,ONNX模型修改工具

### onnx-simplifer
+ 描述:解决算法落地的低效率、低性能、稳定性问题
+ 业绩:算法中台所有算法(多种类型、多个平台)基于该框架落地与优化
+ 职责:核心开发
+ 从0到1的架构设计
+ 接口设计 - 算法接口、推理数据Blob、图像数据Mat
+ 多端推理模块 - 适配TNN/TensorRT/MNN/ONNXRuntime/TVM/(OpenVino/TF-lite/Core-ML)
+ 异构设备模块 - 支持CPU/ARM/X86/CUDA/OpenCL/OpenGL
+ 高性能算子 - NEON CV算子
+ 算法落地 - 数十个单点算法、组合算法的落地与优化,从工程角度提出算法优化方向
+ 工具集 - 性能测量工具,ONNX模型修改工具

### 推理框架
+ 描述:满足机器学习算法在Android TEE以及嵌入式设备下的落地需求
+ 业绩:上线指纹算法SDK以及大健康IOT项目,替换过往的算子落地模式
+ 职责:核心开发。
+ 架构设计(参考TNN、Tengien、NNLib)
+ 转化器 - 设计模型文件格式、ONNX模型文件转换
+ 解释器 - 设计模型中间表示,Parse过程
+ 执行器 - 图优化、算子绑定、内存预分配
+ 高性能算子 - NEON、OpenCL


### 内存池
+ 描述:替换旧的低效率内存池。开发了一款高效率的内存分配与释放,较高内存利用率,易于调试(内存利用率、泄露、踩踏),满足多线程的高性能内存池
+ 业绩:嵌入指纹算法SDK,时间性能提升6.7%;嵌入大健康IOT项目, 节省内存空间10%~25%,解决数十个动态内存相关bug
+ 职责:独自开发

团队情况

  • 整包服务: 智能硬件开发   其他开发   
角色 职位
负责人 高级高性能计算工程师
队员 产品经理
队员 UI设计师
队员 iOS工程师
队员 安卓工程师
队员 前端工程师
队员 后端工程师

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服