ID:410736

伊汐璇 有团队

高级大模型研发工程师

  • 公司信息:
  • 华为
  • 工作经验:
  • 12年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 可工作日驻场(离职原因)
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 深圳
  • 全区

技术能力

(所有消息、经历均由平台认证过,真实无虚假)
作为一名大模型领域的软件开发者,我具备从底层架构搭建到上层应用落地的全链路技术能力,能够独立完成大模型的设计、训练、优化与部署全流程工作,助力人工智能技术在各行业的深度赋能。

在大模型底层架构设计层面,我精通Transformer核心架构原理,能够根据实际业务需求进行模型结构的定制化调整。熟练掌握自注意力机制、多头注意力、位置编码等关键技术的优化策略,可针对不同任务场景(如自然语言处理、计算机视觉、多模态交互)设计适配性更强的网络结构。同时,深入理解预训练与微调的技术逻辑,能够搭建高效的模型训练范式,保障大模型在不同任务下的性能表现。

在模型训练与优化环节,我具备扎实的机器学习与深度学习理论基础,熟练运用PyTorch、TensorFlow等主流深度学习框架开展模型训练工作。掌握分布式训练技术,能够基于GPU/TPU集群构建高效的训练环境,解决大模型训练过程中面临的算力瓶颈问题。针对大模型训练中的过拟合、梯度消失、收敛速度慢等核心问题,可通过数据增强、正则化、学习率调度等策略进行优化,提升模型的泛化能力与训练效率。此外,精通模型压缩技术,包括量化、剪枝、知识蒸馏等方法,能够在保证模型性能的前提下,大幅降低模型的推理时延与内存占用,满足实际应用场景的部署需求。

在大模型应用落地方面,我能够结合具体行业需求,将大模型技术与实际业务场景深度融合。在自然语言处理领域,可开发智能问答、文本摘要、机器翻译、情感分析等应用;在多模态领域,能够实现图文生成、视频理解、跨模态检索等功能。同时,具备大模型部署与运维能力,熟练使用Docker、Kubernetes等容器化技术进行模型封装与部署,搭建高可用的推理服务。针对大模型应用过程中的安全性与可控性问题,能够通过对齐技术、内容审核机制等手段,保障模型输出的合规性与可靠性。

此外,我始终保持对大模型领域前沿技术的跟踪与学习,密切关注GPT系列、LLaMA、文心一言等主流大模型的技术迭代方向,不断将新技术、新方法融入到实际开发工作中。具备优秀的问题解决能力与团队协作精神,能够在复杂的技术项目中承担核心开发任务,推动大模型技术从理论走向实践,为人工智能产业的发展提供强有力的技术支撑。

项目经验

(所有消息、经历均由平台认证过,真实无虚假)
作为深耕大模型领域的软件开发者,我曾深度参与鸿蒙生态下大型AI大模型等多个核心项目的全流程开发,积累了从底层架构设计到产业级应用落地的实战经验,具备驾驭复杂大模型研发任务的技术实力。

在鸿蒙生态AI大模型研发项目中,我担任核心算法工程师,牵头负责模型底层架构的定制化设计与优化。基于鸿蒙系统的分布式架构特性,我对Transformer基础架构进行针对性改造,重构多头注意力机制的计算逻辑,使其更适配鸿蒙终端的异构算力调度体系,有效提升了模型在端侧设备的推理效率。在预训练阶段,我主导搭建了千亿级tokens的多模态语料库,涵盖文本、图像、语音等多类型数据,并设计分层预训练策略,解决了跨模态数据对齐难、训练收敛慢的问题。同时,基于鸿蒙的分布式训练框架,我实现了多节点GPU集群的协同训练,将训练周期缩短30%,大幅降低了算力成本。

针对大模型在鸿蒙终端部署的轻量化需求,我牵头推进模型压缩与适配工作。通过量化、剪枝与知识蒸馏相结合的技术方案,在保证模型性能损失不超过5%的前提下,将模型体积压缩至原大小的1/8,成功实现大模型在鸿蒙手机、平板等终端设备的本地化部署。此外,我还负责模型与鸿蒙系统服务的集成开发,构建了端云协同的推理服务架构,让终端设备可按需调用云端大模型能力,兼顾了端侧的响应速度与云端的算力优势。

除鸿蒙生态大模型项目外,我还参与过金融领域智能风控大模型、教育领域个性化辅导大模型的研发工作。在金融大模型项目中,我设计了面向金融文本的微调策略,提升模型对行业术语、风控规则的理解能力,助力客户实现信贷风险的智能评估;在教育大模型项目中,我优化了模型的交互式问答逻辑,打造出更贴合师生需求的智能答疑系统。

凭借丰富的项目实战经验,我能够精准把握不同领域大模型的研发痛点,结合底层技术创新与上层应用需求,推动大模型技术从实验室走向产业落地,为各行业的智能化升级提供坚实的技术支撑。

团队情况

  • 整包服务: 微信公众号开发   微信小程序开发   PC网站开发   H5网站开发   App开发   WebApp开发   文档原型图   UI设计   游戏类开发   智能硬件开发   运维类开发   DBA开发   其他开发   
角色 职位
负责人 高级大模型研发工程师
队员 产品经理
队员 UI设计师
队员 iOS工程师
队员 安卓工程师
队员 前端工程师
队员 后端工程师

案例展示

  • 鸿蒙

    鸿蒙

    作为深耕大模型领域的软件开发者,我曾深度参与鸿蒙生态下大型AI大模型等多个核心项目的全流程开发,积累了从底层架构设计到产业级应用落地的实战经验,具备驾驭复杂大模型研发任务的技术实力。 在鸿蒙生态AI大模型研发项目中,我担任核心算法工程师,牵头负责模型底层架构的定制化设计与

  • 昇腾

    昇腾

    昇腾大模型并非单一模型,而是依托昇腾AI软硬件平台构建的全场景、高适配的生态型大模型体系,核心围绕高效算力支撑、全模态处理、行业定制化等能力,适配医疗、交通、金融等多领域,以下是其详细功能介绍: 1. 极致算力优化与高效训推功能 :该功能是核心优势,依托昇腾芯片异构计算架

  • 昇腾

    昇腾

    昇腾大模型并非单一模型,而是依托昇腾AI软硬件平台构建的全场景、高适配的生态型大模型体系,核心围绕高效算力支撑、全模态处理、行业定制化等能力,适配医疗、交通、金融等多领域,以下是其详细功能介绍: 1. 极致算力优化与高效训推功能 :该功能是核心优势,依托昇腾芯片异构计算架

查看案例列表(含更多 0 个案例)

评价列表

该用户已被预约 2 次,预约方未评价,系统默认 5星 好评。

信用行为

  • 接单
    2
  • 评价
    0
  • 收藏
    1
  • 五星率
    100%
  • 退款
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服