基本信息

案例ID:226334

技术顾问:一休哥 - 1年经验 - 华为

联系沟通

微信扫码,建群沟通

项目名称:CLIP多模态模型微调

所属行业:人工智能 - 其他

->查看更多案例

案例介绍

我参与的多模态大模型训练项目,聚焦于融合图像与文本信息的智能助手开发。
在预训练阶段,为实现跨模态特征对齐,我们采集了大规模的图像 - 文本对数据。图像涵盖各类场景、物体,文本则是对图像的详细描述、相关问题等。利用诸如 CLIP 等基础模型作为骨干,去除部分模块后,将图像编码器(vision encoder)与文本编码器(text encoder)连接。使用图像和文本对进行训练,让模型初步理解不同模态信息的关联,学习跨模态的基础表征。

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服