案例ID:231075
技术顾问:Bacchus - 1年经验 - 中电科技
联系沟通
项目名称:GPT-2 (124M)+FP8
所属行业:人工智能 - 其他
独立完成,复现GPT-2 (124M参数)+FP8混合精度预训练 ● 基于Transformer架构 ● 训练数据是HuggingFaceFW/fineweb-edu中的sample-10BT ● GPU租用的是智星云,GeForce RTX 4090 (24G),系统Ubuntu,单机4卡 ● 相关版本如下:CUDA Version: 12.4, Driver Version: 550.127.05, torch 2.5.0, triton 3.1.0
其他人才的相似案例推荐
python,目标检测,图片分类,目标跟踪,系统架构,多进程
本人学生,暂无相关产品经历,但本人有充足的时间和精力,希望获
本人学生,希望获得机会能够完成项目,但本人有充足的时间和经历
一个融合了自然语言处理(AI 回复)与语音合成(Edge T
选择.NET 8 WPF作为开发框架,利用其丰富的UI控件库
体验地址:https://wisdom-hub.51emai
1、刀具识别项目 主要涉及 python 数据分析 模型训
项目经历(案例一) 项目时间:2013-5到2013-10
对公司传统的打印机、复印机、扫描仪、伟真机设备进行全新的整合
没谱儿AGI是使用AI生成泛娱直播音频的应用,用户可以在没谱
- 在 iOS 设备上进行高效的物体检测 - FP16 量
use AI是一款创新的AI工具,通过聊天的方式,将文件、链
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送