案例ID:241877
技术顾问:sunshine - 2年经验 - 杭州深度求索人工智能基础技术研究有限公司
联系沟通
项目名称:VortexInfer
所属行业:人工智能 - 其他
面向企业客户的LLM推理部署需求,基于vLLM + TensorRT-LLM构建高吞吐、低延迟的推理系统。集成Continuous Batching、PagedAttention、FP8 KV Cache量化。自研请求调度算法,支持模型热加载与A/B测试框架。
其他人才的相似案例推荐
本项目聚焦老年人情感陪伴需求,基于百度数字人打造拟真对话形象
该作品是一个面向电商美工和内容运营场景的 AIGC 自动化工
在教育行业数字化转型的背景下,SaaS生态下的企业级智能体管
本作品由商铺简易库存管理系统与中小型企业简易展示网站两套项目
本案例展示 AI 工具链与接口联调排障能力:针对 AI Ag
电商多平台订单数据自动化清洗与日报生成系统 【项目
AgentRoute Studio · 个人独立开发的目标驱
AutoClip是一个基于AI的智能视频切片处理系统,能够自
213122222233331111111111111111
444444444444444444444444444444
这是一个针对 **Boss 直聘** 的自动化工具,通过 *
一、系统概述 ### 1.1 产品简介 数衡鼎量
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送