当前核心能力包括:
AI 问答助手
支持用户输入问题,与通义千问模型进行多轮对话;系统保存会话 ID 和历史消息,便于延续上下文和查看历史记录。
AI 生图工作台
支持文生图、参考图生图,并提供尺寸、风格、负面提示词等参数配置;生成结果可预览、打开原图、下载或保存至 OSS。
图生动态视频能力
支持上传首帧、尾帧或模板图,通过提示词驱动静态图生成动态视频,适合短视频素材、视觉创意、营销内容初稿等场景。
视频生成能力
后端已提供文生视频接口,支持分镜、背景、角色设定、镜头语言、时间段、视角等参数,具备连续分镜生成和背景记忆能力。
知识库管理能力
代码中已包含知识库、目录、文件、文件切片、标签等模型和接口,支持创建知识库、上传文件、创建文本文件、读取 OSS 文件内容,为后续 RAG 问答提供基础。
用户登录与鉴权
前端有登录页,后端提供用户登录接口;请求中会携带 Token 和登录名,用于用户身份识别与数据归属。