商汤开源的首个实时视频生成推理框架–LightX2V ,支持多种视频生成任务商汤开源了行业首个能实现实时视频生成的推理框架LightX2V,支持低资源部署,通过DiT蒸馏加速、轻量化 VAE、稀疏注意力等优化,实现低成本、强实时的视频生成。框架支持多种硬件部署,提供 Grad...发现资讯2个月前04180
UnityVideo – 港科大联合可灵快手开源的视频生成框架,实现视频内容的多模态解析港科大、港中文、清华大学与快手“可灵”团队联合发布UnityVideo,一个统一多模态与多任务的视频生成框架。框架通过动态噪声注入和模态自适应学习机制,实现 RGB 视频与辅助模态之间的双向学习,加速...发现资讯2个月前03990
Wan-Move – 阿里联合清华等开源的运动可控视频生成框架,满足高质量视频创作需求Wan-Move是由阿里巴巴通义实验室等多机构联合开源的运动可控视频生成框架。该框架以独特的潜在轨迹引导技术为基础,成功实现了视频运动的高质量控制。该框架能够生成长达5秒、分辨率为480p的视频,并且...发现资讯2个月前04170
Gemini TTS – 谷歌推出的AI文本转语音模型,支持单人或多人语音合成Gemini TTS 是谷歌推出的先进AI文字转语音技术,最新版本为 Gemini 2.5 Flash 和 Pro 模型。新版本增强了模型的表现力、节奏控制和多说话人一致性,旨在满足内容创作者、开发者...发现资讯2个月前04660
LuxReal – 群核科技推出的AI 3D视频创作平台,快速生成高质量群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal,基于图像、3D 模型等多模态输入,快速生成主体一致、画面可控的视频内容,适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...发现资讯2个月前04320
Seedance 1.0 lite – 火山引擎推出的视频生成模型,支持文生视频和图生视频Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨率的视频。支持360度环绕、航拍、变焦...发现资讯2个月前04740
Infography – 自动将文本内容转化可视化图表生成平台Infography是一款由专业团队开发的AI工具,能将复杂的数据或文本内容转化为直观的视觉呈现,主要面向市场营销人员、产品经理、教育工作者以及任何需要将复杂信息以视觉化方式呈现的用户。Infogra...发现资讯2个月前04520
奇域AI一创作交流平台奇域AI是什么 奇域AI是一个专注于中式审美的国风AI绘画创作平台,该产品旨在利用人工智能技术生成符合东方美学的绘画作品,满足艺术爱好者和专业艺术设计师的需求。旨在为艺术家和创作者提供一个能够轻松创作...发现资讯2个月前04310
SSVAE – 智谱AI开源的频谱结构化变分自编码器,提供快速生成视频的能力ssvae(spectral-structured vae)是智谱ai研发的一种面向视频生成任务优化的新型变分自编码器。SSVAE 在相同生成质量下,收敛速度提升3倍,仅用1.3B参数量就超越了4B参...发现资讯2个月前03950
RealVideo -智谱AI开源的实时流式视频生成系统,增强交互的自然性和沉浸感RealVideo是一种流行的视频压缩和传输格式,用于在互联网上传输视频内容。核心功能覆盖文本输入交互、AI语音响应、唇形同步、WebSocket实时双向通信等。该技术能够根据网络带宽和用户设备性能的...发现资讯2个月前03430