Wan-Move – 阿里联合清华等开源的运动可控视频生成框架,满足高质量视频创作需求Wan-Move是由阿里巴巴通义实验室等多机构联合开源的运动可控视频生成框架。该框架以独特的潜在轨迹引导技术为基础,成功实现了视频运动的高质量控制。该框架能够生成长达5秒、分辨率为480p的视频,并且...发现资讯2周前0860
Gemini TTS – 谷歌推出的AI文本转语音模型,支持单人或多人语音合成Gemini TTS 是谷歌推出的先进AI文字转语音技术,最新版本为 Gemini 2.5 Flash 和 Pro 模型。新版本增强了模型的表现力、节奏控制和多说话人一致性,旨在满足内容创作者、开发者...发现资讯2周前01190
LuxReal – 群核科技推出的AI 3D视频创作平台,快速生成高质量群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal,基于图像、3D 模型等多模态输入,快速生成主体一致、画面可控的视频内容,适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...发现资讯2周前01040
Seedance 1.0 lite – 火山引擎推出的视频生成模型,支持文生视频和图生视频Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨率的视频。支持360度环绕、航拍、变焦...发现资讯2周前01250
Infography – 自动将文本内容转化可视化图表生成平台Infography是一款由专业团队开发的AI工具,能将复杂的数据或文本内容转化为直观的视觉呈现,主要面向市场营销人员、产品经理、教育工作者以及任何需要将复杂信息以视觉化方式呈现的用户。Infogra...发现资讯2周前01060
奇域AI一创作交流平台奇域AI是什么 奇域AI是一个专注于中式审美的国风AI绘画创作平台,该产品旨在利用人工智能技术生成符合东方美学的绘画作品,满足艺术爱好者和专业艺术设计师的需求。旨在为艺术家和创作者提供一个能够轻松创作...发现资讯2周前0800
SSVAE – 智谱AI开源的频谱结构化变分自编码器,提供快速生成视频的能力ssvae(spectral-structured vae)是智谱ai研发的一种面向视频生成任务优化的新型变分自编码器。SSVAE 在相同生成质量下,收敛速度提升3倍,仅用1.3B参数量就超越了4B参...发现资讯2周前0980
RealVideo -智谱AI开源的实时流式视频生成系统,增强交互的自然性和沉浸感RealVideo是一种流行的视频压缩和传输格式,用于在互联网上传输视频内容。核心功能覆盖文本输入交互、AI语音响应、唇形同步、WebSocket实时双向通信等。该技术能够根据网络带宽和用户设备性能的...发现资讯2周前0950
Kaleido – 智谱AI开源的多主体视频生成框架,支持多张参考图像和文本提示进行视频生成智谱开源团队联合合肥工业大学和清华大学提出了一种名为Kaleido的开源多主体参考视频生成框架,旨在解决现有开源S2V模型在多主体场景中保持一致性及背景解耦的难题。利用深度学习和计算机视觉技术,能够生...发现资讯2周前0900
DeepSearchQA – 谷歌开源的AI研究Agent测试基准,精准衡量智能体在真实研究场景中的综合能力谷歌开源全新网络研究智能体基准DeepSearchQA,成为AI界对抗GPT-5.2的爆款工具。涵盖17个领域的900项人工设计的因果链任务,其中每个步骤都依赖于先前的分析。首次引入过程性评估指标,通...发现资讯3周前0990