Infography – 自动将文本内容转化可视化图表生成平台Infography是一款由专业团队开发的AI工具,能将复杂的数据或文本内容转化为直观的视觉呈现,主要面向市场营销人员、产品经理、教育工作者以及任何需要将复杂信息以视觉化方式呈现的用户。Infogra...发现资讯2周前01060
RealVideo -智谱AI开源的实时流式视频生成系统,增强交互的自然性和沉浸感RealVideo是一种流行的视频压缩和传输格式,用于在互联网上传输视频内容。核心功能覆盖文本输入交互、AI语音响应、唇形同步、WebSocket实时双向通信等。该技术能够根据网络带宽和用户设备性能的...发现资讯2周前0950
Kaleido – 智谱AI开源的多主体视频生成框架,支持多张参考图像和文本提示进行视频生成智谱开源团队联合合肥工业大学和清华大学提出了一种名为Kaleido的开源多主体参考视频生成框架,旨在解决现有开源S2V模型在多主体场景中保持一致性及背景解耦的难题。利用深度学习和计算机视觉技术,能够生...发现资讯2周前0900
SSVAE – 智谱AI开源的频谱结构化变分自编码器,提供快速生成视频的能力ssvae(spectral-structured vae)是智谱ai研发的一种面向视频生成任务优化的新型变分自编码器。SSVAE 在相同生成质量下,收敛速度提升3倍,仅用1.3B参数量就超越了4B参...发现资讯2周前0980
奇域AI一创作交流平台奇域AI是什么 奇域AI是一个专注于中式审美的国风AI绘画创作平台,该产品旨在利用人工智能技术生成符合东方美学的绘画作品,满足艺术爱好者和专业艺术设计师的需求。旨在为艺术家和创作者提供一个能够轻松创作...发现资讯2周前0800
Gemini TTS – 谷歌推出的AI文本转语音模型,支持单人或多人语音合成Gemini TTS 是谷歌推出的先进AI文字转语音技术,最新版本为 Gemini 2.5 Flash 和 Pro 模型。新版本增强了模型的表现力、节奏控制和多说话人一致性,旨在满足内容创作者、开发者...发现资讯2周前01190
Wan-Move – 阿里联合清华等开源的运动可控视频生成框架,满足高质量视频创作需求Wan-Move是由阿里巴巴通义实验室等多机构联合开源的运动可控视频生成框架。该框架以独特的潜在轨迹引导技术为基础,成功实现了视频运动的高质量控制。该框架能够生成长达5秒、分辨率为480p的视频,并且...发现资讯2周前0860
商汤开源的首个实时视频生成推理框架–LightX2V ,支持多种视频生成任务商汤开源了行业首个能实现实时视频生成的推理框架LightX2V,支持低资源部署,通过DiT蒸馏加速、轻量化 VAE、稀疏注意力等优化,实现低成本、强实时的视频生成。框架支持多种硬件部署,提供 Grad...发现资讯2周前0670
Nemotron 3 – 英伟达推出的最新开源AI模型系列,提升推理的准确性和适应性。英伟达发布了 Nemotron 3 系列开放模型,共三种规模,分别为 Nano、Super 和 Ultra,支持开发者大规模构建和部署可靠的多智能体系统。Nemotron 3 Nano 拥有 300 ...发现资讯2周前0860
LensGo AI – AI内容创作平台,无需专业剪辑技能,满足多样化创作需求随着科技的飞速发展,越来越多的技术工具涌现出来,LensGo凭借其强大的功能和简洁的操作界面,受到了广大用户的青睐。用户可以轻松实现图像的编辑、优化、分享等操作,提升工作效率和创作体验。允许用户通过简...发现资讯2周前01150