Wan-Move – 阿里联合清华等开源的运动可控视频生成框架,满足高质量视频创作需求Wan-Move是由阿里巴巴通义实验室等多机构联合开源的运动可控视频生成框架。该框架以独特的潜在轨迹引导技术为基础,成功实现了视频运动的高质量控制。该框架能够生成长达5秒、分辨率为480p的视频,并且...发现资讯3个月前05780
Vidyard – AI营销视频生成平台,快速生成个性化视频与精准推送Vidyard是一款基于云的视频制作和管理平台,提供丰富的视频编辑和分析工具。内置了专为营销团队设计的转录分析工具。其核心价值在于将转写功能与观众行为分析结合,支持多语言识别,能自动生成可编辑的字幕轨...发现资讯3个月前05770
LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型,比同级自回归模型快 2.1 倍蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开技术报告。LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,打破...发现资讯3个月前05760
JoySafety – 京东开源的大模型安全框架,支持通过 API 动态调整安全策略京东正式推出了其开源的大模型安全框架 ——JoySafety。框架支持每日超过亿次的调用,拥有高达95% 以上的攻击拦截率,确保用户在享受高效服务的同时,数据安全和用户隐私也得到了有力保障。 JoyS...发现资讯6个月前05740
GPT-5.2-Codex – OpenAI推出的智能体编程模型,能高效生成高质量的代码gpt-5.2-codex 是 openai 推出的面向智能体编程任务的专业级模型,聚焦于高复杂度软件工程实践与防御型网络安全场景。其核心突破在于引入了“上下文压缩”技术,让其在处理代码重构、迁移等长...发现资讯3个月前05730
ViMax – 港大开源的多智能体视频生成框架,导演、编剧、制片人和视频生成器ViMax 是一个多智能体视频生成框架,支持自动化多镜头视频生成,并确保角色与场景的一致性。该框架集导演、编剧、制片人和视频生成器功能于一体,支持多种模式生成分钟级长视频,保持人物与场景一致性。ViM...资讯4个月前05730
Mulan – AI视频创作平台,实现视频批量生成,小白也能轻松上手在这个AI视频生成技术日新月异的时代,一个国产新平台——Mulan AI,以其独特的差异化突围。Mulan AI不仅仅是一个简单的文生视频模型,更是一个智能聚合的神奇工具,它彻底打破了传统的工作流程...发现资讯3个月前05710
Qwen3-Omni-Flash – 阿里通义推出的全模态大模型,支持119种文本语言、19种语音识别语言和10种语音合成语言qwen3-omni-flash(qwen3-omni-flash-2025-12-01)是阿里巴巴qwen团队全新发布的全模态大语言模型。可实现文本、图像、音频和视频的无缝输入与同步输出。模型支持1...发现资讯3个月前05710
Agentation – AI编程协作工具,支持自动捕获元素,可视化反馈问题转为代码Agentation是一款开源的 ai 编程协同工具,专为提升开发者与 ai 编程助手之间的协作效率而设计,它通过允许用户在网页界面中直接进行可视化标注,将直观的问题反馈自动转化为机器可解析的结构化信...发现资讯1个月前05700
SceneGen – 上海交大推出的3D场景生成框架,单图到3D场景一步生成上海交通大学的研究团队推出了一种名为 SceneGen 的新颖框架,在这一领域取得了突破性进展。它以一张场景图像和图中物体的分割掩码作为输入,能够在一次前向传播中,同时生成场景内多个3D资产的几何、纹...发现资讯5个月前05690