可灵O1 – 可灵AI推出全球首个统一多模态视频生成模型,轻松生成和编辑视频内容。全球首个大一统的多模态视频、图片创作工具“可灵O1”正式上线。模型通过创新的多模态视觉语言(MVL)架构,实现视频生成、编辑与理解的无缝融合。可灵O1基于全新的视频和图像模型,以自然语言作为语义骨架...发现资讯4周前02020
PixVerse V5.5 – 爱诗科技推出的视频生成大模型,支持音频和视频同步生成PixVerse V5.5是爱诗科技推出的最新一代AI视频生成大模型,模型基于自研的多模态视觉语言(MVL)架构,采用Diffusion与Transformer混合设计,支持音画同步生成,简化从构思到...发现资讯4周前01580
twitch官网入口,twitc登录教程twitch是一款全球超火的游戏直播、教学、玩法攻略流媒体平台,它是美国最大的一家游戏视频直播网站,内容几乎涵盖了市面上所有游戏种类。对跨境电商卖家而言,Twitch是很好的营销引流平台。无论是游戏还...发现资讯4周前01730
Alpamayo-R1 – 英伟达发布首款推理版视觉-语言-动作模型随着芯片成为AI发展的核心,英伟达发布了新的开源软件Alpamayo-R1,旨在利用人工智能(AI)中的一些最新“推理”技术加快自动驾驶汽车的开发。模型的核心创新包括:构建因果链(CoC)数据集,通过...发现资讯4周前01670
NEO – 商汤联合南洋理工开源的全新多模态模型架构,训练仅需1/10数据量,达到顶尖的视觉感知能力商汤科技联合南洋理工大学S-Lab发布并开源全新多模态模型架构NEO。该架构号称是行业首个实现深层次融合的原生视觉语言模型,通过原生图块嵌入、三维旋转位置编码和多头注意力机制创新,实现视觉与语言在底层...发现资讯4周前01420
ViMax – 港大开源的多智能体视频生成框架,导演、编剧、制片人和视频生成器ViMax 是一个多智能体视频生成框架,支持自动化多镜头视频生成,并确保角色与场景的一致性。该框架集导演、编剧、制片人和视频生成器功能于一体,支持多种模式生成分钟级长视频,保持人物与场景一致性。ViM...资讯1个月前01490
FLUX.2 – Black Forest Labs开源的AI图像生成与编辑模型,支持同时参考多达10张图片视觉智能实验室 Black Forest Labs 推出了其新一代图像生成模型 FLUX.2,该模型专为实际创作工作流程设计。该模型在细节生成、风格一致性、文本渲染和复杂指令遵循方面均有显著提升。模...资讯1个月前01680
零一万物联合开源中国发布–Open AgentKit 平台,支持高效架构设计和协作,快速搭建复杂的Agent系统。零一万物与开源中国联合发布的Open AgentKit(OAK)平台,一款专为开发者打造的AI Agent一站式开发开源解决方案。该平台支持对接多种开源大模型,旨在与全球开发者共同打造一款开放、通用的...发现资讯2个月前03690
全球 首个AI原生社交平台 –焦圈儿,分支追问 与 “一键复刻” 两大核心功能全球首个AI原生社交平台——“焦圈儿” 正式亮相。通过其首创的 “分支追问” 与 “一键复刻” 两大核心功能,首次将“群体智慧”引入人机交互过程,标志着AI应用从“工具能力竞赛”迈入“使用效率革命”的...发现资讯2个月前03140
AI Research Foundations – 谷歌与UCL联合推出的AI研究基础课程,手把手教你如何构建和微调技巧。谷歌与伦敦大学学院(UCL)合作推出的“AI研究基础”(AI Research Foundations)课程是一套免费的、面向大学水平的学习资源,旨在通过实用的、专门构建的内容,赋予学习者进行高影响力...发现资讯2个月前02030