混元2.0 – 腾讯混元最新推出的智能语言模型,支持256K上下文窗口腾讯发布了自研大模型的最新版本 混元2.0(Tencent HY2.0)。包括Tencent HY 2.0 Think和Tencent HY 2.0 Instruct两个版本。该模型采用混合专家(Mo...发现资讯3个月前05890
Nemotron 3 – 英伟达推出的最新开源AI模型系列,提升推理的准确性和适应性。英伟达发布了 Nemotron 3 系列开放模型,共三种规模,分别为 Nano、Super 和 Ultra,支持开发者大规模构建和部署可靠的多智能体系统。Nemotron 3 Nano 拥有 300 ...发现资讯3个月前05870
LongCat-Image – 美团推出的开源图像生成模型,提供强大的图像编辑能力美团LongCat团队宣布,开源其最新研发的LongCat-Image模型。模型采用文生图与图像编辑同源的架构,结合渐进式学习策略,成功在6B参数下实现了指令遵循精准度、生图质量与文字渲染能力的高效协...发现资讯3个月前05870
Seedance 1.0 lite – 火山引擎推出的视频生成模型,支持文生视频和图生视频Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨率的视频。支持360度环绕、航拍、变焦...发现资讯3个月前05860
Z-Image – 阿里通义推出的图像生成模型,能快速生成高质量的逼真图像随着AI大模型的快速发展,越来越多的用户使用AI来辅助工作、提高效率。阿里通义大模型官方最新发布的生图模型 Z-Image 上线后迅速登顶 Hugging Face 趋势榜双榜第一,模型发布首日下载量...资讯3个月前05860
GPT Image 1.5 – OpenAI最新推出的图像生成模型,指令精准修改图像GPT-image-1.5 是 OpenAI 的最新前沿图像生成模型。 它改进了性能、质量、编辑控制和面部保存。能够更好地遵循指令、以特定方式编辑照片,并且生成结果的速度比之前的图像生成模型提升了四倍...发现资讯3个月前05820
UnityVideo – 港科大联合可灵快手开源的视频生成框架,实现视频内容的多模态解析港科大、港中文、清华大学与快手“可灵”团队联合发布UnityVideo,一个统一多模态与多任务的视频生成框架。框架通过动态噪声注入和模态自适应学习机制,实现 RGB 视频与辅助模态之间的双向学习,加速...发现资讯3个月前05810
Genstory – 免费AI故事生成平台,轻松创建睡前故事,Genstory 是基于 Gemini Storybook 技术的免费 AI 故事生成平台,能将用户的简单想法瞬间转化为精美的绘本故事。轻松创建睡前故事,让亲子时光更加温馨。用户可从海量故事库中选择...发现资讯3个月前05790
StepAudio R1 – 阶跃星辰推出的全球首个开源原生音频推理模型,真正实现深度推理。StepAudio R1 是阶跃星辰团队推出的全球首个开源原生音频推理模型。模型通过创新的模态锚定推理蒸馏(MGRD)框架,解决了传统音频模型在复杂推理中性能下降的问题,真正实现基于声学特征的深度推理...发现资讯3个月前05790
Seedance 1.5 Pro – 字节推出的音画同步多模态视频模型,整体效果自然流畅。字节跳动推出的Seedance 1.5 Pro模型,具备原生音画同步能力的多模态视频生成模型。该模型可实现精准音画同步,实现较高的视听一致性,且支持多种语言和地方方言口音,能够捕捉其独有的语音韵律与情...发现资讯3个月前05780