AI Research Foundations – 谷歌与UCL联合推出的AI研究基础课程,手把手教你如何构建和微调技巧。谷歌与伦敦大学学院(UCL)合作推出的“AI研究基础”(AI Research Foundations)课程是一套免费的、面向大学水平的学习资源,旨在通过实用的、专门构建的内容,赋予学习者进行高影响力...发现资讯2周前0600
LongCat-Flash-Omni – 美团开源的实时交互全模态大模型,支持文本、语音、图像和视频的多模态输入与输出美团正式发布LongCat-Flash-Omni,业界首个实现全模态覆盖、端到端架构、大参数量高效推理于一体的开源大语言模型。,LongCat-Flash-Omni 在全模态基准测试中达到开源最先进水...发现资讯2周前0610
SWE-1.5 – Cognition 推出的高性能AI编程模型,支持多轮交互式编程SWE-1.5 是由 AI 编程公司 Cognition 推出的最新高性能 AI 编程模型,其模型本身、推理过程与智能体框架经过协同设计,共同构成一个统一系统,以此同时实现高速与智能。旨在为软件工程任...发现资讯2周前01020
Game-TARS -字节跳动推出的通用型游戏智能体,提升任务完成率和交互智能字节跳动Seed团队打造的通用型游戏智能体Game-TARS,打破了传统游戏AI的局限。Game-TARS的核心创新,就是彻底抛弃了这种定制化思路,让AI像人一样通过最底层的键盘和鼠标动作与游戏交互...发现资讯2周前0700
LTX-2 – Lightricks推出的AI视频生成模型,推理效率比前代模型快2 – 3倍Lightricks推出开源AI视频模型LTX-2,支持原生4K分辨率与同步音频生成。LTX-2模型采用原生4K生成技术,无需后期放大即可输出50fps高帧率视频,生成速度超越播放速度,实现"6秒视频...发现资讯2周前0920
Popi.art – AI动画短片制作平台,提供动态帧布局与实时效果Pika Art是一个使用AI技术生成和编辑视频的平台,用户只需输入一句话描述,系统就会自动完成从分镜生成、角色场景创建、画面渲染到配音配乐的全流程,输出最长可达1000秒的连贯动漫视频。 Popi...发现资讯2周前0930
TLDW – AI视频摘要工具,支持YouTube视频URL输入或视频文件上传。TLDW是一款专门为优化视频观看体验而设计的AI工具,它可以分析YouTube视频并提取其中的关键时刻,让你用最短的时间获得最有价值的信息。该工具旨在帮助用户将冗长的YouTube视频转化为简洁、易于...发现资讯2周前0830
Emu3.5 – 智源研究院推出的多模态世界大模型,速度提升了近20倍智源研究院正式发布了“悟界 EMU3.5”多模态世界大模型,标志着人工智能从“语言学习”向“多模态世界学习”演进的新纪元。Emu3.5 在图像生成和编辑任务上取得了与Gemini 2.5 Flash ...发现资讯2周前01170
Music 2.0 – MiniMax推出的新一代音乐创作模型,支持多种唱法与风格切换MiniMax正式发布新一代音乐生成模型MiniMax Music 2.0。这一模型在音乐理解与声学表现能力上实现升级,能够精准捕捉人声情绪与器乐动态,为用户提供专业级音乐创作体验。在人声表现上接近真...发现资讯2周前0680
Firefly Image 5 – Adobe推出的最新图像生成模型,支持400万像素原生输出Adobe上线其最新一代图像生成与编辑模型Firefly Image 5,新模型支持400万像素原生输出,提供图像分层编辑等图像功能,还新增视频和音频生成工具。其细节锐度与色彩表现大幅提升,特别是在人...发现资讯2周前0660