LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型,比同级自回归模型快 2.1 倍蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开技术报告。LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,打破...发现资讯2个月前03430
Claude-Mem – 开源Claude Code记忆插件,开启长期记忆功能Claude-Mem是一款智能插件,旨在为 Claude AI 提供长期记忆功能。该插件能够自动捕获在编码会话期间Claude的所有操作,通过AI进行压缩,并将相关的上下文信息注入未来的会话中,实现持...发现资讯2个月前03240
Disco – Google Labs推出的实验性AI浏览器,用户能实时操作和调整内容谷歌推出实验性AI浏览器Disco,该浏览器利用Gemini技术,其GenTabs功能可将多个标签页转化为定制化的Web应用,旨在提升浏览器的生产力工具功能。GenTabs 能生成包含交互地图和行程构...发现资讯2个月前03330
DeepSearchQA – 谷歌开源的AI研究Agent测试基准,精准衡量智能体在真实研究场景中的综合能力谷歌开源全新网络研究智能体基准DeepSearchQA,成为AI界对抗GPT-5.2的爆款工具。涵盖17个领域的900项人工设计的因果链任务,其中每个步骤都依赖于先前的分析。首次引入过程性评估指标,通...发现资讯2个月前02990
GWM-1 – Runway推出的首个通用世界模型,实时生成和模拟虚拟世界Runway推出首个通用世界模型GWM-1,采用自回归式建模方式,按帧顺序预测视频内容,具备实时响应与交互能力。其核心理念在于让AI系统在内部构建一套对现实世界运行机制的完整模拟。这就好比让计算机拥有...发现资讯2个月前03270
可灵2.6 – 快手可灵推出音画同出的AI视频生成模型,支模型持文生音画和图生音画两种模式可灵推出视频生成2.6模型,该模型提供了里程碑式的“音画同出”能力,彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程,用户仅需输入一段文字或一张图片,即可自动产出融合自然语音、精准音...发现资讯2个月前04260
Amazon Nova 2 – 亚马逊推出的第二代自研AI模型系列,支持文本、图像、视频和语音多模态任务。亚马逊推出第二代自研大模型Nova2系列,涵盖多模态、推理、语音等四款新品。Nova 2 Lite(成本优化的文本生成模型,支持文本、图像和视频处理);Nova 2 Pro(高级推理模型,适用于复杂任...发现资讯2个月前04790
TalkCody – 开源AI编程助手,涵盖 50 多种主流 AI 模型,支持多模态输入talkcody 是一款开源的 ai 编程助手,旨在提升开发者在软件开发过程中的效率。支持Ollama离线模型和自定义提示,将复杂调试化繁为简。采用 Rust 和 Tauri 构建,具备原生性能和低资...发现资讯2个月前04290
Seedream 4.5 – 字节跳动推出的AI图像创作模型,增强画面的立体感、光影效果字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在图像生成主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代,进一步提升了的整体质量与稳定性。面向广告...发现资讯2个月前03750
Maimo – 专注于信息处理和知识管理的AI工作平台,支持文档、视频、音频和播客等多种格式Maimo是一款专为行业研究的人工智能工作空间,旨在优化和简化研究流程。支持上传和管理多种格式的文档,并能和常用的工具无缝集成,平台支持多种格式的内容,包括文档、YouTube视频、音频文件和播客,方...发现资讯2个月前04080