发现 | 第5页 | up导航

发现科技资讯

排序

发布更新浏览点赞

LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型，比同级自回归模型快 2.1 倍

蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型（dLLM），并同步公开技术报告。LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本，打破...

发现资讯

2个月前

03430

Claude-Mem – 开源Claude Code记忆插件，开启长期记忆功能

Claude-Mem是一款智能插件，旨在为 Claude AI 提供长期记忆功能。该插件能够自动捕获在编码会话期间Claude的所有操作，通过AI进行压缩，并将相关的上下文信息注入未来的会话中，实现持...

发现资讯

2个月前

03240

Disco – Google Labs推出的实验性AI浏览器，用户能实时操作和调整内容

谷歌推出实验性AI浏览器Disco，该浏览器利用Gemini技术，其GenTabs功能可将多个标签页转化为定制化的Web应用，旨在提升浏览器的生产力工具功能。GenTabs 能生成包含交互地图和行程构...

发现资讯

2个月前

03330

DeepSearchQA – 谷歌开源的AI研究Agent测试基准，精准衡量智能体在真实研究场景中的综合能力

谷歌开源全新网络研究智能体基准DeepSearchQA，成为AI界对抗GPT-5.2的爆款工具。涵盖17个领域的900项人工设计的因果链任务，其中每个步骤都依赖于先前的分析。首次引入过程性评估指标，通...

发现资讯

2个月前

02990

GWM-1 – Runway推出的首个通用世界模型，实时生成和模拟虚拟世界

Runway推出首个通用世界模型GWM-1，采用自回归式建模方式，按帧顺序预测视频内容，具备实时响应与交互能力。其核心理念在于让AI系统在内部构建一套对现实世界运行机制的完整模拟。这就好比让计算机拥有...

发现资讯

2个月前

03270

可灵2.6 – 快手可灵推出音画同出的AI视频生成模型，支模型持文生音画和图生音画两种模式

可灵推出视频生成2.6模型，该模型提供了里程碑式的“音画同出”能力，彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程，用户仅需输入一段文字或一张图片，即可自动产出融合自然语音、精准音...

发现资讯

2个月前

04260

Amazon Nova 2 – 亚马逊推出的第二代自研AI模型系列，支持文本、图像、视频和语音多模态任务。

亚马逊推出第二代自研大模型Nova2系列，涵盖多模态、推理、语音等四款新品。Nova 2 Lite（成本优化的文本生成模型，支持文本、图像和视频处理）；Nova 2 Pro（高级推理模型，适用于复杂任...

发现资讯

2个月前

04790

TalkCody – 开源AI编程助手，涵盖 50 多种主流 AI 模型，支持多模态输入

talkcody 是一款开源的 ai 编程助手，旨在提升开发者在软件开发过程中的效率。支持Ollama离线模型和自定义提示，将复杂调试化繁为简。采用 Rust 和 Tauri 构建，具备原生性能和低资...

发现资讯

2个月前

04290

Seedream 4.5 – 字节跳动推出的AI图像创作模型，增强画面的立体感、光影效果

字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在图像生成主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代，进一步提升了的整体质量与稳定性。面向广告...

发现资讯

2个月前

03750

Maimo – 专注于信息处理和知识管理的AI工作平台，支持文档、视频、音频和播客等多种格式

Maimo是一款专为行业研究的人工智能工作空间，旨在优化和简化研究流程。支持上传和管理多种格式的文档，并能和常用的工具无缝集成，平台支持多种格式的内容，包括文档、YouTube视频、音频文件和播客，方...

发现资讯

2个月前

04080

加载更多