资讯 | 第262页

发现科技资讯

排序

发布更新浏览点赞

Ada – 腾讯推出的AI程序员工具，实现从需求到上线的全流程自动化开发

腾讯发布了首个技术预览版本的 AI 程序员 ——Ada。凭借其强大的功能，Ada 正在引领开发者们进入一个全新的编程时代。用户只需通过自然语言描述功能需求，Ada便能启动端到端自动化流程。支持一键提需...

发现资讯

5个月前

06020

Mini-o3 – 字节联合港大推出的视觉推理模型，支持多轮交互推理

自字节跳动和香港大学的研究团队推出了 Mini-o3，一个旨在复现OpenAI强大但未公开的o3模型能力的开源系统。Mini-o3的核心目标是扩展模型与工具的交互能力，使其能够执行长达数十步的深度推理...

发现资讯

6个月前

06020

LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架，实现跨模态的信息检索

LLaVA-OneVision-1.5 是由 EvolvingLMMS-Lab 开发的全开源多模态框架，旨在通过高效训练和高质量数据实现多模态任务的高性能和低成本。该模型支持基于文本查询图像或基于图像...

发现资讯

5个月前

06010

Qoder CLI – Qoder团队推出的AI命令行工具，响应时间不到 200 毫秒

阿里巴巴正式发布Qoder CLI——一款专为命令行环境打造的AI编程代理工具。该工具基于阿里自研先进编程模型与轻量级Agent框架，支持自然语言驱动的代码生成、调试、部署、审查及自动化任务执行，显著...

发现资讯

6个月前

05990

SHARP – 苹果开源的3D场景生成AI模型，支持实时渲染高分辨率的 3D 视图

Apple 近日开源了一款名为 SHARP的人工智能模型，该模型能够在不到一秒钟的时间内，仅凭一张普通的 2D 照片生成高度逼真的 3D 场景表示。它打破了传统3D 重建动辄数小时的耗时瓶颈，仅需不到...

发现资讯

3个月前

05970

Disco – Google Labs推出的实验性AI浏览器，用户能实时操作和调整内容

谷歌推出实验性AI浏览器Disco，该浏览器利用Gemini技术，其GenTabs功能可将多个标签页转化为定制化的Web应用，旨在提升浏览器的生产力工具功能。GenTabs 能生成包含交互地图和行程构...

发现资讯

3个月前

05950

Depth Anything 3 – 字节跳动推出的视觉空间重建模型，可重建完整3D场景

自字节跳动（ByteDance Seed）的研究团队推出—Depth Anything 3 (DA3)视觉空间重建模型，旨在打破3D视觉任务之间的壁垒，实现一个“大一统”的视觉几何模型。DA3的核心思...

发现资讯

3个月前

05930

Firefly Image 5 – Adobe推出的最新图像生成模型，支持400万像素原生输出

Adobe上线其最新一代图像生成与编辑模型Firefly Image 5，新模型支持400万像素原生输出，提供图像分层编辑等图像功能，还新增视频和音频生成工具。其细节锐度与色彩表现大幅提升，特别是在人...

发现资讯

4个月前

05920

LuxReal – 群核科技推出的AI 3D视频创作平台，快速生成高质量

群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal，基于图像、3D 模型等多模态输入，快速生成主体一致、画面可控的视频内容，适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...

发现资讯

3个月前

05900

混元2.0 – 腾讯混元最新推出的智能语言模型，支持256K上下文窗口

腾讯发布了自研大模型的最新版本混元2.0（Tencent HY2.0）。包括Tencent HY 2.0 Think和Tencent HY 2.0 Instruct两个版本。该模型采用混合专家(Mo...

发现资讯

3个月前

05890

加载更多