Ada – 腾讯推出的AI程序员工具,实现从需求到上线的全流程自动化开发腾讯发布了首个技术预览版本的 AI 程序员 ——Ada。凭借其强大的功能,Ada 正在引领开发者们进入一个全新的编程时代。用户只需通过自然语言描述功能需求,Ada便能启动端到端自动化流程。支持一键提需...发现资讯5个月前06020
Mini-o3 – 字节联合港大推出的视觉推理模型,支持多轮交互推理自字节跳动和香港大学的研究团队推出了 Mini-o3,一个旨在复现OpenAI强大但未公开的o3模型能力的开源系统。Mini-o3的核心目标是扩展模型与工具的交互能力,使其能够执行长达数十步的深度推理...发现资讯6个月前06020
LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架,实现跨模态的信息检索LLaVA-OneVision-1.5 是由 EvolvingLMMS-Lab 开发的全开源多模态框架,旨在通过高效训练和高质量数据实现多模态任务的高性能和低成本。该模型支持基于文本查询图像或基于图像...发现资讯5个月前06010
Qoder CLI – Qoder团队推出的AI命令行工具,响应时间不到 200 毫秒阿里巴巴正式发布Qoder CLI——一款专为命令行环境打造的AI编程代理工具。该工具基于阿里自研先进编程模型与轻量级Agent框架,支持自然语言驱动的代码生成、调试、部署、审查及自动化任务执行,显著...发现资讯6个月前05990
SHARP – 苹果开源的3D场景生成AI模型,支持实时渲染高分辨率的 3D 视图Apple 近日开源了一款名为 SHARP的人工智能模型,该模型能够在不到一秒钟的时间内,仅凭一张普通的 2D 照片生成高度逼真的 3D 场景表示。它打破了传统3D 重建动辄数小时的耗时瓶颈,仅需不到...发现资讯3个月前05970
Disco – Google Labs推出的实验性AI浏览器,用户能实时操作和调整内容谷歌推出实验性AI浏览器Disco,该浏览器利用Gemini技术,其GenTabs功能可将多个标签页转化为定制化的Web应用,旨在提升浏览器的生产力工具功能。GenTabs 能生成包含交互地图和行程构...发现资讯3个月前05950
Depth Anything 3 – 字节跳动推出的视觉空间重建模型,可重建完整3D场景自字节跳动(ByteDance Seed)的研究团队推出—Depth Anything 3 (DA3)视觉空间重建模型,旨在打破3D视觉任务之间的壁垒,实现一个“大一统”的视觉几何模型。DA3的核心思...发现资讯3个月前05930
Firefly Image 5 – Adobe推出的最新图像生成模型,支持400万像素原生输出Adobe上线其最新一代图像生成与编辑模型Firefly Image 5,新模型支持400万像素原生输出,提供图像分层编辑等图像功能,还新增视频和音频生成工具。其细节锐度与色彩表现大幅提升,特别是在人...发现资讯4个月前05920
LuxReal – 群核科技推出的AI 3D视频创作平台,快速生成高质量群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal,基于图像、3D 模型等多模态输入,快速生成主体一致、画面可控的视频内容,适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...发现资讯3个月前05900
混元2.0 – 腾讯混元最新推出的智能语言模型,支持256K上下文窗口腾讯发布了自研大模型的最新版本 混元2.0(Tencent HY2.0)。包括Tencent HY 2.0 Think和Tencent HY 2.0 Instruct两个版本。该模型采用混合专家(Mo...发现资讯3个月前05890