资讯 | 第2页 | up导航

发现科技资讯

排序

发布更新浏览点赞

Kairos 3.0 – 大晓机器人开源的商业应用世界模型，高效处理长视频

kairos 3.0（开悟世界模型3.0）是由大晓机器人自主研发的业界首款ace具身智能研发范式，同时也是首个面向实际商业落地且完全开源的世界模型。核心亮点包括全球首创ACE技术范式，通过“环境式采集...

发现资讯

2个月前

05960

SHARP – 苹果开源的3D场景生成AI模型，支持实时渲染高分辨率的 3D 视图

Apple 近日开源了一款名为 SHARP的人工智能模型，该模型能够在不到一秒钟的时间内，仅凭一张普通的 2D 照片生成高度逼真的 3D 场景表示。它打破了传统3D 重建动辄数小时的耗时瓶颈，仅需不到...

发现资讯

2个月前

04340

Seed1.8 – 字节跳动推出的通用Agent模型，能快速准确地获取和整合信息。

字节跳动宣布正式推出通用Agent模型Seed1.8。具备强大的多模态能力，支持图文输入，能在信息检索、代码生成、GUI 交互及复杂工作流等场景中高效精准地完成任务，满足日益多元的技术需求。Seed1...

发现资讯

2个月前

04050

GPT-5.2-Codex – OpenAI推出的智能体编程模型，能高效生成高质量的代码

gpt-5.2-codex 是 openai 推出的面向智能体编程任务的专业级模型，聚焦于高复杂度软件工程实践与防御型网络安全场景。其核心突破在于引入了“上下文压缩”技术，让其在处理代码重构、迁移等长...

发现资讯

2个月前

04180

TRELLIS.2 – 微软开源的40亿参数3D生成模型，支持透明度和逼真渲染

微软开源了新一代AI工具TRELLIS.2，一个具备40亿参数的大型3D生成模型。专注于从单张图片高效生成高质量3D资产。该模型解决了如何生成具有复杂拓扑结构和锐利特征的3D物体，以及如何还原逼真的物...

发现资讯

2个月前

02540

A2UI – 谷歌开源Agent生成用户界面的声明式协议，支持定制化

a2ui（agent-to-user interface）是谷歌推出的开源协议，专为ai agent与用户界面之间的高效、安全交互而设计。核心是让AI生成“界面描述数据”，而非可执行代码，客户端通过预...

发现资讯

2个月前

04580

Step-GUI – 阶跃星辰推出的AI Agent系列模型，10分钟就能在手机端部署

step-gui 是阶跃星辰推出的ai agent系列模型，包含云侧模型 step-gui 和端侧模型 step-gui edge（原名：gelab-zero）。用户只需10分钟就能在手机端部署AI助...

发现资讯

2个月前

05810

Seedance 1.5 Pro – 字节推出的音画同步多模态视频模型，整体效果自然流畅。

字节跳动推出的Seedance 1.5 Pro模型，具备原生音画同步能力的多模态视频生成模型。该模型可实现精准音画同步，实现较高的视听一致性，且支持多种语言和地方方言口音，能够捕捉其独有的语音韵律与情...

发现资讯

2个月前

04550

万相2.6 – 阿里通义推出的新一代视频生成系列模型，首个支持角色扮演模型

阿里通义推出万相2.6系列模型，支持音画同步、多镜头生成及声音驱动等功能。旨在实现生成视频在画面与声音上的整体一致性。其分镜控制功能可依据语义理解，将原始素材构建为包含多镜头切换的专业叙事段落。该版本...

发现资讯

2个月前

03920

Molmo 2 – Ai2开源的AI视频分析模型，提供灵活的多模态处理能力

艾伦人工智能研究所（Ai2）发布了全新的 Molmo2开源视频语言模型，支持多图像.视频输入，能推理事件、生成字幕并追踪物体。模型基于 Qwen 3 和 Olmo 架构，具备强大的视频分析能力，能在视...

发现资讯

2个月前

04950

加载更多