Step-GUI – 阶跃星辰推出的AI Agent系列模型,10分钟就能在手机端部署step-gui 是阶跃星辰推出的ai agent系列模型,包含云侧模型 step-gui 和端侧模型 step-gui edge(原名:gelab-zero)。用户只需10分钟就能在手机端部署AI助...发现资讯1个月前04920
A2UI – 谷歌开源Agent生成用户界面的声明式协议,支持定制化a2ui(agent-to-user interface)是谷歌推出的开源协议,专为ai agent与用户界面之间的高效、安全交互而设计。核心是让AI生成“界面描述数据”,而非可执行代码,客户端通过预...发现资讯1个月前03320
TRELLIS.2 – 微软开源的40亿参数3D生成模型,支持透明度和逼真渲染微软开源了新一代AI工具TRELLIS.2,一个具备40亿参数的大型3D生成模型。专注于从单张图片高效生成高质量3D资产。该模型解决了如何生成具有复杂拓扑结构和锐利特征的3D物体,以及如何还原逼真的物...发现资讯1个月前01940
GPT-5.2-Codex – OpenAI推出的智能体编程模型,能高效生成高质量的代码gpt-5.2-codex 是 openai 推出的面向智能体编程任务的专业级模型,聚焦于高复杂度软件工程实践与防御型网络安全场景。其核心突破在于引入了“上下文压缩”技术,让其在处理代码重构、迁移等长...发现资讯1个月前03330
Wan-Move – 阿里联合清华等开源的运动可控视频生成框架wan-move 是由阿里巴巴通义实验室等单位联合推出的开源运动可控视频生成框架,依托潜在空间中的轨迹引导机制,实现高精度、高保真的视频运动调控。该框架能够生成长达5秒、分辨率为480p的视频,并且其...发现2个月前03600
UnityVideo – 港科大联合可灵快手开源的视频生成框架,实现视频内容的多模态解析港科大、港中文、清华大学与快手“可灵”团队联合发布UnityVideo,一个统一多模态与多任务的视频生成框架。框架通过动态噪声注入和模态自适应学习机制,实现 RGB 视频与辅助模态之间的双向学习,加速...发现资讯2个月前03250
LuxReal – 群核科技推出的AI 3D视频创作平台,快速生成高质量群核科技发布基于3D技术所打造的AI内容创作工具——LuxReal,基于图像、3D 模型等多模态输入,快速生成主体一致、画面可控的视频内容,适用电商、影视、广告等行业。“LuxReal通过构建3D渲染...发现资讯2个月前03570
Seedance 1.0 lite – 火山引擎推出的视频生成模型,支持文生视频和图生视频Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨率的视频。支持360度环绕、航拍、变焦...发现资讯2个月前03820
Infography – 自动将文本内容转化可视化图表生成平台Infography是一款由专业团队开发的AI工具,能将复杂的数据或文本内容转化为直观的视觉呈现,主要面向市场营销人员、产品经理、教育工作者以及任何需要将复杂信息以视觉化方式呈现的用户。Infogra...发现资讯2个月前03640
RealVideo -智谱AI开源的实时流式视频生成系统,增强交互的自然性和沉浸感RealVideo是一种流行的视频压缩和传输格式,用于在互联网上传输视频内容。核心功能覆盖文本输入交互、AI语音响应、唇形同步、WebSocket实时双向通信等。该技术能够根据网络带宽和用户设备性能的...发现资讯2个月前02850