资讯 | 第2页 | up导航

发现科技资讯

排序

发布更新浏览点赞

FlowyAIPC – 本地AI办公助手工具，支持多种语言的即时翻译

FlowyAIPC 是 Flowy AI 公司推出的面向智能办公领域的 AI 助手产品，这款工具能在完全离线状态下运行，所有数据、聊天记录、知识库内容都保存在本地电脑中，保证了数据的安全性和私密性。它...

发现资讯

2个月前

04010

SHARP – 苹果开源的3D场景生成AI模型，支持实时渲染高分辨率的 3D 视图

Apple 近日开源了一款名为 SHARP的人工智能模型，该模型能够在不到一秒钟的时间内，仅凭一张普通的 2D 照片生成高度逼真的 3D 场景表示。它打破了传统3D 重建动辄数小时的耗时瓶颈，仅需不到...

发现资讯

2个月前

04340

Seed1.8 – 字节跳动推出的通用Agent模型，能快速准确地获取和整合信息。

字节跳动宣布正式推出通用Agent模型Seed1.8。具备强大的多模态能力，支持图文输入，能在信息检索、代码生成、GUI 交互及复杂工作流等场景中高效精准地完成任务，满足日益多元的技术需求。Seed1...

发现资讯

2个月前

04050

GPT Image 1.5 – OpenAI最新推出的图像生成模型，指令精准修改图像

GPT-image-1.5 是 OpenAI 的最新前沿图像生成模型。它改进了性能、质量、编辑控制和面部保存。能够更好地遵循指令、以特定方式编辑照片，并且生成结果的速度比之前的图像生成模型提升了四倍...

发现资讯

2个月前

04350

MiMo-V2-Flash – 小米开源的高性能语言模型，生成速度提升2倍

mimo-v2-flash 是小米推出的开源高性能大语言模型，整体参数量达3090亿，其中每轮推理激活参数为150亿。仅用了309B的参数规模，该模型就展现出了极高的效能密度，在多项权威综合评测中均取...

发现资讯

2个月前

05280

万相2.6 – 阿里通义推出的新一代视频生成系列模型，首个支持角色扮演模型

阿里通义推出万相2.6系列模型，支持音画同步、多镜头生成及声音驱动等功能。旨在实现生成视频在画面与声音上的整体一致性。其分镜控制功能可依据语义理解，将原始素材构建为包含多镜头切换的专业叙事段落。该版本...

发现资讯

2个月前

03920

Seedance 1.5 Pro – 字节推出的音画同步多模态视频模型，整体效果自然流畅。

字节跳动推出的Seedance 1.5 Pro模型，具备原生音画同步能力的多模态视频生成模型。该模型可实现精准音画同步，实现较高的视听一致性，且支持多种语言和地方方言口音，能够捕捉其独有的语音韵律与情...

发现资讯

2个月前

04550

LongCat-Video-Avatar – 美团开源的数字人视频生成模型，支持音频文本生成视频

LongCat-Video-Avatar 是由美团开源的一个基于深度学习的视频生成模型，旨在生成高质量的数字人视频。支持音频、文本或图像输入生成拟真视频，通过创新技术提升动作自然度、长视频稳定性及角色...

发现资讯

2个月前

04400

Molmo 2 – Ai2开源的AI视频分析模型，提供灵活的多模态处理能力

艾伦人工智能研究所（Ai2）发布了全新的 Molmo2开源视频语言模型，支持多图像.视频输入，能推理事件、生成字幕并追踪物体。模型基于 Qwen 3 和 Olmo 架构，具备强大的视频分析能力，能在视...

发现资讯

2个月前

04950

Step-GUI – 阶跃星辰推出的AI Agent系列模型，10分钟就能在手机端部署

step-gui 是阶跃星辰推出的ai agent系列模型，包含云侧模型 step-gui 和端侧模型 step-gui edge（原名：gelab-zero）。用户只需10分钟就能在手机端部署AI助...

发现资讯

2个月前

05810

加载更多