资讯 | 第257页

发现科技资讯

排序

发布更新浏览点赞

Kotaemon—— 基于 RAG 技术的开源工具，支持多模态检索和复杂推理方法，满足多样化的查询需求

Kotaemon 是什么 Kotaemon是一款基于Retrieval-Augmented Generation (RAG)技术的开源工具，由Cinnamon团队开发。它通过结合信息检索和语言生成技术...

发现资讯

7个月前

06670

可灵O1 – 可灵AI推出全球首个统一多模态视频生成模型，轻松生成和编辑视频内容。

全球首个大一统的多模态视频、图片创作工具“可灵O1”正式上线。模型通过创新的多模态视觉语言（MVL）架构，实现视频生成、编辑与理解的无缝融合。可灵O1基于全新的视频和图像模型，以自然语言作为语义骨架...

发现资讯

3个月前

06620

EchoMimicV3 – 蚂蚁集团推出的多模态数字人视频生成框架，实现高效的模型训练和快速的动画生成。

EchoMimicV3 是由蚂蚁集团研发的一款高效、多模态、多任务的数字人视频生成框架。该模型拥有 13 亿参数，采用任务混合与模态混合的创新范式，结合独特的训练与推理策略，能够在多种输入条件下实现快...

发现资讯

7个月前

06620

Game-TARS -字节跳动推出的通用型游戏智能体，提升任务完成率和交互智能

字节跳动Seed团队打造的通用型游戏智能体Game-TARS，打破了传统游戏AI的局限。Game-TARS的核心创新，就是彻底抛弃了这种定制化思路，让AI像人一样通过最底层的键盘和鼠标动作与游戏交互...

发现资讯

4个月前

06610

MiMo-V2-Flash – 小米开源的高性能语言模型，生成速度提升2倍

mimo-v2-flash 是小米推出的开源高性能大语言模型，整体参数量达3090亿，其中每轮推理激活参数为150亿。仅用了309B的参数规模，该模型就展现出了极高的效能密度，在多项权威综合评测中均取...

发现资讯

3个月前

06600

Navos – 钛动科技推出的首款出海营销AI Agent，覆盖出海营销的策划、投放、数据分析等全链路

钛动科技推出的Navos是全球首个营销AI Agent，专为中国品牌出海设计，整合市场洞察、创意生成、广告优化等功能，通过多智能体架构提升营销效率。Navos不只是一个通用语言模型，更是一位深谙出海营...

发现资讯

5个月前

06590

混元3D-Omni – 腾讯混元推出的3D资产生成框架，能够生成高精度的3D模型

腾讯混元团队推出了混元 3D-Omni，一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。该框架不仅支持图像作为输入，还可接受点云、体素、边界框与骨骼姿态等多种控制信号，支持...

发现资讯

6个月前

06590

MyDetector – AI内容检测平台，对文本进行语法检查和逻辑分析

MyDetector 是一款面向学术、媒体、企业与内容创作领域的全能型 AI 内容真实性与质量检测平台，MyDetector 核心功能包括 AI 内容检测、抄袭检查、语法与逻辑分析，以及文本“人类化...

发现资讯

3个月前

06580

Stand-In – 腾讯微信推出的视频生成框架，支持生成具有高保真度的文本内容

腾讯发布了一个全新的开源项目——Stand-In，它是一个轻量级、即插即用的身份保留视频生成框架，不仅支持生成具有高保真度的文本到视频（Text-to-Video，T2V）内容，还能进行换脸、姿态控制...

发现资讯

6个月前

06560

Qianfan-VL – 百度开源的视觉理解模型，最高支持4K分辨率输入

百度智能云千帆正式推出全新视觉理解模型 ——Qianfan-VL，共推出了3B、8B和70B三个版本，参数量覆盖从小到大的范围，能够灵活适应从边缘计算到云端推理的各类应用场景，并全面开源。 Qianf...

发现资讯

6个月前

06540

加载更多