Kotaemon—— 基于 RAG 技术的开源工具,支持多模态检索和复杂推理方法,满足多样化的查询需求Kotaemon 是什么 Kotaemon是一款基于Retrieval-Augmented Generation (RAG)技术的开源工具,由Cinnamon团队开发。它通过结合信息检索和语言生成技术...发现资讯7个月前06670
可灵O1 – 可灵AI推出全球首个统一多模态视频生成模型,轻松生成和编辑视频内容。全球首个大一统的多模态视频、图片创作工具“可灵O1”正式上线。模型通过创新的多模态视觉语言(MVL)架构,实现视频生成、编辑与理解的无缝融合。可灵O1基于全新的视频和图像模型,以自然语言作为语义骨架...发现资讯3个月前06620
EchoMimicV3 – 蚂蚁集团推出的多模态数字人视频生成框架,实现高效的模型训练和快速的动画生成。EchoMimicV3 是由蚂蚁集团研发的一款高效、多模态、多任务的数字人视频生成框架。该模型拥有 13 亿参数,采用任务混合与模态混合的创新范式,结合独特的训练与推理策略,能够在多种输入条件下实现快...发现资讯7个月前06620
Game-TARS -字节跳动推出的通用型游戏智能体,提升任务完成率和交互智能字节跳动Seed团队打造的通用型游戏智能体Game-TARS,打破了传统游戏AI的局限。Game-TARS的核心创新,就是彻底抛弃了这种定制化思路,让AI像人一样通过最底层的键盘和鼠标动作与游戏交互...发现资讯4个月前06610
MiMo-V2-Flash – 小米开源的高性能语言模型,生成速度提升2倍mimo-v2-flash 是小米推出的开源高性能大语言模型,整体参数量达3090亿,其中每轮推理激活参数为150亿。仅用了309B的参数规模,该模型就展现出了极高的效能密度,在多项权威综合评测中均取...发现资讯3个月前06600
Navos – 钛动科技推出的首款出海营销AI Agent,覆盖出海营销的策划、投放、数据分析等全链路钛动科技推出的Navos是全球首个营销AI Agent,专为中国品牌出海设计,整合市场洞察、创意生成、广告优化等功能,通过多智能体架构提升营销效率。Navos不只是一个通用语言模型,更是一位深谙出海营...发现资讯5个月前06590
混元3D-Omni – 腾讯混元推出的3D资产生成框架,能够生成高精度的3D模型腾讯混元团队推出了混元 3D-Omni,一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。该框架不仅支持图像作为输入,还可接受点云、体素、边界框与骨骼姿态等多种控制信号,支持...发现资讯6个月前06590
MyDetector – AI内容检测平台,对文本进行语法检查和逻辑分析MyDetector 是一款面向学术、媒体、企业与内容创作领域的全能型 AI 内容真实性与质量检测平台,MyDetector 核心功能包括 AI 内容检测、抄袭检查、语法与逻辑分析,以及文本“人类化...发现资讯3个月前06580
Stand-In – 腾讯微信推出的视频生成框架,支持生成具有高保真度的文本内容腾讯发布了一个全新的开源项目——Stand-In,它是一个轻量级、即插即用的身份保留视频生成框架,不仅支持生成具有高保真度的文本到视频(Text-to-Video,T2V)内容,还能进行换脸、姿态控制...发现资讯6个月前06560
Qianfan-VL – 百度开源的视觉理解模型,最高支持4K分辨率输入百度智能云千帆正式推出全新视觉理解模型 ——Qianfan-VL,共推出了3B、8B和70B三个版本,参数量覆盖从小到大的范围,能够灵活适应从边缘计算到云端推理的各类应用场景,并全面开源。 Qianf...发现资讯6个月前06540