Kairos 3.0 – 大晓机器人开源的商业应用世界模型,高效处理长视频kairos 3.0(开悟世界模型3.0)是由大晓机器人自主研发的业界首款ace具身智能研发范式,同时也是首个面向实际商业落地且完全开源的世界模型。核心亮点包括全球首创ACE技术范式,通过“环境式采集...发现资讯5天前01090
T5Gemma 2 – 谷歌开源的长上下文编码器-解码器模型,支持超过 140 种语言谷歌推出的T5Gemma 2模型坚持使用编码器-解码器架构,该模型能够处理长达128K的上下文信息,显著提升了长文本处理的准确性。参数规模有 270M – 270M、1B – 1B 和 4B – 4B...发现资讯5天前0810
MyDetector – AI内容检测平台,对文本进行语法检查和逻辑分析MyDetector 是一款面向学术、媒体、企业与内容创作领域的全能型 AI 内容真实性与质量检测平台,MyDetector 核心功能包括 AI 内容检测、抄袭检查、语法与逻辑分析,以及文本“人类化...发现资讯5天前0710
MovieFlow – AI视频创作平台,自动将文字转化为完整的视频内容MovieFlow AI是一款免费的AI视频生成工具,支持创建最长三分钟的电影级视频,无需预先付费。MovieFlow 内置先进的自然语言处理引擎,用户输入关键词或大致情节后,它能自动生成逻辑清晰、结...发现资讯5天前0910
FlowyAIPC – 本地AI办公助手工具,支持多种语言的即时翻译FlowyAIPC 是 Flowy AI 公司推出的面向智能办公领域的 AI 助手产品,这款工具能在完全离线状态下运行,所有数据、聊天记录、知识库内容都保存在本地电脑中,保证了数据的安全性和私密性。它...发现资讯5天前0780
SHARP – 苹果开源的3D场景生成AI模型,支持实时渲染高分辨率的 3D 视图Apple 近日开源了一款名为 SHARP的人工智能模型,该模型能够在不到一秒钟的时间内,仅凭一张普通的 2D 照片生成高度逼真的 3D 场景表示。它打破了传统3D 重建动辄数小时的耗时瓶颈,仅需不到...发现资讯1周前0570
Seed1.8 – 字节跳动推出的通用Agent模型,能快速准确地获取和整合信息。字节跳动宣布正式推出通用Agent模型Seed1.8。具备强大的多模态能力,支持图文输入,能在信息检索、代码生成、GUI 交互及复杂工作流等场景中高效精准地完成任务,满足日益多元的技术需求。Seed1...发现资讯1周前0770
GPT Image 1.5 – OpenAI最新推出的图像生成模型,指令精准修改图像GPT-image-1.5 是 OpenAI 的最新前沿图像生成模型。 它改进了性能、质量、编辑控制和面部保存。能够更好地遵循指令、以特定方式编辑照片,并且生成结果的速度比之前的图像生成模型提升了四倍...发现资讯1周前0860
MiMo-V2-Flash – 小米开源的高性能语言模型,生成速度提升2倍mimo-v2-flash 是小米推出的开源高性能大语言模型,整体参数量达3090亿,其中每轮推理激活参数为150亿。仅用了309B的参数规模,该模型就展现出了极高的效能密度,在多项权威综合评测中均取...发现资讯1周前01040
万相2.6 – 阿里通义推出的新一代视频生成系列模型,首个支持角色扮演模型阿里通义推出万相2.6系列模型,支持音画同步、多镜头生成及声音驱动等功能。旨在实现生成视频在画面与声音上的整体一致性。其分镜控制功能可依据语义理解,将原始素材构建为包含多镜头切换的专业叙事段落。该版本...发现资讯1周前0670