资讯 | 第15页

发现科技资讯

排序

发布更新浏览点赞

xLLM – 京东开源的智能推理框架，实现5倍效率提升和90%成本优化

京东正式开源其自研大模型推理引擎xLLM。据悉，该引擎基于国产芯片深度优化，是一款专注于大模型高效推理的基础软件。xLLM在内部多场景应用中实现的5倍效率提升和90%成本优化，已经强有力地证明了其技术...

发现资讯

4个月前

06130

Mano – 明略科技推出的GUI智能操作模型，为自动化操作提供高效解决方案

mano 是由明略科技研发的专用大模型，专注于图形用户界面（gui）的智能化操作。该模型建立在多模态基础架构之上，融合了在线强化学习与自动化训练数据采集等前沿技术。Mano的创新，不单单是解决了目前的...

发现资讯

4个月前

05340

Imagine v0.9 – xAI推出的视频生成模型，通过语音指令能快速创建内容

imagine v0.9 是由 xai 团队开发的全新一代视频生成模型。该模型能够在20秒内快速生成约6秒的高质量视频，具备精准的运动控制、动态镜头变换以及自然语音对话合成等先进功能。支持语音交互、动...

发现资讯

4个月前

07560

SceneGen – 上海交大推出的3D场景生成框架，单图到3D场景一步生成

上海交通大学的研究团队推出了一种名为 SceneGen 的新颖框架，在这一领域取得了突破性进展。它以一张场景图像和图中物体的分割掩码作为输入，能够在一次前向传播中，同时生成场景内多个3D资产的几何、纹...

发现资讯

4个月前

04750

Agent Kit – OpenAI推出的AI Agent开发工具，无需编写代码即可设计复杂工作流

Agent Kit 是 OpenAI 推出的一个基于 Agent 的工作流编排工具，旨在帮助你将智能体从原型阶段推进至生产阶段。它涵盖了你构建、部署和优化智能体工作流所需的全部功能，能大幅减少流程中的...

发现资讯

5个月前

06120

Ming-UniAudio – 蚂蚁集团开源的音频多模态模型，支持语音理解和生成任务

随着大语言模型（LLM）的快速发展，语音语言模型在语音理解、生成和编辑等方面取得了显著进展。Ming-UniAudio 是蚂蚁集团开源的一个创新语音处理项目，这是一个基于统一连续分词器的语音大模型，能...

发现资讯

5个月前

08110

Sora 2 – OpenAI 推出的新一代AI音视频生成模型，首次实现了环境音效与画面动态同步生成

OpenAI推出的新一代视频生成模型Sora 2，首次实现了音频与画面的智能同步生成。新模型通过多模态融合算法，能够理解视频内容的情绪基调、场景特征和动作节奏，并据此生成匹配的背景音乐、环境音效甚至人...

发现资讯

5个月前

01K0

聆音EchoCare – 香港中科院推出的超声大模型，有效提升医疗服务效率

中国科学院香港创新研究院人工智能与机器人创新中心（CAIR）在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型（简称“聆音”），通过超过450余万张大规模多器官、多中心、多地区...

发现资讯

5个月前

07580

豆包大模型1.6-vision – 火山引擎推出的视觉深度思考模型，具备工具调用能力

火山引擎宣布正式推出豆包大模型 1.6-vision，以工具调用的差异化能力，将图像融入其思维链中，实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细处理。在增强推理可解释性的同时，可高效精准地完成...

发现资讯

5个月前

05160

Ring-1T – 蚂蚁百灵开源的万亿参数思考大模型，展现出强大的数学推理能力。

蚂蚁集团重磅推出万亿参数思考模型Ring-1T，并全面开源模型权重、训练配方。Ring-1T不仅在数学竞赛上刷新开源SOTA，还在逻辑推理和医疗问答中脱颖而出。并结合人类反馈强化学习（RLHF）提升...

发现资讯

5个月前

05510

加载更多