资讯 | 第259页

发现科技资讯

排序

发布更新浏览点赞

Devstral 2 – Mistral AI开源的新一代编程模型系列，支持在大型代码库中进行复杂的代码修改和重构

Mistral AI 推出新一代编程模型家族 Devstral 2，支持端到端自动化编程，相比参数规模更大的闭源模型，其成本效率高达7倍以上，特别适合大规模自动化编码任务，其核心优势在于支持跨文件协同...

发现资讯

3个月前

06430

Qwen-Image-Edit – 阿里通义推出的全能图像编辑模型，能高效完成各种复杂的图像编辑任务。

阿里通义千问团队发布了全能图像编辑模型 Qwen-Image-Edit，支持多种艺术风格，尤其擅长复杂文本渲染通过语义与外观双重编辑能力，不仅能准确理解外观编辑的指令意图，还能进行高级视觉语义编辑，同...

发现资讯

7个月前

06410

AudioFly – 科大讯飞开源的文生音效模型，支持本地部署、推理和微调。

主要介绍 AudioFly是科大讯飞推出的开源文生音效模型，基于潜在扩散模型（LDM）架构，能够根据文本描述生成高质量音频。该模型支持44.1kHz采样率，在文本与音效的匹配度上表现优异，适用于短视频...

发现资讯

6个月前

06370

FIBO – 开源的图像生成模型，支持快速迭代和精准控制，提升创意效率。

FIBO是一个开源的文本生成图像模型，专为长结构化描述训练而成，能够根据用户输入的文本描述快速生成高质量的图像。支持将简短的文本提示扩展为详细的结构化JSON描述，能将简短的文本提示自动扩展为长达千字...

发现资讯

5个月前

06340

GLM-ASR – 智谱开源的语音识别系列模型，模型能将语音实时转换为文字

GLM-ASR是由智谱AI开发的开源语音识别模型系列，结合了自然语言处理（NLP）和语音识别（ASR）的先进技术。不仅可以实现精准的语音转文字，还可以在输入法中直接调用大模型能力，完成翻译、改写、情绪...

发现资讯

3个月前

06330

twitch官网入口，twitc登录教程

twitch是一款全球超火的游戏直播、教学、玩法攻略流媒体平台，它是美国最大的一家游戏视频直播网站，内容几乎涵盖了市面上所有游戏种类。对跨境电商卖家而言，Twitch是很好的营销引流平台。无论是游戏还...

发现资讯

3个月前

06310

Mano – 明略科技推出的GUI智能操作模型，为自动化操作提供高效解决方案

mano 是由明略科技研发的专用大模型，专注于图形用户界面（gui）的智能化操作。该模型建立在多模态基础架构之上，融合了在线强化学习与自动化训练数据采集等前沿技术。Mano的创新，不单单是解决了目前的...

发现资讯

5个月前

06300

Molmo 2 – Ai2开源的AI视频分析模型，提供灵活的多模态处理能力

艾伦人工智能研究所（Ai2）发布了全新的 Molmo2开源视频语言模型，支持多图像.视频输入，能推理事件、生成字幕并追踪物体。模型基于 Qwen 3 和 Olmo 架构，具备强大的视频分析能力，能在视...

发现资讯

3个月前

06280

Alpamayo-R1 – 英伟达发布首款推理版视觉-语言-动作模型

随着芯片成为AI发展的核心，英伟达发布了新的开源软件Alpamayo-R1，旨在利用人工智能（AI）中的一些最新“推理”技术加快自动驾驶汽车的开发。模型的核心创新包括：构建因果链（CoC）数据集，通过...

发现资讯

3个月前

06280

腾讯AI Lab推出的全长度歌曲生成模型–SongBloom ，仅需 10 秒音频样本和对应歌词

SongBloom 是一个由腾讯 AI Lab 联合顶尖高校研发的开源歌曲生成模型。它采用自回归扩散模型，将扩散模型的高保真度与语言模型的可扩展性相结合，能够快速生成完整歌曲，支持双通道、48kHz ...

发现资讯

5个月前

06260

加载更多