Qwen3-Omni – 阿里通义开源的原生端到端全模态大模型,支持119种文本语言交互Qwen3-Omni模型的发布,标志着开源多模态人工智能领域的一个重要里程碑。该报告旨在对Qwen3-Omni进行全面深入的技术剖析,通过先进的深度学习技术,输入的视频、音频、文本直接进入核心模型,中...发现资讯2周前01320
Qianfan-VL – 百度开源的视觉理解模型,最高支持4K分辨率输入百度智能云千帆正式推出全新视觉理解模型 ——Qianfan-VL,共推出了3B、8B和70B三个版本,参数量覆盖从小到大的范围,能够灵活适应从边缘计算到云端推理的各类应用场景,并全面开源。 Qianf...发现资讯2周前01430
Sidekick – AI流程自动化平台,帮助用户快速实现常见任务的自动化Sidekick是一款基于AI的智能流程自动化平台,让用户无需安装额外软件即可与本地大语言模型(LLM)对话,并能结合Mac上的文件、文件夹和网站信息生成回应,Sidekick支持文本生成图像,无需额...发现资讯2周前01330
Wan2.5 – 阿里通义推出的多模态生成模型系列,首次实现音画同步视频Wan2.5(通义万相2.5)是阿里通义实验室推出的多模态生成模型系列,该模型集成了文生视频、图生视频、文生图以及图像编辑四大核心功能,首次实现音画同步的智能视频生成,支持1080p高清分辨率、24f...发现资讯2周前02630
Lessie AI – 全球首个People Search AI Agent,精准定位潜在合作伙伴Lessie AI是一款定位为「People Search AI Agent」的AI搜索智能体工具,旨在通过人工智能技术将传统依赖人脉或手动搜索的“找人”流程标准化、自动化。其重要性在於通過自動化流程...发现资讯2周前01160
可灵2.5 Turbo – 可灵推出的最新AI视频生成模型,适合多种风格的视频创作。可灵AI推出视频生成可灵2.5 Turbo模型,同步更新文生视频、图生视频两大功能。可灵 2.5 Turbo 最核心的突破在于文本理解能力的代际升级。与仅能处理简单指令的 2.1 版本不同,新模型可深...发现资讯2周前01050
CUDA+cuDNN+pytorch安装,让你的comfyUI起飞!今天就带大家把CUDA、cuDNN还有pytorch安装一下,让 comfyUI提个速。 在没安装前,我用kontext跑了一张图,时间达到了285秒。 一、安装CUDA 1、在安装前要先确定你的电脑...科技资讯# comfyui2周前01210
如何自定义节点!AI绘画,ComfyUI教程,安装自定义节点你在网上看到一个非常厉害的 ComfyUI 工作流,下载后却发现不能使用,就像下面这样。 先是一个巨大的提示框,告诉你节点缺失。 叉掉这个提示框后,是一大堆红色的框框,整个工作流根本无法使用。 这是什...科技资讯# comfyui2周前0930
混元3D 3.0 – 腾讯混元最新推出的3D生成模型,建模精度提升3倍在2025腾讯全球数字生态大会上,腾讯混元3D 3.0模型正式发布,混元3D 3.0模型现已集成于混元3D AI创作引擎,面向用户免费开放,并同步上线腾讯云API。混元3D 3.0模型建模精度比上一版...发现资讯3周前01590
Strix – 开源AI安全测试工具,全面漏洞检测,支持多种测试场景Strix是一款由开源社区开发的AI安全测试工具,主要用于模拟黑客攻击场景,自动发现并验证软件漏洞,Strix依靠大语言模型(LLM)驱动的多智能体架构,不止能动态执行代码、操控HTTP请求,还能直接...发现资讯4周前01570