Qwen3-Max – 阿里通义推出的超大规模模型,支持灵活调用外部工具完成复杂任务阿里通义旗舰模型Qwen3 - Max重磅登场,性能超过GPT5、Claude Opus4等,位居全球前三,Qwen3-Max 能在几秒内完成成熟程序员大半天才能实现的编程任务,展现出卓越的指令理解和...发现资讯2周前0950
CUDA+cuDNN+pytorch安装,让你的comfyUI起飞!今天就带大家把CUDA、cuDNN还有pytorch安装一下,让 comfyUI提个速。 在没安装前,我用kontext跑了一张图,时间达到了285秒。 一、安装CUDA 1、在安装前要先确定你的电脑...科技资讯# comfyui2周前01210
如何自定义节点!AI绘画,ComfyUI教程,安装自定义节点你在网上看到一个非常厉害的 ComfyUI 工作流,下载后却发现不能使用,就像下面这样。 先是一个巨大的提示框,告诉你节点缺失。 叉掉这个提示框后,是一大堆红色的框框,整个工作流根本无法使用。 这是什...科技资讯# comfyui2周前0930
可灵2.5 Turbo – 可灵推出的最新AI视频生成模型,适合多种风格的视频创作。可灵AI推出视频生成可灵2.5 Turbo模型,同步更新文生视频、图生视频两大功能。可灵 2.5 Turbo 最核心的突破在于文本理解能力的代际升级。与仅能处理简单指令的 2.1 版本不同,新模型可深...发现资讯2周前01050
Lessie AI – 全球首个People Search AI Agent,精准定位潜在合作伙伴Lessie AI是一款定位为「People Search AI Agent」的AI搜索智能体工具,旨在通过人工智能技术将传统依赖人脉或手动搜索的“找人”流程标准化、自动化。其重要性在於通過自動化流程...发现资讯2周前01160
Wan2.5 – 阿里通义推出的多模态生成模型系列,首次实现音画同步视频Wan2.5(通义万相2.5)是阿里通义实验室推出的多模态生成模型系列,该模型集成了文生视频、图生视频、文生图以及图像编辑四大核心功能,首次实现音画同步的智能视频生成,支持1080p高清分辨率、24f...发现资讯2周前02630
Sidekick – AI流程自动化平台,帮助用户快速实现常见任务的自动化Sidekick是一款基于AI的智能流程自动化平台,让用户无需安装额外软件即可与本地大语言模型(LLM)对话,并能结合Mac上的文件、文件夹和网站信息生成回应,Sidekick支持文本生成图像,无需额...发现资讯2周前01330
Qianfan-VL – 百度开源的视觉理解模型,最高支持4K分辨率输入百度智能云千帆正式推出全新视觉理解模型 ——Qianfan-VL,共推出了3B、8B和70B三个版本,参数量覆盖从小到大的范围,能够灵活适应从边缘计算到云端推理的各类应用场景,并全面开源。 Qianf...发现资讯2周前01430
Qwen3-Omni – 阿里通义开源的原生端到端全模态大模型,支持119种文本语言交互Qwen3-Omni模型的发布,标志着开源多模态人工智能领域的一个重要里程碑。该报告旨在对Qwen3-Omni进行全面深入的技术剖析,通过先进的深度学习技术,输入的视频、音频、文本直接进入核心模型,中...发现资讯2周前01320
小米开源的图像编辑框架–Lego-Edit ,能完成多种复杂的图像编辑任务Lego-Edit是一个为通用基于指令的图像编辑设计的框架。它使用Builder(一个MLLM)来调用Bricks(模型级工具)以实现灵活性,并采用强化学习(RL)来增强Builder的推理和工具组合...发现资讯2周前01630