Qianfan-VL – 百度开源的视觉理解模型,最高支持4K分辨率输入百度智能云千帆正式推出全新视觉理解模型 ——Qianfan-VL,共推出了3B、8B和70B三个版本,参数量覆盖从小到大的范围,能够灵活适应从边缘计算到云端推理的各类应用场景,并全面开源。 Qianf...发现资讯1个月前01850
Lessie AI – 全球首个People Search AI Agent,精准定位潜在合作伙伴Lessie AI是一款定位为「People Search AI Agent」的AI搜索智能体工具,旨在通过人工智能技术将传统依赖人脉或手动搜索的“找人”流程标准化、自动化。其重要性在於通過自動化流程...发现资讯1个月前01830
Neovate Code – 蚂蚁集团开源的AI编程助手,支持开发者用自然语言描述编程需求neovate code 是由蚂蚁集团推出的开源智能编程助手,致力于全面提升开发效率。该工具具备深度理解代码库的能力,能够遵循项目现有的编码风格,支持通过插件系统灵活扩展功能。目前以命令行工具(cli...发现资讯4周前01740
通义DeepResearch – 阿里推出的开源深度研究智能体,推动智能体的发展和创新。阿里正式开源其首个深度研究型智能体模型——通义DeepResearch,迅速在开源社区中位居前列。旨在解决复杂研究任务中的信息检索与推理问题。该模型通过多源交叉验证、结构化报告生成等能力,可辅助科研...发现资讯1个月前01730
Qwen3-Omni – 阿里通义开源的原生端到端全模态大模型,支持119种文本语言交互Qwen3-Omni模型的发布,标志着开源多模态人工智能领域的一个重要里程碑。该报告旨在对Qwen3-Omni进行全面深入的技术剖析,通过先进的深度学习技术,输入的视频、音频、文本直接进入核心模型,中...发现资讯1个月前01690
WebWeaver – 阿里通义开源的双Agent框架,提高研究效率和质量WebWalker是阿里巴巴通义实验室提出的一个用于提升大型语言模型(LLM)网页信息检索能力的框架,它是一个基于阿里通义大模型(通义千问)的开源框架,旨在通过对话式AI助手(Agent)来提升用户与...发现资讯1个月前01690
CUDA+cuDNN+pytorch安装,让你的comfyUI起飞!今天就带大家把CUDA、cuDNN还有pytorch安装一下,让 comfyUI提个速。 在没安装前,我用kontext跑了一张图,时间达到了285秒。 一、安装CUDA 1、在安装前要先确定你的电脑...科技资讯# comfyui1个月前01660
Spark Chemistry-X1-13B – 科大讯飞开源的化学模型,助力化学研究和药物设计科大讯飞正式宣布讯飞星火化学大模型 Spark Chemistry-X1-13B 与讯飞文生音频模型 AudioFly 全面开源,在论文研读、专业学术翻译、英文润色及文献综述生成等能力上表现优异,助力...发现资讯4周前01650
混元图像2.1 – 腾讯开源的文生图模型,支持2K分辨率的图像生成腾讯Hunyuan团队正式开源HunyuanImage2.1,该模型支持原生2048x2048分辨率输出,并显著提升文本生成能力,尤其在双语(中英)支持和复杂语义理解上表现出色。该模型增强了语义一致性...发现资讯2个月前01650
混元图像3.0 – 腾讯开源的原生多模态图像生成模型,支持多种风格的图像生成腾讯混元最新发布并开源原生多模态生图模型——混元图像3.0,这是首个开源工业级原生多模态生图模型,也是目前效果最好的开源生图模型。混元图像3.0具备常识并能够利用知识进行推理;同时语义理解准确度高,并...发现资讯4周前01640