Mistral Small 3.1 – Mistral AI 开源的多模态 AI 模型Mistral 官方表示,Mistral Small 3.1 是一款多功能模型,旨在处理各种生成式 AI 任务,包括指令遵循、对话辅助、图像理解和函数调用。它为企业级和消费级 AI 应用提供了坚实的基...资讯# 人工智能4个月前03130
draw.io – 免费在线绘图工具,快速创建各种图表今天,我们要介绍的是一款备受推崇的在线绘图工具——draw.io。凭借其出色的易用性、全面的功能、灵活的存储选项以及强大的协作能力,已成为用户创建和管理图表的首选工具。无论是用于工作、学习还是个人创意...资讯# 人工智能4个月前03100
TokenSwift – 超长文本生成加速框架,90分钟内生成10万Token文本随着 LLMs 长上下文窗口能力的不断提升,复杂任务对超长文本生成的需求越来越高。由于自回归生成每生成一个 Token 都需要从 GPU 存储中重新加载模型权重,导致 I/O 操作频繁、延迟高。在生成...资讯# 人工智能5个月前03070
Crack Coder – AI技术面试隐形辅助工具,提供实时编程问题支持Crack Coder是什么 Crack Coder 是开源的隐形 AI 辅助工具,专为技术面试设计。Crack Coder支持在后台运行,完全隐形,无法被屏幕录制或监控软件检测到。Crack Cod...资讯# 人工智能4个月前03030
文心大模型4.5 – 百度推出的首个原生多模态大模型3月16日,百度正式发布文心大模型4.5及文心大模型X1,在文心一言官网即可免费使用。据介绍,文心大模型4.5是百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升。 文心大模型4.5是...资讯# 人工智能5个月前03030
Chirp 3 – 谷歌云重磅推出的高清语音模型谷歌云在伦敦的DeepMind总部推出了高清语音模型Chirp3。该模型通过 Vertex AI 统一机器学习平台向开发者开放,提供了丰富的开发工具,助力程序的创新。 Chirp 3 将为 31 种语...资讯# 人工智能4个月前02980
MT-TransformerEngine – 摩尔线程开源的高效训练与推理优化框架MT-TransformerEngine 主要用于 Transformer 模型的训练与推理优化,通过算子融合、并行加速策略等技术,释放摩尔线程全功能 GPU 高密度计算的潜力和 memory bou...资讯# 人工智能5个月前02940
MT-MegatronLM – 摩尔线程开源的混合并行训练框架摩尔线程重磅宣布,正式开源MT-MegatronLM与MT-TransformerEngine两大AI框架,这一举措将为国产计算基础设施注入强劲动力。这两大框架通过深度融合FP8混合训练策略和高性能算...资讯# 人工智能5个月前02940
万智 – 零一万物新推出的企业AI解决方案一站式平台自2024年底宣布针对2B智能化转型市场的战略聚焦一系列动作后,零一万物进一步采取基座模型的开放策略,针对DeepSeek模型私有化专业部署的市场痛点,将全链条技术管线复用到B端的模型私有化部署场景...资讯# 人工智能4个月前02910
MetaStone-L1-7B – 元石智算推出的轻量级推理模型轻量化模型能够实现本地部署,进一步基于团队的自研量化技术,目前 MetaStone-L1-7B 已支持在手机本地部署。而相对来说,轻量化模型也更能显著降低推理成本,基于团队的自研高效推理技术,每百万 ...资讯# 人工智能5个月前02900