up博主

帅气的我简直无法用语言描述!
SmolDocling – 轻量级的多模态文档处理模型,0.35秒解锁全文档奥秘!

SmolDocling – 轻量级的多模态文档处理模型,0.35秒解锁全文档奥秘!

最近 IBM 和 Hugging Face 的研究人员联合推出了一个新的小型视觉-语言模型 SmolDocling,这款专为文档转换任务而设计的模型,轻量级、高速且支持完整文档OCR的多模态视觉语言模...
5个月前
03940
Zoom新 推出的 智能 助手AI Companion ,具有记忆、推理、任务执行和协调能力

Zoom新 推出的 智能 助手AI Companion ,具有记忆、推理、任务执行和协调能力

Zoom公布,推出代理式AI Companion功能,并于现有的Zoom AI Companion及其他人工智能(AI)功能进行升级。利用推理及记忆来采取行动并协调任务执行,包括对话式自助服务、并支持...
5个月前
04100
Cube 3D – Roblox 推出的 AI 3D 生成模型,提高3D创作效率

Cube 3D – Roblox 推出的 AI 3D 生成模型,提高3D创作效率

Roblox 宣布开源发布 Cube 3D 工具,这是一种全新的三维基础模型,旨在为用户提供一种全新的创作方式。通过 Cube 3D,用户可以在 Roblox 平台上直接利用基于文本的提示来创建三维物...
5个月前
03900
LangManus –开启AI自动化框架,多智能体协同完成步骤复杂任务

LangManus –开启AI自动化框架,多智能体协同完成步骤复杂任务

在人工智能和自动化技术不断发展的今天,如何高效地将多个工具和智能体结合在一起,以完成复杂的任务,成为了众多开发者的挑战。LangManus 作为一款刚开源的 AI Agent 工具,凭借其强大的大语言...
5个月前
03480
draw.io – 免费在线绘图工具,快速创建各种图表

draw.io – 免费在线绘图工具,快速创建各种图表

今天,我们要介绍的是一款备受推崇的在线绘图工具——draw.io。凭借其出色的易用性、全面的功能、灵活的存储选项以及强大的协作能力,已成为用户创建和管理图表的首选工具。无论是用于工作、学习还是个人创意...
5个月前
03160
Noiz AI 最新AI语音克隆与合成工具,快速生成多语言配音

Noiz AI 最新AI语音克隆与合成工具,快速生成多语言配音

Noiz AI是一款先进的人工智能语音合成平台,通过自主研发的大规模语音模型,提供逼真、自然且高度定制的语音内容。平台能够高效完成语音克隆、多语言配音和内容翻译,大幅降低创作成本与周期。能根据用户上传...
5个月前
04850
Chirp 3 – 谷歌云重磅推出的高清语音模型

Chirp 3 – 谷歌云重磅推出的高清语音模型

谷歌云在伦敦的DeepMind总部推出了高清语音模型Chirp3。该模型通过 Vertex AI 统一机器学习平台向开发者开放,提供了丰富的开发工具,助力程序的创新。 Chirp 3 将为 31 种语...
5个月前
03090
昆仑万维开源Skywork R1V 多模态思维链推理模型,众多主流模型中脱颖而出

昆仑万维开源Skywork R1V 多模态思维链推理模型,众多主流模型中脱颖而出

昆仑万维宣布正式开源Skywork R1V多模态视觉思维链推理模型,并即日起开源模型权重和技术报告。Skywork团队设计了一种灵活在R1V中扩展语音理解模态的方式,从而实现一个全模态思考大模型,该在...
5个月前
04550
Claude 3.7 Max – Cursor 上线的最新最强 大AI 模型,支持200k上下文

Claude 3.7 Max – Cursor 上线的最新最强 大AI 模型,支持200k上下文

Claude Max已正式登陆Cursor平台,这款基于Claude3.7的新型AI模型带来了革命性的突破,特别在处理大规模代码项目方面展现出卓越能力。 据悉,Claude Max搭载了最新的Clau...
5个月前
04770
Hunyuan3D 2.0 – 腾讯推出的大规模 3D 资产生成系统

Hunyuan3D 2.0 – 腾讯推出的大规模 3D 资产生成系统

Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型。系统采用两阶段生成流程:首先生成无纹理的几何模型,再合成高分辨率纹理贴图。包含两个核心...
5个月前
05250