TokenFD –上交联合美团推出图文对齐粒度的新突破 ,远超现有模型。TokenFD是上海交通大学联合美团推出的细粒度图文对齐基础模型,主要用于文档理解任务。通过Token级对齐,实现了图像Token与语言Token在同一特征空间中的共享,支持Token级图文交互,在处...资讯# 人工智能4个月前04220
Dify-Plus – Dify 二次开发多项新功能,企业级增强版项目 Dify-Plus 二次开发引入了多项新功能与优化,并精心打造,旨在提升用户体验和系统效能。新增功能包括用户额度管理,通过对话余额限制判断和异步计算用户额度逻辑,以满足企业级应用的需求。确保更专业和...资讯# 人工智能4个月前04130
Noiz AI 最新AI语音克隆与合成工具,快速生成多语言配音Noiz AI是一款先进的人工智能语音合成平台,通过自主研发的大规模语音模型,提供逼真、自然且高度定制的语音内容。平台能够高效完成语音克隆、多语言配音和内容翻译,大幅降低创作成本与周期。能根据用户上传...资讯# 人工智能4个月前04130
喜娜AI助手 – 新浪财经APP推出的AI智能助手AI时代,资讯信息迎来爆炸性增长,用户每天都要面对海量资讯,这对摄入信息的效率带来了巨大挑战。新浪财经最新上线的AI公告解读系统已实现对上市公司公告的深度解析,借助深度学习模型,不仅能精准提炼核心信息...资讯# 人工智能4个月前04130
Kuli Kuli – AI翻译应用,能即时翻译多种语言的菜单Kuli Kuli翻译软件凭借其精湛的专业翻译能力、人性化的设计和全方位的功能特性,已成为餐饮界不可或缺的全球化语言助手,真正实现了全球美食无国界的美好愿景。 Kuli Kuli是什么 Kuli Ku...资讯# 人工智能4个月前04050
Stable Virtual Camera – Stability AI 等机构推出新型 AI 模型,2D图像转3D视频近日,科技界迎来了一项创新突破,Stability AI 公司推出了一款名为 Stable Virtual Camera 的全新人工智能模型,该模型能够将2D图像转换为具有真实深度和透视感的3D视频...发现# 人工智能4个月前04020
Umi-OCR –开源.离线. 免费 的 文字识别工具,支持截图、批量图片排版解析对于需要处理大量图片的用户来说,Umi-OCR的批量处理功能无疑是一大福音。Umi-OCR还具备简洁易用的界面和操作流程。用户只需下载并解压软件包,就可以在没有网络的环境下运行该工具。无论是截图识别...资讯# 人工智能4个月前03990
GR00T N1 – 英伟达全球首个开源的人形机器人基础模型GR00T N1是全球首个面向通用人形机器人的开放基础模型。它不仅拥有理解视觉与语言指令的“智慧之眼”,还能通过实时生成流畅动作的“敏捷之手”,在复杂多变的环境中完成多样化任务。NVIDIA 将对这一...资讯# 人工智能4个月前03990
《Manus没有秘密》全部精华“真正推动进步的,不是已知领域的重复建设,而是对未知疆域的勇敢探索。 《Manus没有秘密》由明浩老师撰写的解读 AI Agent 的70页PPT,主要介绍了 AI Agent(智能体)技术从L1到L...资讯# 人工智能4个月前03990
SVG Converter – 免费的图像转换矢量格式工具,一键秒变高清矢量图SVG Converter是在线矢量化工具,支持将多种位图图像(如JPG、PNG、BMP等)快速转换为矢量图形(如SVG、AI、EPS、PDF等)。SVG Converter支持多种文件格式,具备高质...资讯# 人工智能4个月前03970