SmolDocling – 轻量级的多模态文档处理模型,0.35秒解锁全文档奥秘!最近 IBM 和 Hugging Face 的研究人员联合推出了一个新的小型视觉-语言模型 SmolDocling,这款专为文档转换任务而设计的模型,轻量级、高速且支持完整文档OCR的多模态视觉语言模...资讯# 人工智能1个月前01600
o1-pro – OpenAI 重磅推出的升级版推理模型人工智能研究公司OpenAI近日宣布,已在其开发者API中推出一款名为o1-pro的全新“推理”AI模型,具备强大的计算能力和多模态输入支持。o1-pro是增强版本,使用更多的计算来思考更难的问题,并...资讯# 人工智能1个月前01530
OpenBioMed – 清华AIR联合水木分子推出的开源Agent平台OpenBioMed的智能体平台低调亮相,率先对外开源开放。作为全球首个AI制药领域的智能体开源平台,生命科学领域、制药领域的研发人员人人可用。 OpenBioMed是什么 OpenBioMed 是清...资讯# 人工智能1个月前01520
SVG Converter – 免费的图像转换矢量格式工具,一键秒变高清矢量图SVG Converter是在线矢量化工具,支持将多种位图图像(如JPG、PNG、BMP等)快速转换为矢量图形(如SVG、AI、EPS、PDF等)。SVG Converter支持多种文件格式,具备高质...资讯# 人工智能1个月前01470
文赋Ai论文 – AI论文热门好用写作工具,精准挖掘研究热点提供个性化选题人工智能技术正在以爆炸式的速度改变我们的生活。AI可以用于搭建框架、扩充思路;或者在查找文献时,可以提出更具体的要求,如要求外国权威文献、特定年份发布、必须真实等;在思路匮乏时,可以将自己写的内容交给...资讯# 人工智能1个月前01440
Step-Video-TI2V –阶跃星辰推出开源 图生视频模型阶跃星辰Step-Video-TI2V图生视频模型开源】支持生成102帧、5秒、540P分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。Step-Video...资讯# 人工智能1个月前01390
Oracle – Flowith 推出的通用型 AI Agent在这个AI飞速进化的时代,将基础能力转化为真正有价值的产品体验,需要的是对人机协作本质的深刻理解和对产品细节的极致追求。 Oracle是什么 Oracle 是 Flowith 团队推出的AI Agen...资讯# 人工智能1个月前01380
UniFluid – 谷歌联合麻省理工新推出的多模态视觉生成与理解统一自回归框架随着AI技术的进一步发展和完善,我们可以看到更多令人惊叹的应用,如更精确的图像编辑工具、更智能的视觉内容创作辅助工具等等。也可以激发更多人探索自回归模型在视觉任务中的潜力,推动 AI 在理解和生成视觉...资讯# 人工智能1个月前01370
Maestro –开源的端到端自动化测试框架Maestro 是专为移动和 Web 应用设计的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制,解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法,无需编译快速迭代。Maes...资讯# 人工智能1个月前01350
GR00T N1 – 英伟达全球首个开源的人形机器人基础模型GR00T N1是全球首个面向通用人形机器人的开放基础模型。它不仅拥有理解视觉与语言指令的“智慧之眼”,还能通过实时生成流畅动作的“敏捷之手”,在复杂多变的环境中完成多样化任务。NVIDIA 将对这一...资讯# 人工智能1个月前01340