豆包怎么快速生成高质量图片豆包的图像生成功能基于先进的 AI 算法,能够根据用户的文字描述快速生成高质量图片,支持多种风格和场景,适用于创意设计、内容创作、学习办公等多种场景。豆包AI绘画功能已升级至2.0版本,其性能显著提升...发现资讯1个月前01680
GitMCP – 免费开源的MCP服务器,可将GitHub仓库转为实时文档中心,提升开发效率GitMCP 是一个免费、开源的服务,通过模型上下文协议(MCP)将GitHub项目无缝转化为AI助手可访问的端点。它支持语义搜索和动态内容获取,无需配置即可实现高效知识交互。无论是代码检索还是文档查...发现资讯1个月前01070
LandPPT – 开源AI PPT文稿生成平台,简化三步工作流LandPPT 是一个基于大语言模型(LLM)的智能演示文稿生成平台,能够自动将文档内容转换为专业的PPT演示文稿。平台集成了多种AI模型、智能图像处理、深度研究功能和丰富的模板系统,让用户能够轻松创...发现资讯1个月前02190
dots.ocr - 小红书hi lab开源的文档解析模型dots.ocr 是小红书 hi lab 开源的多语言文档解析模型,能高效地进行文档布局检测和内容识别,保持良好的阅读顺序。dots.ocr 在 OmniDocBench 上表现出色,文本、表格和阅读...发现资讯1个月前01420
Genie Envisioner——智元机器人发布了业内首个开源的机器人世界模型平台智元机器人发布了业内首个开源的机器人世界模型平台——Genie Envisioner(GE),这一平台的推出标志着机器人学习技术迈出了重要一步。该平台的核心在于其高度集成的闭环架构。其中,GE-Bas...发现资讯1个月前01490
MoE-TTS - 昆仑万维推出的先进语音合成框架,增强语音生成能力MoE-TTS 是昆仑万维语音团队推出的先进语音合成框架,专门用在提升开放域文本描述的语音生成能力。MoE-TTS 基于混合专家(MoE)架构,将预训练的大型语言模型(LLM)与语音专家模块相结合。在...发现资讯1个月前01800
WeKnora – 腾讯开源的基于大语言模型文档理解与语义检索框架WeKnora 是腾讯开源的一款基于大语言模型的文档理解与语义检索框架,专为结构复杂、内容异构的文档场景而打造。支持 PDF、Word、图片等多种格式,能精准解析图文混排内容,提取文本、表格及图像语义...发现资讯1个月前01540
Macaron – 首个Personal AI Agent,你的贴心AI伙伴,个性化生成实用工具—Macaron 是首个 Personal AI Agent,你的贴心AI伙伴。,Macaron不去和 Productivity Agent 争夺办公场景,也不止步于情绪陪伴,而是把自己做成一个长期在...发现资讯1个月前01570
gpt-oss – OpenAI开源的推理模型系列,支持本地微调和定制,满足特定任务需求OpenAI终于放出其传闻已久的开源模型:gpt-oss-120b和gpt-oss-20b。这两款模型均采用MoE架构,与DeepSeek的多款模型类似。这两款模型已经与OpenAI的Response...发现资讯1个月前01380
CosyVoice 2.0 – 阿里开源的升级版语音生成大模型CosyVoice 2.0 是阿里巴巴通义实验室推出的语音生成大模型升级版,旨在通过有限标量量化技术和块感知因果流匹配模型,提升语音合成的质量。在多语言语音生成、零样本语音生成、跨语言语音生成、富文本...发现资讯1个月前01660