SkyReels-A3 – 昆仑万维推出的数字人视频生成模型,支持长达60秒的单分镜视频输出昆仑万维首先发布了SkyReels-A3,这款音频驱动的人像视频生成模型通过简单的操作,可以生成逼真的视频效果。该模型通过上传一张照片并为其配音,便能实现人物的口型、表情和动作的精准匹配。可以为现有视...发现资讯3个月前02860
最新开源的轻量级文本转语音模型–KittenTTS ,无需联网即可生成语音,适合离线场景。KittenTTS是一款开源的轻量级文本转语音(TTS)模型,是发布的新款开源文本转语音模型 ——Kitten TTS。这一模型的设计目标是实现高质量的语音合成,同时保持轻量级和高效能,适合在各种设备...发现资讯3个月前02480
Cursor CLI – Cursor推出的AI命令行工具,可快速完成代码补全、调试建议、Bug修复等任务Cursor CLI – Cursor推出的AI命令行工具,为开发者带来一种全新的命令行AI编程体验。这款工具的推出,意味着在没有图形界面的环境中,例如远程Linux服务器、Docker容器或云端开发...发现资讯2个月前03550
8个GitHub爆火的免费大模型教程,助你快速进阶AI编程!AI大模型正在以前所未有的速度重塑我们的工作与生活。经常有小伙伴们的提问:"有没有好的大模型学习资源推荐?"、"如何快速入门大模型开发?"今天跟大家推荐几个颇为实用且有趣的开源工具,主打简单易用且高效...发现资讯3个月前02790
DeepFig一键生成图文视频,多模态内容创作平台深夜1点,小李的第5杯咖啡早已凉透。 屏幕上的剪映工程文件、Canva设计稿、Word脚本挤满了桌面,她正第8次调整图文笔记的封面色调——前7版因风格不统一被粉丝吐槽“像拼凑的广告”。 新买的粉底液在...发现科技3个月前02780
豆包怎么快速生成高质量图片豆包的图像生成功能基于先进的 AI 算法,能够根据用户的文字描述快速生成高质量图片,支持多种风格和场景,适用于创意设计、内容创作、学习办公等多种场景。豆包AI绘画功能已升级至2.0版本,其性能显著提升...发现资讯3个月前03560
GitMCP – 免费开源的MCP服务器,可将GitHub仓库转为实时文档中心,提升开发效率GitMCP 是一个免费、开源的服务,通过模型上下文协议(MCP)将GitHub项目无缝转化为AI助手可访问的端点。它支持语义搜索和动态内容获取,无需配置即可实现高效知识交互。无论是代码检索还是文档查...发现资讯3个月前02880
LandPPT – 开源AI PPT文稿生成平台,简化三步工作流LandPPT 是一个基于大语言模型(LLM)的智能演示文稿生成平台,能够自动将文档内容转换为专业的PPT演示文稿。平台集成了多种AI模型、智能图像处理、深度研究功能和丰富的模板系统,让用户能够轻松创...发现资讯3个月前04660
dots.ocr - 小红书hi lab开源的文档解析模型dots.ocr 是小红书 hi lab 开源的多语言文档解析模型,能高效地进行文档布局检测和内容识别,保持良好的阅读顺序。dots.ocr 在 OmniDocBench 上表现出色,文本、表格和阅读...发现资讯3个月前03300
Genie Envisioner——智元机器人发布了业内首个开源的机器人世界模型平台智元机器人发布了业内首个开源的机器人世界模型平台——Genie Envisioner(GE),这一平台的推出标志着机器人学习技术迈出了重要一步。该平台的核心在于其高度集成的闭环架构。其中,GE-Bas...发现资讯3个月前03270