Genie Envisioner – 智元推出的首个机器人世界模型开源平台智元机器人推出面向真实世界机器人操控的统一世界模型平台Genie Envisioner(GE)。这一突破性技术让机器人首次能够在虚拟数字环境中进行预演练习,掌握技能后再执行实际任务,大幅降低实体调试风...发现资讯3个月前03130
8个GitHub爆火的免费大模型教程,助你快速进阶AI编程!AI大模型正在以前所未有的速度重塑我们的工作与生活。经常有小伙伴们的提问:"有没有好的大模型学习资源推荐?"、"如何快速入门大模型开发?"今天跟大家推荐几个颇为实用且有趣的开源工具,主打简单易用且高效...发现资讯3个月前03130
MindGPT 3.1 – 理想同学推出的端到端Agent模型,支持在推理过程中同步调用工具,实现边推理边搜索MindGPT 3.1正式上线,该模型创新性地将智能体能力融入大模型,升级为端到端智能体模型,目前已适配理想同学PC端及App V1.5.0版本。MindGPT 3.1核心升级在于“边想边搜”功能,深...发现资讯3个月前03100
HeyGen一在线视频创作平台HeyGen是一个在线视频创作平台,专注于利用人工智能技术生成数字人视频。它利用生工智能的力量来简化您的视频创作过程。用HeyGen释放你的创造力-视频制作的未来。HeyGen支持40多种语言和不同的...发现资讯2个月前03070
SkyReels-A3 – 昆仑万维推出的数字人视频生成模型,支持长达60秒的单分镜视频输出昆仑万维首先发布了SkyReels-A3,这款音频驱动的人像视频生成模型通过简单的操作,可以生成逼真的视频效果。该模型通过上传一张照片并为其配音,便能实现人物的口型、表情和动作的精准匹配。可以为现有视...发现资讯3个月前03040
扣子空间升级,扣子PPT新推出的AI一键生成PPT服务,自动优化排版字节全面开放的首个通用 Agent「扣子空间」的 AI 播客能力在播客圈刷屏了I。扣子PPT是扣子空间推出的AI一键生成PPT服务,能生成高质量精美PPT。用户只需输入主题或上传相关资料,AI会自动完...发现资讯4个月前03040
Wan2.2-S2V – 阿里通义开源的多模态视频生成模型,支持不同分辨率场景的视频生成需求阿里通义万相正式开源全新多模态视频生成模型通义万相Wan2.2-S2V,用户仅需一张静态图片和一段音频,即可通过该模型生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。不仅限于口型动作,还能...发现资讯2个月前03030
Klear-Reasoner - 快手开源的8B推理模型,专注于提升数学和代码推理能力Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,专注于提升数学和代码推理能力。模型通过长思维链监督微调(long CoT SFT)和强化学习(RL)训练,核心创...发现资讯3个月前03030
MobileCLIP2 – 苹果开源的端侧多模态模型,提高模型对不同模态数据的适应性苹果公司的研究人员最近推出了 MobileCLIP2,该模型在GitHub和Hugging Face上进行了开源,提供了预训练权重和数据生成代码,以供开发者使用。MobileCLIP2通过改进多模态增...发现资讯2个月前02980
Deepfig PPT设计引擎,5分钟生成专业级提案在分秒必争的商业世界,一份出色的演示文稿是赢得客户、打动投资人的关键。然而,精美的背后往往是市场、销售、咨询等专业人士数小时的繁琐劳作。Deepfig的出现,正是为了彻底终结这一痛点。 一、核心痛点...发现科技3个月前02980