up博主

帅气的我简直无法用语言描述!
Claude-Mem – 开源Claude Code记忆插件,开启长期记忆功能

Claude-Mem – 开源Claude Code记忆插件,开启长期记忆功能

Claude-Mem是一款智能插件,旨在为 Claude AI 提供长期记忆功能。该插件能够自动捕获在编码会话期间Claude的所有操作,通过AI进行压缩,并将相关的上下文信息注入未来的会话中,实现持...
2周前
0710
LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型,比同级自回归模型快 2.1 倍

LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型,比同级自回归模型快 2.1 倍

蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开技术报告。LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,打破...
2周前
0970
Genstory – 免费AI故事生成平台,轻松创建睡前故事,

Genstory – 免费AI故事生成平台,轻松创建睡前故事,

Genstory 是基于 Gemini Storybook 技术的免费 AI 故事生成平台,能将用户的简单想法瞬间转化为精美的绘本故事。轻松创建睡前故事,让亲子时光更加温馨。用户可从海量故事库中选择...
2周前
0620
Mulan – AI视频创作平台,实现视频批量生成,小白也能轻松上手

Mulan – AI视频创作平台,实现视频批量生成,小白也能轻松上手

在这个AI视频生成技术日新月异的时代,一个国产新平台——Mulan AI,以其独特的差异化突围。Mulan AI不仅仅是一个简单的文生视频模型,更是一个智能聚合的神奇工具,它彻底打破了传统的工作流程...
2周前
0730
LensGo AI – AI内容创作平台,无需专业剪辑技能,满足多样化创作需求

LensGo AI – AI内容创作平台,无需专业剪辑技能,满足多样化创作需求

随着科技的飞速发展,越来越多的技术工具涌现出来,LensGo凭借其强大的功能和简洁的操作界面,受到了广大用户的青睐。用户可以轻松实现图像的编辑、优化、分享等操作,提升工作效率和创作体验。允许用户通过简...
2周前
01110
Nemotron 3 – 英伟达推出的最新开源AI模型系列,提升推理的准确性和适应性。

Nemotron 3 – 英伟达推出的最新开源AI模型系列,提升推理的准确性和适应性。

英伟达发布了 Nemotron 3 系列开放模型,共三种规模,分别为 Nano、Super 和 Ultra,支持开发者大规模构建和部署可靠的多智能体系统。Nemotron 3 Nano 拥有 300 ...
2周前
0820
商汤开源的首个实时视频生成推理框架–LightX2V ,支持多种视频生成任务

商汤开源的首个实时视频生成推理框架–LightX2V ,支持多种视频生成任务

商汤开源了行业首个能实现实时视频生成的推理框架LightX2V,支持低资源部署,通过DiT蒸馏加速、轻量化 VAE、稀疏注意力等优化,实现低成本、强实时的视频生成。框架支持多种硬件部署,提供 Grad...
2周前
0640
UnityVideo – 港科大联合可灵快手开源的视频生成框架,实现视频内容的多模态解析

UnityVideo – 港科大联合可灵快手开源的视频生成框架,实现视频内容的多模态解析

港科大、港中文、清华大学与快手“可灵”团队联合发布UnityVideo,一个统一多模态与多任务的视频生成框架。框架通过动态噪声注入和模态自适应学习机制,实现 RGB 视频与辅助模态之间的双向学习,加速...
2周前
01050
Wan-Move – 阿里联合清华等开源的运动可控视频生成框架,满足高质量视频创作需求

Wan-Move – 阿里联合清华等开源的运动可控视频生成框架,满足高质量视频创作需求

Wan-Move是由阿里巴巴通义实验室等多机构联合开源的运动可控视频生成框架。该框架以独特的潜在轨迹引导技术为基础,成功实现了视频运动的高质量控制。该框架能够生成长达5秒、分辨率为480p的视频,并且...
2周前
0810
Gemini TTS – 谷歌推出的AI文本转语音模型,支持单人或多人语音合成

Gemini TTS – 谷歌推出的AI文本转语音模型,支持单人或多人语音合成

Gemini TTS 是谷歌推出的先进AI文字转语音技术,最新版本为 Gemini 2.5 Flash 和 Pro 模型。新版本增强了模型的表现力、节奏控制和多说话人一致性,旨在满足内容创作者、开发者...
2周前
01160