Mini DALL·E 3 – 北京理工大学联合多所高校推出的交互式文生图框架,提升人机交互的便捷性和图像生成质量。Mini DALL·E 3是由北京理工大学联合多所高校开发的交互式文生图框架,通过多轮对话实现高质量图像生成与编辑,结合LLM和T2I模型技术,无需额外训练即可生成符合描述的图像。支持通过对话生成、编...资讯2个月前01190
DreamActor-M1 – 字节跳动推出的 AI 图像动画框架DreamActor-M1是字节跳动研发的AI图像动画框架,旨在通过深度学习技术将静态图像转化为动态、逼真的动画。该框架结合了先进的生成式AI模型与多模态数据处理能力,能够精准捕捉图像中的细节特征,并...资讯2个月前04360
Augment Agent – Augment Code最新 推出的 AI 编程助手,自主编写、修改、运行和调试代码Augment Agent是由Augment Code公司开发的一款AI驱动的软件开发智能体。它旨在自动化和执行软件开发。专为大型代码库设计,拥有20万token的上下文窗口,可处理数百万行代码项目...资讯2个月前01460
PaperBench – OpenAI 开源的 AI 智能体评测基准,支持深度调优,追踪每个细节OpenAI推出AI智能体评估基准PaperBench,标准化平台助力客观衡量智能体复现前沿研究的能力,提升科研可信度与透明度。通过复现学术论文全流程,评估智能体的理论理解、代码实现和实验执行能力。采...资讯2个月前01820
Genspark – 超级AI 智能体引爆海外,提供深度搜索、自动规划和执行复杂任务Genspark,作为一个通用 AI 智能体,旨在通过深度搜索、自动规划以及执行任务,为用户提供高效、智能的解决方案。下面,我将详细介绍这款智能体。Genspark Super Agent突破性实现...资讯2个月前02340
Dolphin – 清华联合海天瑞声推出的语音识别大模型,支持多种语言和方言的识别清华大学和海天瑞声联手开源了 Dolphin 语音识别模型,这款新模型, 是专门为东方语言设计的 ASR 模型,不仅支持 40 种东方语言 和 22 种汉语方言,以轻量级的设计和极高的精准度 ,支持多...资讯2个月前01920
EasyControl Ghibli – 免费快速生成吉卜力风格图像的 AI 神器,能生成高质量且多样化的图像EasyControl Ghibli,一个开源的、能将你照片瞬间变成吉卜力风格治愈画面的魔法工具。无需付费,即可轻松生成带有吉卜力风格的图像。用户只需上传照片或输入简单指令,模型便能迅速生成带有吉卜力...资讯2个月前02430
斯坦福大学推出的世界生成模型统一评估基准– WorldScore ,支持多模态内容生成任务近日,斯坦福大学视觉与学习实验室团队发布全球首个世界生成模型统一评估基准 WorldScore。涵盖了三大类评估指标,动态静态都有涉及,其数据集中包含了3000个测试样例。WorldScore将3D场...资讯2个月前01550
DeepSite – 基于 DeepSeek 开源的 AI 前端开发工具,一键生成游戏/网页代码DeepSite是基于DeepSeek-V3模型的在线开发工具,用户无需配置环境或安装软件,在网页上直接输入需求即可快速生成游戏、应用或网页的代码。通过自然语言描述自动生成游戏/网页代码并实时预览,采...资讯2个月前01580
SWEET-RL – Meta 推出的多轮强化学习新框架,解决大型语言模型复杂难题随着大语言模型的发展,科技界迎来了一项新的突破,Meta AI 公司携手加州大学伯克利分校,合作推出名为 SWEET-RL 的强化学习框架,旨在解决大型语言模型(LLM)在多轮人机协作任务中的信用分配...资讯2个月前01450