OmniSQL 是 开源文本到 SQL 模型,自然语言高效转换为 SQL 查询语句
OmniSQL 是开源的文本到 SQL 模型,将自然语言问题高效转换为 SQL 查询语句。通过创新的数据合成框架生成了全球首个百万量级的文本到 SQL 数据集 SynSQL-2.5M,包含 250 万...
Vibe Draw – AI 3D建模工具,草图一键转3D神器
随着人工智能的发展,一款名为Vibe Draw的人工智能工具在社交媒体上引发热议,因其能够将简单的草图转化为可交互的3D模型,尤其被认为在儿童教育领域具有广阔的应用前景。Vibe Draw发展核心功能...
ObjectMover – 港大联合 Adobe 推出的新型图像编辑工具
ObjectMover 是香港大学和 Adobe Research 联合推出的新型图像编辑模型,通过先进的计算机视觉和机器学习技术,提供更加智能和灵活的图像编辑工具。可将图像中的物体移动到指定位置,自...
RoboOS – 智源研究院发布首个跨本体具身大小脑协作框架
RoboOS跨本体具身大小脑协作框架与开源具身大脑RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能。在RoboOS的分层架构下,具身大脑RoboBrain的复...
RoboBrain – 智源研究院发布首个开源的具身大脑模型
智源研究院发布首个跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,预测每一步的轨迹并感知相应的可操作区域。可实现跨场景多任务轻量化快速部署与跨本体协作。具身大脑RoboBrain...
Math24o – SuperCLUE 开源的高中奥数竞赛推理测评基准
Math24o是首个针对高中奥数竞赛的中文大模型测评基准,通过标准化提示词要求模型将最终答案放入格式,配合自动化评估脚本,可客观量化不同模型在复杂数学推理任务上的表现。通过格式强制规范输出,程序自动比...
ChatAnyone – 阿里通义推出的实时肖像视频生成框架,支持多样化的面部表情和风格
ChatAnyone是阿里巴巴通义实验室研发的实时风格化肖像视频生成框架。该框架能够通过音频输入,支持实时交互,适用于视频聊天等应用场景。实现了从静态图像到动态视频的智能化转换。通过音频输入,生成具有...
PaddleSpeech – 最前沿学习模型和技术平台,百度飞桨团队开源的语音处理工具
PaddleSpeech是一个基于百度飞桨(PaddlePaddle)框架的开源项目,旨在为语音技术和音频处理领域提供一系列先进的深度学习模型。自诞生之日起便致力于推动语音技术的发展与普及,它不仅是语...
Rodin
Rodin是影眸科技推出的一款创新AI 3D生成工具,专注于高质量3D资产的创作,展现出在游戏开发领域的巨大潜力。通过独特的AI技术,Rodin能够直接生成3D模型,并利用2D图像进行升维处理,简化了...
Kimi PPT助手
Kimi PPT助手是一款由月之暗面与AiPPT共同推出的一键式PPT生成服务。它能够通过用户的语音或文字指令,快速理解需求并自动创建幻灯片,提供布局和色彩搭配建议,为用户在PPT制作过程中节省时间...









