Lumine – 字节跳动推出的3D开放世界通用AI智能体,提升自主思考和操作能力字节推出的Lumine框架,能在3D开放世界中进行实时推理与感知,为探索未知领域提供了强大的技术支持。该智能体基于qwen2-vl-7b-base模型构建,采用类人交互方式,将视觉感知、逻辑思考与操作...发现10小时前0110
Code Wiki – Google推出的AI代码文档生成工具,自动化生成和更新代码文档Google 推出 Code Wiki,一款 AI 代码文档生成工具,能够自动分析 GitHub 代码仓库并生成结构化的 Wiki 文档。该工具自动绘制调用关系和组件关系图,并在代码更新时同步更新文档...发现11小时前090
InfinityStar – 字节跳动推出的高效视频生成模型,5秒视频时间缩短至仅58秒字节跳动宣布推出全新 InfinityStar 框架,采用统一的时空自回归架构,能够实现高分辨率图像与动态视频的快速合成。该框架显著提升了视频生成效率,将生成5秒720p 视频的时间缩短至仅58秒。这...发现11小时前0140
Bee – 清华联合腾讯开源的全栈多模态大模型解决方案,项目1500万规模的监督微调数据集Bee 清华联合腾讯开源的全栈多模态大模型解决方案目,旨在通过结合清华大学的科研成果和腾讯的技术实力,推动多模态数据处理和人工智能技术的广泛应用。Bee不只是一个模型,它是一套全栈式、完全开放的解决方...发现2天前0220
SIMA 2 – 谷歌DeepMind推出的最新一代AI智能体,响应时间压缩到200毫秒以内SIMA 2是谷歌DeepMind开发的一个智能体,它具备观看屏幕和操作虚拟键盘与鼠标的能力,能够在复杂的3D环境中进行推理与学习。采用“Gemini-SIMA Fusion”三层架构,包括决策中枢...发现2天前0370
NocoBase – 开源AI无代码开发平台,支持 Docker 一键部署通过配置完成应用开发NocoBase 是一款基于开源协议的无代码开发平台,它允许用户通过可视化操作,无需编写代码即可快速构建和管理数据库,并在此基础上搭建应用程序,根据实际需求进行个性化定制开发,支持以多种 API 协议...发现2天前0280
ERNIE-4.5-VL – 百度文心开源的新一代多模态AI模型,新增视觉定位与”图像思考”功能百度文心4.5系列模型重磅开源,其中 ERNIE-4.5-VL 视觉语言模型(ERNIE-4.5-VL-28B-A3B;ERNIE-4.5-VL-424B-A47B)以卓越的图文视频理解能力,支持10...发现2天前0470
Kosong – 月之暗面开源的全新AI Agent开发框架,开发者可以灵活切换或混合使用多种AI模型月之暗面(Moonshot AI)开源全新AI代理开发框架 Kosong,为构建下一代智能体应用提供轻量、灵活且高度可扩展的底层支持。其核心特性包括异步工具编排、插件化设计和开箱即用的Python支持...发现2天前0430
百度最新推出的AI语言大模型–文心 5.0 Preview ,精准执行复杂指令百度宣布文心大模型5.0-Preview在LMArena文本排行榜上排名全球第二、国内第一,超越GPT-5-High等主流模型。模型在创意写作、复杂长问题理解和指令遵循等任务中表现出色,能高效生成高质...发现6天前0630
LocalAI – 开源的本地AI推理框架,本地构建和部署自主 AgentLocalAI是开源的本地 AI 推理框架,提供完整的本地化 AI 解决方案,旨在为用户提供完整的离线人工智能解决方案。它支持多种多模态模型,涵盖文本生成、图像创作、语音识别与合成等功能,并完全兼容 ...发现7天前0400