资讯 | 第268页

排序

智谱正式发布并开源 GLM-OCR。据介绍，该模型仅 0.9B 参数规模，支持 vLLM、SGLang 和 Ollama 部署，模型基于GLM-V架构，集成自研CogViT视觉编码器与轻量跨模态连接层...

1个月前

04720

字节跳动Seed团队推出3D生成大模型——Seed3D 1.0，实现从单张图像到高质量仿真级3D模型的端到端生成。仅需一张任意视角的二维图像，即可生成一个包含精细几何结构、高保真纹理贴图以及基于物理渲...

5个月前

04650

谷歌与伦敦大学学院（UCL）合作推出的“AI研究基础”（AI Research Foundations）课程是一套免费的、面向大学水平的学习资源，旨在通过实用的、专门构建的内容，赋予学习者进行高影响力...

4个月前

04510

RealVideo是一种流行的视频压缩和传输格式，用于在互联网上传输视频内容。核心功能覆盖文本输入交互、AI语音响应、唇形同步、WebSocket实时双向通信等。该技术能够根据网络带宽和用户设备性能的...

3个月前

04460

微软开源了新一代AI工具TRELLIS.2，一个具备40亿参数的大型3D生成模型。专注于从单张图片高效生成高质量3D资产。该模型解决了如何生成具有复杂拓扑结构和锐利特征的3D物体，以及如何还原逼真的物...

3个月前

04010