北航团队联合清华大学、香港大学等研究人员,正式发布了突破性的3D动画生成框架AnimaX,并全面开源了项目代码。AnimaX支持处理具有不同骨骼拓扑结构的3D模型,适用各种角色和物体,支持具有任意骨骼结构的多样化关节网格。
AnimaX基于将3D动作表示为多视图、多帧2D姿态图,用联合视频姿态扩散型,结合共享位置编码和模态感知嵌入,确保视频与姿态序列之间的时空对齐,实现高质量的3D动画生成。如人类、动物、家具等。AnimaX的强大能力来源于一个规模庞大的训练数据集,包含了将近16万个不同的动画序列。AnimaX在泛化性、动作保真度和效率方面均达到行业领先水平,为类别无关的3D动画提供可扩展的解决方案。

AnimaX的主要功能
- 任意骨骼结构支持:AnimaX支持处理具有不同骨骼拓扑结构的3D模型,适用各种角色和物体,如人类、动物、家具等。
- 文本驱动的动画:用户基于简单的文本描述指定动画内容,AnimaX根据文本提示生成相应的动画序列。
- 多视图一致性:生成的动画在多个视角下保持一致,确保从不同角度观察时动画的连贯性和真实性。
- 高效生成:AnimaX基于前馈式方法,在短时间内生成高质量的3D动画,大大提高动画制作的效率。
AnimaX的技术原理
- 联合视频姿态扩散模型:AnimaX将3D动作表示为多视图、多帧2D姿态图。支持模型用视频扩散模型的强大动作先验,保持与3D骨骼动画的兼容性。联合视频姿态扩散模型,AnimaX能同时生成视频和对应的2D姿态序列。联合生成策略确保视频和姿态之间的时空对齐。
- 共享位置编码和模态感知嵌入:为确保视频和姿态序列之间的时空对齐,AnimaX引入共享位置编码。编码机制让模型更好地理解和对齐不同模态(RGB视频和姿态图)中的空间信息。模态感知嵌入用在区分不同模态的数据,确保模型正确处理RGB视频和姿态图的差异。
- 多视图一致性:AnimaX引入多视图注意力机制和相机条件嵌入,确保生成的视频在多个视角下保持一致。让模型能学习不同视角之间的空间对应关系,生成一致的多视图视频。
- 3D动作重建和动画:生成的多视图姿态序列基于三角测量方法转换为3D关节位置。用逆向运动学将3D关节位置转换为关节角度,驱动3D模型的动画。
- 大规模数据集训练:AnimaX在新策划的包含16万个绑定序列的数据集上进行训练。数据涵盖多种类别,如人类、动物、家具等,确保模型具有良好的泛化能力。
AnimaX的应用场景
- 游戏开发:快速生成角色和环境的动画,提升开发效率和内容丰富度。
- 影视制作:用在动画电影、视觉效果和虚拟角色的动画生成,增强视觉效果。
- 虚拟现实(VR)和增强现实(AR):生成虚拟角色和动态环境的动画,提升沉浸感和交互体验。
- 广告和营销:创建动态广告和产品展示动画,吸引观众注意力,提高参与度。
- 教育和培训:生成虚拟实验和模拟训练的动画,提升教学和训练效果。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...