可灵2.6 – 快手可灵推出音画同出的AI视频生成模型，支模型持文生音画和图生音画两种模式

可灵推出视频生成2.6模型，该模型提供了里程碑式的“音画同出”能力，彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程，用户仅需输入一段文字或一张图片，即可自动产出融合自然语音、精准音效与沉浸式环境声的高质量视频内容。自动生成包含自然语音、匹配音效和环境氛围的视频。模型在音画协同、音频质量和语义理解方面都有显著提升，简化创作流程，支模型持文生音画和图生音画两种模式，极大地扩展了AI视频创作的应用范围。

31f60297956d6e8d5273e300d53dce34 可灵 2.6 在音色和动作方面进行了重大升级。新增音色控制功能，实现角色专属声线定制与多角色对话，确保配音一致性。同时推出动作控制功能，可轻松掌控30秒内复杂动作、表情和手势，支持高难度动作一镜到底，为创作带来更多自由和可能。

音画协同：模型实现对画面动态与声音节奏的深度对齐，解决传统生成模式中的违和感，避免“画面一套、声音一套”的割裂体验。
音频质量：模型的声音生成能力得到全方位升级，支持人声、音效、环境声等多类型声音生成，生成的音频音质更干净、层次更丰富，整体听感更接近真实的混音效果。
语义理解：模型大幅提升对复杂输入的解析能力，能更准确地把握创作者意图，输出逻辑更严密、更贴合用户需求的音画内容。
创作流程升级：提供“文生音画”和“图生音画”两种创作路径，简化从文本或图片到音视频内容的生成过程。
音色控制：可灵 2.6 新增音色控制，实现角色专属声线一键定制，确保配音从头到尾声线一致，并支持多场景应用，通过指令驱动实现多角色轻松对话。
动作控制：可灵 2.6 升级动作控制，可实现 30 秒内复杂动作（如武打、舞蹈等）的完整呈现，全身动作与细节高度同步，支持一镜到底输出，动作表现更加流畅自然。

下载或访问：访问可灵官网或下载可灵AI APP，完成账号登录。
选择创作路径：根据需求选择“文生音画”或“图生音画”的创作路径。
- 文生音画：输入文本，生成视频。
- 图生音画：上传图片或文本，生成音视频。
输入或上传内容：
- 在“文生音画”模式下，输入你想要生成视频的文本描述。
- 在“图生音画”模式下，上传想要添加声音的图片或已有的视频。
调整设置：根据需要调整视频的设置，如语音风格、音效、环境音等。
生成视频：点击生成按钮，等待AI处理生成视频。
预览和编辑：生成后预览视频，如果需要，进行进一步的编辑和调整。
导出和分享：完成编辑后，导出视频分享到需要的平台。