AI Agent 音乐视频制作

使用 AI Agent 一键生成完整音乐视频

👉 立即使用 AI Agent

什么是 AI Agent?

AI Agent 是您的智能视频导演助手。只需上传歌曲音频,AI 会自动分析歌词、规划场景、生成画面,最终合成一个完整的音乐视频。无需专业技能,让您的音乐作品完美视觉化。

核心工作流程

第一步:创建项目

  1. 输入创意描述(提示词),说明您想要的视觉风格
  2. 上传您的完整歌曲音频
  3. 选择画面尺寸、分辨率和时长

第二步:AI 自动分析

AI Agent 会自动:

  • 转录歌词内容
  • 根据歌词情感和节奏划分场景
  • 为每个场景生成专业级提示词

第三步:生成参考图(重要)

[!IMPORTANT] 强烈建议先生成参考图!

在「分镜面板」中,您可以为每个场景生成预览图片。确认画面效果符合预期后,再进行视频生成。这样可以:

  • 确保画面与您的创意一致
  • 避免因期望不符导致的积分浪费
  • 更精准地控制视频效果

第四步:一键生成视频

确认所有场景的参考图后,点击「全部生成」按钮,AI 会自动为每个场景创建视频片段。

第五步:合成成片

所有场景视频生成后,AI 会自动将它们与您的音频合并,生成完整的音乐视频。


模式说明

自动模式

开启「自动模式」后,AI 会在分析完歌词后自动开始生成所有场景,无需手动确认。

适用场景:

  • 对 AI 创作有信心
  • 希望快速获得成品
  • 不需要逐一调整每个场景

手动模式(推荐新手使用)

关闭「自动模式」后,您可以在每个环节进行审核和调整:

适用场景:

  • 需要精确控制每个画面
  • 希望逐一确认场景效果
  • 对视觉效果有较高要求

设置指南

选择合适的分辨率

[!IMPORTANT] 分辨率在创建项目时确定,后续所有场景都将使用该分辨率,无法中途更改。

分辨率说明积分消耗
720p画质清晰,性价比高10 积分/秒
1080p高清画质,效果出众15 积分/秒

[!TIP] 如果您希望节省积分,建议选择 720p 分辨率。720p 画质已足够满足大多数场景需求。

选择画面尺寸

尺寸适用场景
横屏 (16:9)YouTube、电脑播放、传统 MV
竖屏 (9:16)抖音、小红书、Instagram

设置视频时长

您可以选择音频的特定片段,或使用全部时长:

  • 5秒 - 60秒:快速预览效果或制作短片段
  • 完整时长:使用整首歌曲

提示词撰写技巧

在创建项目时,您的提示词应描述整体视觉风格。关于提示词的详细撰写技巧,包括:

  • 提示词的核心要素(主体、动作、环境、风格)
  • 好提示词 vs 坏提示词对比
  • 运镜描述技巧
  • 时间标记(多镜头模式)
  • 叙事节奏指南

请参阅 AI 视频生成器 - 提示词指南

[!TIP] 在分镜面板中,您可以为每个场景单独调整提示词。确保各场景的视觉风格保持连贯统一。


分镜面板使用

预览与调整

每个场景卡片显示:

  • 时间范围(如 0:00 - 0:05)
  • 对应歌词片段
  • 图片提示词
  • 视频动作提示词

您可以:

  • 点击「生成图片」预览单个场景效果
  • 编辑提示词后重新生成
  • 确认满意后再生成视频

批量操作

  • 全部生成:一键生成所有待处理场景的视频
  • 合并视频:将所有场景合成为完整音乐视频

积分消耗

Agent 功能的积分消耗包括:

操作积分消耗
音频分析1 积分
生成参考图4 积分/张
生成视频(720p)10 积分/秒
生成视频(1080p)15 积分/秒
合并成片免费

计算示例:

一首 60 秒的歌曲,分为 12 个场景(每个 5 秒):

  • 参考图:12 × 4 = 48 积分
  • 视频(720p):60 × 10 = 600 积分
  • 总计:约 648 积分

常见问题

生成的视频和预期不符怎么办?

建议:

  1. 先为每个场景生成参考图片
  2. 确认图片效果符合预期
  3. 如不满意,调整提示词后重新生成图片
  4. 所有参考图确认后,再生成视频

[!TIP] 使用图片生成视频(图生视频)比纯文字生成视频效果更稳定、更可控。

如何避免浪费积分?

  1. 先用低分辨率:使用 720p 制作草稿
  2. 先看参考图:生成图片比视频便宜得多
  3. 避免重复生成:确认提示词满意后再生成
  4. 完整上传音频:让 AI 自动分析比手动设置更准确

视频生成需要多久?

  • 单个场景:1-2 分钟
  • 完整项目(如 12 场景):15-30 分钟
  • 合并成片:1-3 分钟

[!WARNING] 生成过程中请勿关闭页面。生成的视频链接有效期为 1 小时,请及时下载保存!


最佳实践总结

  1. 上传完整音频,让 AI 分析歌词并自动规划场景
  2. 先生成参考图,确认画面效果后再生成视频
  3. 选择合适分辨率,720p 性价比高,1080p 画质更佳
  4. 检查每个场景的提示词,确保视觉风格连贯统一
  5. 一次生成所有场景,点击「全部生成」批量处理