如何用AI制作“小动物运动会”创意视频:从提示词到配音全流程教程

大家好,今天这篇文章将完整分享如何利用多种AI工具,制作一个充满趣味和创意的“小动物运动会”短视频。整个流程包括:

  • 提示词的生成与优化(使用 ChatGPT)

  • 文本生成视频(使用海螺AI)

  • 视频配音(使用 MMAudio + Google Colab)

只需掌握这几个步骤,就可以低成本、高效率地创作属于你自己的动物运动会动画。下面我们一步步开始!

一、使用 ChatGPT 生成提示词(prompt)

在创作一个AI动画之前,高质量的提示词(Prompt)是关键

这一步我们使用的是 ChatGPT 免费版本(gpt-4-o 也可以),我演示用的是 PLUS 用户的 gpt-4-mini-high 模型。实际上两者在处理这类任务上表现基本一致。

  1. 首先,输入一个通用的基础提示词模板,让 AI 保持等待接收你的指令。

  2. 然后,告诉 ChatGPT:

    • 运动项目名称(如跳水、跨栏、拔河等)

    • 动物种类(如巴哥犬、猫咪、袋鼠等)

    • 核心动作和完成情况(如“后空翻落水成功”)

示例提示词结构如下:在奥运会【具体项目】赛场。主角为一只(或一头/一匹)【明确动物种类】。其动作必须从准备区(或助跑区、起点线等)起始,完整描述其整个参赛过程,包括:①起始动作(准备与移动),②项目中核心动作(如起跳、翻滚、旋转、举起、冲刺等),③结果与动作收尾(成功或失败),④场地/垫子/水面互动结果

完整的基础指令如下:

为我生成动物奥运会的提示词 💠 每条提示词必须包含以下五个部分:
① 开场设定(固定句式 + 场地与主角) * 开头句统一为: 在奥运会【项目名称】赛场。 * 主角必须明确为一种具体动物(包括种类名) *示例:一只【猫鼬】、一头【河马】、一匹【小型马】、一只【巴哥犬】
② 起始动作(从准备区或助跑区开始),应该简短,不是提示词核心,每个提示词只有一个描述。 * 明确动物从哪个区域开始移动(准备区、助跑区、起跑线等) * 描述身体状态、起步姿态、移动节奏、动力来源 * 示例:脚步轻快、步伐低稳、节奏渐快、短促冲刺、四肢协调……
③ 动作过程(核心技巧阶段) * 描述动物在项目中完成的主要动作 * 跳水:空中翻滚、旋转、收身、展开 * 跳高:起跳、越杆、身体姿态 * 体操:转体、空翻、倒立支撑 * 举重:握杠、起举、定势 * 若是失败,需明确写出失败动作过程(如撞击、滑倒、失速)
④ 结尾动作(落地 / 入水 / 静止) * 成功:落地/入水位置、身体控制、站稳/漂浮状态 * 失败:跌落、躺倒、卡住、翻倒、被压、摊开等 * 必须具体而形象,不可省略
✅ 通用格式:在奥运会【具体项目】赛场。主角为一只(或一头/一匹)【明确动物种类】。其动作必须从准备区(或助跑区、起点线等)起始,完整描述其整个参赛过程,包括:①起始动作(准备与移动),②项目中核心动作(如起跳、翻滚、旋转、举起、冲刺等),③结果与动作收尾(成功或失败),④场地/垫子/水面互动结果
所有语言风格应保持写实克制,不可拟人化、不可添加外貌修饰、不可滑稽化处理。
若为失败,应具体写明失败方式、姿态与结果。适用于任何物种、任何奥运单人项目。
提示词内容语言应该通顺,不带有前面的标注
例如:跳高运动,边境牧羊犬,顺利成功的提示词可以是:在奥运会跳高赛场。一只边境牧羊犬站在助跑线后,短暂蓄势后飞快起跑。它靠近跳高架时迅速发力起跳,身体前倾,以一套自创的前跃方式腾空而起,在空中以带滚翻的姿态越过横杆,动作流畅、控制精准。它落地时四肢稳稳踩在垫面中央,轻巧完成收尾。 等待接受具体要求

二、用海螺AI生成动物视频

提示词准备好之后,接下来就可以使用海螺AI生成视频。

海螺AI地址:海螺AI

为什么选择海螺AI?

海螺AI提供了多种模型,我们建议使用 海螺02模型,在运动类视频中表现更自然稳定,但需注意:

  • 免费注册赠送 500 贝壳;

  • 02模型仅在1399元档位下可无限用,建议按需购买贝壳更划算;

  • 视频生成时长一般 3 分钟,分辨率选择 768P、时长 6 秒大多数情况下已足够。

💡 经验提醒:

  • 第一次生成不理想不要急,可以尝试调整提示词;

  • 核心动作应占提示词的“篇幅重点”,成功率更高;

  • 动作复杂度太高可能导致 AI 难以执行(如空翻+转体+落水)。

三、视频配音:用 MMAudio + Google Colab 免费搞定

海螺AI目前不支持更换配音,但我们可以用开源项目 MMAudio 来补足。它有三种使用方式:

  1. MMAudio 官网  (地址为https://mmaudio.net/

    • 每天赠送1积分

    • 每次生成消耗1积分

    • 月费 $8.3 美元

  2. Huggingface Demo(地址为:https://huggingface.co/spaces/hkchengrex/MMAudio

    • 免费但限制 GPU 使用时间(每日约2分钟)

    • 超过需订阅 Pro 账户

  3. 推荐:Google Colab 运行 MMAudio

    • 每日约1小时 T4 GPU 使用额度

    • 免费、效率高、适合量产

使用步骤(以Colab为例):

  1. 访问 Google Colab,新建一个 Notebook。

  2. 设置运行时类型为 Python3 + GPU(T4)

  3. 按顺序运行脚本(点击左上角「修改」→「笔记本设置」)。

👉 Google Colab 脚本链接地址(点击进入

⚠️ 注意事项:

  • 运行过程如有错误提示是正常的现象无需理会;

  • 在执行启动 MMAudio 之前,需要手动打开 pdf_editor_gui.py 文件,添加 share=True 参数,否则将无法获取到公共链接;

  • 成功后会生成一个临时 Public URL,点击即可进入 MMAudio 界面。

四、拖入视频,生成配音

进入 MMAudio 网页界面后,操作很简单:

  1. 拖入刚才下载的动物视频;

  2. 点击“Submit”按钮;

  3. 等待 50-60 秒后,配音版本即生成;

  4. 如果效果不满意可以再次点击生成,直到满意为止;

  5. 点击右上角“下载”按钮保存最终视频。

五、总结与注意事项

  • ChatGPT 生成提示词时需特别关注动作逻辑是否完整,动作从哪开始、哪结束、场景变化等都应涵盖;

  • 海螺AI优先使用02模型,并合理安排贝壳预算;

  • MMAudio 建议用 Colab 方式免费运行,每天1小时 GPU 足够使用;

  • 所有步骤都控制在尽可能低的失败率和成本下,适合想要量产短视频内容的创作者使用。


如果你喜欢这个项目的创作方式,欢迎点赞、收藏这篇文章。

发表评论

滚动至顶部