如何用AI制作“小动物运动会”创意视频：从提示词到配音全流程教程

大家好，今天这篇文章将完整分享如何利用多种AI工具，制作一个充满趣味和创意的“小动物运动会”短视频。整个流程包括：

提示词的生成与优化（使用 ChatGPT）
文本生成视频（使用海螺AI）
视频配音（使用 MMAudio + Google Colab）

只需掌握这几个步骤，就可以低成本、高效率地创作属于你自己的动物运动会动画。下面我们一步步开始！

一、使用 ChatGPT 生成提示词（prompt）

在创作一个AI动画之前，高质量的提示词（Prompt）是关键。

这一步我们使用的是 ChatGPT 免费版本（gpt-4-o 也可以），我演示用的是 PLUS 用户的 gpt-4-mini-high 模型。实际上两者在处理这类任务上表现基本一致。

首先，输入一个通用的基础提示词模板，让 AI 保持等待接收你的指令。
然后，告诉 ChatGPT：
- 运动项目名称（如跳水、跨栏、拔河等）
- 动物种类（如巴哥犬、猫咪、袋鼠等）
- 核心动作和完成情况（如“后空翻落水成功”）

示例提示词结构如下：在奥运会【具体项目】赛场。主角为一只（或一头/一匹）【明确动物种类】。其动作必须从准备区（或助跑区、起点线等）起始，完整描述其整个参赛过程，包括：①起始动作（准备与移动），②项目中核心动作（如起跳、翻滚、旋转、举起、冲刺等），③结果与动作收尾（成功或失败），④场地/垫子/水面互动结果

完整的基础指令如下：

为我生成动物奥运会的提示词 💠 每条提示词必须包含以下五个部分：
① 开场设定（固定句式 + 场地与主角） * 开头句统一为：在奥运会【项目名称】赛场。 * 主角必须明确为一种具体动物（包括种类名） *示例：一只【猫鼬】、一头【河马】、一匹【小型马】、一只【巴哥犬】
② 起始动作（从准备区或助跑区开始），应该简短，不是提示词核心，每个提示词只有一个描述。 * 明确动物从哪个区域开始移动（准备区、助跑区、起跑线等） * 描述身体状态、起步姿态、移动节奏、动力来源 * 示例：脚步轻快、步伐低稳、节奏渐快、短促冲刺、四肢协调……
③ 动作过程（核心技巧阶段） * 描述动物在项目中完成的主要动作 * 跳水：空中翻滚、旋转、收身、展开 * 跳高：起跳、越杆、身体姿态 * 体操：转体、空翻、倒立支撑 * 举重：握杠、起举、定势 * 若是失败，需明确写出失败动作过程（如撞击、滑倒、失速）
④ 结尾动作（落地 / 入水 / 静止） * 成功：落地/入水位置、身体控制、站稳/漂浮状态 * 失败：跌落、躺倒、卡住、翻倒、被压、摊开等 * 必须具体而形象，不可省略
✅ 通用格式：在奥运会【具体项目】赛场。主角为一只（或一头/一匹）【明确动物种类】。其动作必须从准备区（或助跑区、起点线等）起始，完整描述其整个参赛过程，包括：①起始动作（准备与移动），②项目中核心动作（如起跳、翻滚、旋转、举起、冲刺等），③结果与动作收尾（成功或失败），④场地/垫子/水面互动结果
所有语言风格应保持写实克制，不可拟人化、不可添加外貌修饰、不可滑稽化处理。
若为失败，应具体写明失败方式、姿态与结果。适用于任何物种、任何奥运单人项目。
提示词内容语言应该通顺，不带有前面的标注
例如：跳高运动，边境牧羊犬，顺利成功的提示词可以是：在奥运会跳高赛场。一只边境牧羊犬站在助跑线后，短暂蓄势后飞快起跑。它靠近跳高架时迅速发力起跳，身体前倾，以一套自创的前跃方式腾空而起，在空中以带滚翻的姿态越过横杆，动作流畅、控制精准。它落地时四肢稳稳踩在垫面中央，轻巧完成收尾。等待接受具体要求

二、用海螺AI生成动物视频

提示词准备好之后，接下来就可以使用海螺AI生成视频。

海螺AI地址：海螺AI

为什么选择海螺AI？

海螺AI提供了多种模型，我们建议使用 海螺02模型，在运动类视频中表现更自然稳定，但需注意：

免费注册赠送 500 贝壳；
02模型仅在1399元档位下可无限用，建议按需购买贝壳更划算；
视频生成时长一般 3 分钟，分辨率选择 768P、时长 6 秒大多数情况下已足够。

💡 经验提醒：
第一次生成不理想不要急，可以尝试调整提示词；
核心动作应占提示词的“篇幅重点”，成功率更高；
动作复杂度太高可能导致 AI 难以执行（如空翻+转体+落水）。

三、视频配音：用 MMAudio + Google Colab 免费搞定

海螺AI目前不支持更换配音，但我们可以用开源项目 MMAudio 来补足。它有三种使用方式：

MMAudio 官网（地址为https://mmaudio.net/）
- 每天赠送1积分
- 每次生成消耗1积分
- 月费 $8.3 美元
Huggingface Demo（地址为：https://huggingface.co/spaces/hkchengrex/MMAudio）
- 免费但限制 GPU 使用时间（每日约2分钟）
- 超过需订阅 Pro 账户
推荐：Google Colab 运行 MMAudio
- 每日约1小时 T4 GPU 使用额度
- 免费、效率高、适合量产

使用步骤（以Colab为例）：

访问 Google Colab，新建一个 Notebook。
设置运行时类型为 Python3 + GPU（T4）。
按顺序运行脚本（点击左上角「修改」→「笔记本设置」）。

👉 Google Colab 脚本链接地址（点击进入）

⚠️ 注意事项：
运行过程如有错误提示是正常的现象无需理会；
在执行启动 MMAudio 之前，需要手动打开 pdf_editor_gui.py 文件，添加 share=True 参数，否则将无法获取到公共链接；
成功后会生成一个临时 Public URL，点击即可进入 MMAudio 界面。

四、拖入视频，生成配音

进入 MMAudio 网页界面后，操作很简单：

拖入刚才下载的动物视频；
点击“Submit”按钮；
等待 50-60 秒后，配音版本即生成；
如果效果不满意可以再次点击生成，直到满意为止；
点击右上角“下载”按钮保存最终视频。

五、总结与注意事项

ChatGPT 生成提示词时需特别关注动作逻辑是否完整，动作从哪开始、哪结束、场景变化等都应涵盖；
海螺AI优先使用02模型，并合理安排贝壳预算；
MMAudio 建议用 Colab 方式免费运行，每天1小时 GPU 足够使用；
所有步骤都控制在尽可能低的失败率和成本下，适合想要量产短视频内容的创作者使用。

如果你喜欢这个项目的创作方式，欢迎点赞、收藏这篇文章。