大家好,今天这篇文章将完整分享如何利用多种AI工具,制作一个充满趣味和创意的“小动物运动会”短视频。整个流程包括:
提示词的生成与优化(使用 ChatGPT)
文本生成视频(使用海螺AI)
视频配音(使用 MMAudio + Google Colab)
只需掌握这几个步骤,就可以低成本、高效率地创作属于你自己的动物运动会动画。下面我们一步步开始!
一、使用 ChatGPT 生成提示词(prompt)
在创作一个AI动画之前,高质量的提示词(Prompt)是关键。
这一步我们使用的是 ChatGPT 免费版本(gpt-4-o 也可以),我演示用的是 PLUS 用户的 gpt-4-mini-high
模型。实际上两者在处理这类任务上表现基本一致。
首先,输入一个通用的基础提示词模板,让 AI 保持等待接收你的指令。
然后,告诉 ChatGPT:
运动项目名称(如跳水、跨栏、拔河等)
动物种类(如巴哥犬、猫咪、袋鼠等)
核心动作和完成情况(如“后空翻落水成功”)
示例提示词结构如下:在奥运会【具体项目】赛场。主角为一只(或一头/一匹)【明确动物种类】。其动作必须从准备区(或助跑区、起点线等)起始,完整描述其整个参赛过程,包括:①起始动作(准备与移动),②项目中核心动作(如起跳、翻滚、旋转、举起、冲刺等),③结果与动作收尾(成功或失败),④场地/垫子/水面互动结果
完整的基础指令如下:
为我生成动物奥运会的提示词 💠 每条提示词必须包含以下五个部分:
① 开场设定(固定句式 + 场地与主角) * 开头句统一为: 在奥运会【项目名称】赛场。 * 主角必须明确为一种具体动物(包括种类名) *示例:一只【猫鼬】、一头【河马】、一匹【小型马】、一只【巴哥犬】
② 起始动作(从准备区或助跑区开始),应该简短,不是提示词核心,每个提示词只有一个描述。 * 明确动物从哪个区域开始移动(准备区、助跑区、起跑线等) * 描述身体状态、起步姿态、移动节奏、动力来源 * 示例:脚步轻快、步伐低稳、节奏渐快、短促冲刺、四肢协调……
③ 动作过程(核心技巧阶段) * 描述动物在项目中完成的主要动作 * 跳水:空中翻滚、旋转、收身、展开 * 跳高:起跳、越杆、身体姿态 * 体操:转体、空翻、倒立支撑 * 举重:握杠、起举、定势 * 若是失败,需明确写出失败动作过程(如撞击、滑倒、失速)
④ 结尾动作(落地 / 入水 / 静止) * 成功:落地/入水位置、身体控制、站稳/漂浮状态 * 失败:跌落、躺倒、卡住、翻倒、被压、摊开等 * 必须具体而形象,不可省略
✅ 通用格式:在奥运会【具体项目】赛场。主角为一只(或一头/一匹)【明确动物种类】。其动作必须从准备区(或助跑区、起点线等)起始,完整描述其整个参赛过程,包括:①起始动作(准备与移动),②项目中核心动作(如起跳、翻滚、旋转、举起、冲刺等),③结果与动作收尾(成功或失败),④场地/垫子/水面互动结果
所有语言风格应保持写实克制,不可拟人化、不可添加外貌修饰、不可滑稽化处理。
若为失败,应具体写明失败方式、姿态与结果。适用于任何物种、任何奥运单人项目。
提示词内容语言应该通顺,不带有前面的标注
例如:跳高运动,边境牧羊犬,顺利成功的提示词可以是:在奥运会跳高赛场。一只边境牧羊犬站在助跑线后,短暂蓄势后飞快起跑。它靠近跳高架时迅速发力起跳,身体前倾,以一套自创的前跃方式腾空而起,在空中以带滚翻的姿态越过横杆,动作流畅、控制精准。它落地时四肢稳稳踩在垫面中央,轻巧完成收尾。 等待接受具体要求
二、用海螺AI生成动物视频
提示词准备好之后,接下来就可以使用海螺AI生成视频。
海螺AI地址:海螺AI
为什么选择海螺AI?
海螺AI提供了多种模型,我们建议使用 海螺02模型,在运动类视频中表现更自然稳定,但需注意:
免费注册赠送 500 贝壳;
02模型仅在1399元档位下可无限用,建议按需购买贝壳更划算;
视频生成时长一般 3 分钟,分辨率选择 768P、时长 6 秒大多数情况下已足够。
💡 经验提醒:
第一次生成不理想不要急,可以尝试调整提示词;
核心动作应占提示词的“篇幅重点”,成功率更高;
动作复杂度太高可能导致 AI 难以执行(如空翻+转体+落水)。
三、视频配音:用 MMAudio + Google Colab 免费搞定
海螺AI目前不支持更换配音,但我们可以用开源项目 MMAudio 来补足。它有三种使用方式:
MMAudio 官网 (地址为https://mmaudio.net/)
每天赠送1积分
每次生成消耗1积分
月费 $8.3 美元
Huggingface Demo(地址为:https://huggingface.co/spaces/hkchengrex/MMAudio)
免费但限制 GPU 使用时间(每日约2分钟)
超过需订阅 Pro 账户
推荐:Google Colab 运行 MMAudio
每日约1小时 T4 GPU 使用额度
免费、效率高、适合量产
使用步骤(以Colab为例):
访问 Google Colab,新建一个 Notebook。
设置运行时类型为 Python3 + GPU(T4)。
按顺序运行脚本(点击左上角「修改」→「笔记本设置」)。
👉 Google Colab 脚本链接地址(点击进入)
⚠️ 注意事项:
运行过程如有错误提示是正常的现象无需理会;
在执行启动 MMAudio 之前,需要手动打开
pdf_editor_gui.py
文件,添加share=True
参数,否则将无法获取到公共链接;成功后会生成一个临时 Public URL,点击即可进入 MMAudio 界面。
四、拖入视频,生成配音
进入 MMAudio 网页界面后,操作很简单:
拖入刚才下载的动物视频;
点击“Submit”按钮;
等待 50-60 秒后,配音版本即生成;
如果效果不满意可以再次点击生成,直到满意为止;
点击右上角“下载”按钮保存最终视频。
五、总结与注意事项
ChatGPT 生成提示词时需特别关注动作逻辑是否完整,动作从哪开始、哪结束、场景变化等都应涵盖;
海螺AI优先使用02模型,并合理安排贝壳预算;
MMAudio 建议用 Colab 方式免费运行,每天1小时 GPU 足够使用;
所有步骤都控制在尽可能低的失败率和成本下,适合想要量产短视频内容的创作者使用。
如果你喜欢这个项目的创作方式,欢迎点赞、收藏这篇文章。