CAT: 技能教程LVL: L3-HardcoreDATE: 2026-04-14

视频工程：长剧本分镜拆解与视觉风格“锁死”技术

解决 10 分钟长视频“前段赛博朋克，后段写实主义”的灾难。用提示词工程和公式化母版，彻底锁死 AI 视频的视觉常数。

为什么长视频的画风会“崩坏”？

在制作 10 分钟级别的硬核 AI 长视频（例如探究历史悬案或技术拆解）时，你需要生成大概 60-100 个镜头。如果你每次都用自然语言去描述（例如：“巨大的爆炸摧毁了街道，非常震撼”），AI 每次都会重新“掷骰子”决定光影、景别和镜头材质。

结果就是：上一秒是 35mm 电影镜头，下一秒变成了手机超广角实拍。要实现工业化，必须将自然语言转化为“带有全局常数的代码参数”。

核心解法：构建结构化 Prompt 母版

无论你使用的是 Kling、Runway Gen-3 还是 Sora，必须建立一个不可修改的“尾缀常数”。

公式拆解

[动态变量：主体与动作] + [动态变量：环境] + [全局常数：镜头语言] + [全局常数：光影与渲染]

实战母版：以“1626 北京天启大爆炸”项目为例

假设我们要还原明朝末年的历史灾难现场，并且要求全片具有沉重的历史记录片质感，你的全局常数（绝对不能动的部分）必须长这样：

Shot on ARRI Alexa 65, historical documentary style, desaturated color grading, cinematic lighting, thick volumetric smoke, ultra-detailed, photorealistic, 8k resolution --ar 16:9

有了这个底座，你的变量部分只需要写客观事实：A massive shockwave shatters the wooden structures of ancient Chinese buildings, debris flying in slow motion.

自动化投产：用代码批量组装提示词既然结构固定了，我们就绝对不要手写 50 遍提示词。建立一个 Excel 或 CSV 表格，分为“动作”和“场景”两列，然后用一段几十行的脚本瞬间完成组装。

Python
# 书或术：批量 Prompt 生成器 (Python 自动化示例)
import pandas as pd

# 全局视觉常数（焊死不动的底座，决定全片统一画风）
CONSTANT_SUFFIX = "Shot on ARRI Alexa 65, historical documentary style, cinematic lighting, volumetric smoke, photorealistic, 8k --ar 16:9"

# 读取你的剧本分镜表
df = pd.read_csv("script_shots.csv")

# 批量写出到文本文档
with open("final_prompts.txt", "w", encoding="utf-8") as f:
    for index, row in df.iterrows():
        action = row['Action']
        scene = row['Scene']

        # 工业化组装：变量 + 变量 + 常数
        final_prompt = f"{action}, {scene}. {CONSTANT_SUFFIX}\n"
        f.write(final_prompt)

print("✅ 100个镜头的结构化 Prompt 已生成，准备送入渲染矩阵！")

极客提醒：这种工程化思维的最大优势是容错率。如果你生成完发现“色彩太暗”，你只需要改一次 CONSTANT_SUFFIX，运行脚本一秒钟就能重新生成 100 个镜头的提示词，而不是手动去改 100 遍。

视觉控制的“三大铁律” 禁用形容词，只用名词：不要说“很亮的灯”，要说“钨丝灯侧光 (Tungsten side lighting)”。

景别锁死：在动态变量开头，明确标出 Wide shot (全景)、Medium shot (中景) 或 Close-up (特写)。AI 很笨，你不说它就乱猜。

控制随机种子 (Seed)：如果某个镜头生成了一个非常完美的主角脸部或特定建筑，在后台日志中找出这个工具返回的 Seed 值，在后续关联生成时加上 --seed XXXX，这是保持画面一致性的终极杀器。