实战 FAQ

整合自 Mx-Shell 03.15 文档里的 17 条问题解决方案 + 两段直播 Q&A。同一个话题如果两处都提到了，以更详细的那段为准。引用 Mx-Shell 原话用 > 标出。

工具与模型

Q：用什么平台做视频？

小云雀（Xiaoyunque） 里的 Seedance 2.0「沉浸式短片」功能。

"用 Seedance 2.0 的模型，不要用 Seedance 2.0 Fast。Fast 处理速度快，但是细节把控差点意思。其他乱七八糟的模型就别用了。"

Q：图用什么模型做？

《丧尸清道夫》80% 的图是 GPT Image 出的。其次是 Midjourney，再次是 Krea，最后 Flux Max 用来精修材质。

通常工作流：MJ 或 Seedream 出图 → Flux 优化材质/真实感 → Nanobanana 出三视图

某一步出的图够用就跳过后面。

Q：平台/会员怎么选？

"其实平台只根据每个人实际的情况来定义，每个平台的价格其实都是有出入的。" "新用户一次就是 30 块两杯奶茶钱，可以自己买一下玩一玩。"

不建议被冲昏头脑，先按预算挑。

Q：电脑配置有要求吗？

没有。Seedance 是云端算力，能办公的电脑都能用。

人脸 / 版权 / 违规

Q：上传人脸照片被拦截怎么办？

（注：审核越来越严，下面方法不一定每次都灵。）

多换几张照片试试
忽略系统提示直接生成（可能不像本人）
接受失真：把照片丢给豆包，让它生成"写实风格的彩色素描画"再用
用商业人像描述法（详见下条）

Q：商业人像描述模板

把照片+下面这段丢给豆包：

帮我生成图片：图片风格为「人像摄影」，参考上传图片，
生成 22-25 岁年轻东亚男性的超写实商业人像摄影，近景，
五官、脸型与参考照片保持 100% 一致；保留轻微面部瑕疵；
带有少量自然碎发以营造慵懒松弛的氛围；无任何配饰；
服装深黑色 T 恤；背景设定为浅白色的模糊渐变质感背景，
光线采用柔和的侧光，以此突出面部的立体感，
皮肤呈现暖调健康肤色并带有自然细腻的光泽感，
细节增强度调至 100%，关闭过度磨皮功能，
色彩风格设定为高级柔和的暖色调，
最终输出具有细腻质感的商业级精修人像画质，
Canon EF85mm f/1.2。比例「3:4」

Q：避免人脸审核的另一种思路

"不是任何的故事非要有人脸才能创作。我近两期的作品就是这样。"

戴头盔、面具、机器人、背影、戴大眼镜的假人模特 —— 没有人脸照样能拍。

Q：版权词被拦怎么办？

"Seedance 模型的版权纠纷问题闹得沸沸扬扬，限制比较严重。"

替换提示词里影视作品名和角色名
删一些字眼或标点符号，保留大致意思
用近义词重述设计语言（"参考钢铁侠风格"→"原子朋克未来主义复古风格"）

Q：提示生成失败怎么办？

直接重新生成。这是常态。

画质 / 质感 / 真实感

Q：为什么我做出来很五毛特效感？

两个核心原因：

照片美颜过度。 > "尽量使用面部清晰的大头照，不要过度美颜的那种。有自信的兄弟直接用素颜照（你看哪部电影是有美颜的）。过于完美，就假。"

垫图垫错了。 > "尽量不要给 AI 参考图（除非你的参考图本身画质就很高，贴近真实，细节拉满，或者是 3D 建模渲染的）。"

Q：垫图 vs 纯文案，哪个好？

"我所有假面骑士的战衣造型都是靠描述让 AI 自由发挥的。" "现在百花齐放，每个人的假面战衣都不一样，等于是专属于自己的，不好吗？"

激烈打斗、变身这类有动态的镜头建议不用首尾帧；人物/场景一致性强需求才用参考图。

Q：怎么让金属/瓷砖/光线更真实？

让 AI 帮你写材质描述。例：

"瓷砖的纹理光滑度、抛光处理还是磨砂处理、岩石的冰冷感..." "你可以直接让 AI 告诉你瓷砖表面质感的提示词。"

也可以用 Flux 模型单独过一遍图，专门强化金属反光、划痕、光散射等物理细节。

Q：分辨率要做多高？

"我的视频基本都是 720p。"

发国内平台 720p 足够，平台会再压缩一次。不上电影院没必要做 4K。

镜头与构图

Q：运镜怎么写？

"运镜其实我基本上都是用文案控制。"

脑子里得先有画面。然后翻译成：

景别（中景 / 特写 / 全景）
角度（仰拍 / 俯拍 / 平视）
运动（前推 / 环绕 / 跟随 / 固定机位）
节奏（极缓 / 匀速 / 0.1 秒微颤）

详见方法论 - 段 4 · 运镜规则。

Q：构图怎么描述？

"你可以描述构图，然后要知道什么是中心线、九宫格三分线。"

例：

模特背影占据画面中心线左侧位置，右手手肘叉腰形成框景，
框住视觉主体的机器人。机器人面对镜头，模特背对镜头，
机器人为近景，模特为前景，吧台为中景，背景为环境背景。

按景层（前景 / 中景 / 背景）分别交代，比直接说"X 站在 Y 旁边"清晰得多。

Q：要不要画手绘分镜稿？

看个人。Mx-Shell 几乎没用过分镜图。只在最后那个长镜头（飞船特写后拉至全景）用了一次。

手绘稿的好处是节省 AI 算力，让它把更多算力用在动作上；坏处是 AI 可能把参考图里手绘风格的"黑白线条"带进生成结果（出现局部画风崩坏）。

可以丢张图给豆包/GPT 让它"转为黑白手稿用作分镜参考"，一句话的事。

时长 / 长视频 / 剪辑

Q：一次生成多少秒合适？

看场景需要多少秒。Mx-Shell 习惯：

开场/变身：15 秒
一般镜头：5-10 秒
短动作（眨眼、看一眼）：4-5 秒

Q：怎么做长视频（超过 15 秒）？

小云雀网页端的「生成视频后续」功能。打斗这类动作戏要靠它接。

打斗段提示词不会写？

"打斗的提示词自己写，我不喜欢做打斗的我懒得写，可以让豆包帮你写了以后自己细化一下。"

Q：两个片段怎么衔接？

靠运动方向接。

"机器人丢了一个炸弹，炸飞了后面的尸潮，自己被推出画面一侧 —— 下个镜头就要从那一侧接进来。"

视觉上才会觉得是同一个运动延续。

Q：剪辑用什么？

剪映。没用复杂工具。

Q：后期要不要调色？

有些要。但 AI 出的视频文件色彩比特率很低，调色空间小。

"你调得太过，画面会脏、断层、乱码。不像现实中的相机拍出来可以调得很离谱。"

最佳策略：在场景图阶段就把色调定准，视频生成时尽量沿用，后期只做微调过渡。

字数 / 抽卡 / 复刻

Q：提示词超字数了？

手机端做不了 → 切电脑网页版
还是超 → 自己删减

Q：用同样的提示词为什么做不出和你一样的？

"我自己用同样的提示词生成出来的两个视频都会有很大区别。"

AI 生成本身有随机性。把同一段提示词当作抽卡的入场券，不是一锤定音。

Mx-Shell 单镜头抽卡数：

多的可能 20 次
少的两三次
整个《丧尸清道夫》生成了400 张图片 + 200+ 个视频镜头

Q：《火焰恶魔》那个运镜怎么复刻？

"那个运镜属于意外惊喜，提示词就是这个版本，属于 AI 没有依照我的指令的接过，瞎猫碰上死耗子，我也无法复刻出来。"

接受随机性，挑卡比磨提示词更重要。

音乐 / 音效

Q：音乐是你做的吗？

不是。音乐是有版权的现成音乐，来自 Artlist.io。

Q：音效呢？

"音效是 Seedance 沉浸式短片自带的。"

它生成视频时会自动配同期声、玻璃碎裂、开枪等环境音。 特殊音效要在提示词里写明，比如：

机器人面部表情切换带有科幻感音效

Q：配音怎么搞？

"全剧只有一句配音。"

如果只有一两句台词，没必要追求声音一致性，让小云雀自己选音色就行。小云雀近期上线了声音参考功能，需要统一音色可以用那个。

灵感 / 学习

Q：故事灵感哪来的？

"我的故事创意灵感来自机器人总动员。"

观影、生活、小说、电视剧都行 ——

"你得有生活，才能有创造力。"

Q：写到一半没思路了？

"我做这部片子之前都没有完整的剧本。我都是跟朋友聊了一下，简单的拍做了两个镜头看到这个质感好像还 OK，才开始想要以什么开场。我边做边想边改。"

先做两个镜头试质感，再边做边写。比闭门写完整剧本再开干更适合 AI 创作。

Q：怎么入门 AI 短片？

Mx-Shell 自己是从 2026 年 1 月开始接触，自学摸索：

"我这里讲的东西可能很潦草，是因为我也是自学，没系统学习过。"

Q：要不要学剪辑？

要。原因：

"AI 生成的视频不一定是完美的，可能某些片段你截一下，靠转场和特效拼起来，可以弥补 —— 同时也节约你的钱包。"

成本 / 周期

实测数据（Mx-Shell 自述）

项目	数据
总周期	10 天
总花费	网传 ~3000 RMB，但本人直播改口称几万 / 两万多块
图片生成数	约 400 张
视频镜头数	约 200+ 个
提示词手写比例	95%（只有打斗戏让豆包写的）
有没有完整剧本	没有，边做边想

"3000 美金怎么可能？3000 人民币。" "几万块了吧？是按 G2 两万多块钱了吧？" "怎么去的 3000 美金啊？3000 块钱人民币。"

⚠️ 关于成本的实际情况：Mx-Shell 在同一段直播里对成本的说法前后不一致 —— 先确认是"3000 RMB"，然后又改口为"几万 / 两万多 RMB"。合理解释是：作品本身消耗的 token / 算力价值约 3000 RMB（这是他对外宣传的口径），但实际购买额度算上抽卡损耗可能达 2 万 +。真正花费比"10 天 3000 元"传播口径要高。但即便按 2 万 RMB 算，也仍然远低于真人拍摄的 3 分钟短片成本。

杂项

Q：基础服装怎么定？

建议贴合战斗风格。

"哪有人穿着高跟鞋去打架的，添加的基础服装最好是贴合战斗风格的，沉浸感才会更强。"

Q：你的提示词里有错别字？

对。

"我的提示词好像有些错别字，大家拿到手可以自己检查一下。"

Q：你是什么专业的？

中专。摄影是他的副业兼爱好。

Q：会出新提示词吗？

看心情。

"博主还有正式工作和其他兴趣爱好，我也很享受原有的生活方式。"