实战 FAQ
整合自 Mx-Shell 03.15 文档里的 17 条问题解决方案 + 两段直播 Q&A。 同一个话题如果两处都提到了,以更详细的那段为准。 引用 Mx-Shell 原话用
>标出。
工具与模型
Q:用什么平台做视频?
小云雀(Xiaoyunque) 里的 Seedance 2.0「沉浸式短片」功能。
"用 Seedance 2.0 的模型,不要用 Seedance 2.0 Fast。Fast 处理速度快,但是细节把控差点意思。其他乱七八糟的模型就别用了。"
Q:图用什么模型做?
《丧尸清道夫》80% 的图是 GPT Image 出的。其次是 Midjourney,再次是 Krea,最后 Flux Max 用来精修材质。
通常工作流:MJ 或 Seedream 出图 → Flux 优化材质/真实感 → Nanobanana 出三视图
某一步出的图够用就跳过后面。
Q:平台/会员怎么选?
"其实平台只根据每个人实际的情况来定义,每个平台的价格其实都是有出入的。" "新用户一次就是 30 块两杯奶茶钱,可以自己买一下玩一玩。"
不建议被冲昏头脑,先按预算挑。
Q:电脑配置有要求吗?
没有。Seedance 是云端算力,能办公的电脑都能用。
人脸 / 版权 / 违规
Q:上传人脸照片被拦截怎么办?
(注:审核越来越严,下面方法不一定每次都灵。)
- 多换几张照片试试
- 忽略系统提示直接生成(可能不像本人)
- 接受失真:把照片丢给豆包,让它生成"写实风格的彩色素描画"再用
- 用商业人像描述法(详见下条)
Q:商业人像描述模板
把照片+下面这段丢给豆包:
帮我生成图片:图片风格为「人像摄影」,参考上传图片,
生成 22-25 岁年轻东亚男性的超写实商业人像摄影,近景,
五官、脸型与参考照片保持 100% 一致;保留轻微面部瑕疵;
带有少量自然碎发以营造慵懒松弛的氛围;无任何配饰;
服装深黑色 T 恤;背景设定为浅白色的模糊渐变质感背景,
光线采用柔和的侧光,以此突出面部的立体感,
皮肤呈现暖调健康肤色并带有自然细腻的光泽感,
细节增强度调至 100%,关闭过度磨皮功能,
色彩风格设定为高级柔和的暖色调,
最终输出具有细腻质感的商业级精修人像画质,
Canon EF85mm f/1.2。比例「3:4」
Q:避免人脸审核的另一种思路
"不是任何的故事非要有人脸才能创作。我近两期的作品就是这样。"
戴头盔、面具、机器人、背影、戴大眼镜的假人模特 —— 没有人脸照样能拍。
Q:版权词被拦怎么办?
"Seedance 模型的版权纠纷问题闹得沸沸扬扬,限制比较严重。"
- 替换提示词里影视作品名和角色名
- 删一些字眼或标点符号,保留大致意思
- 用近义词重述设计语言("参考钢铁侠风格"→"原子朋克未来主义复古风格")
Q:提示生成失败怎么办?
直接重新生成。这是常态。
画质 / 质感 / 真实感
Q:为什么我做出来很五毛特效感?
两个核心原因:
- 照片美颜过度。 > "尽量使用面部清晰的大头照,不要过度美颜的那种。有自信的兄弟直接用素颜照(你看哪部电影是有美颜的)。过于完美,就假。"
- 垫图垫错了。 > "尽量不要给 AI 参考图(除非你的参考图本身画质就很高,贴近真实,细节拉满,或者是 3D 建模渲染的)。"
Q:垫图 vs 纯文案,哪个好?
"我所有假面骑士的战衣造型都是靠描述让 AI 自由发挥的。" "现在百花齐放,每个人的假面战衣都不一样,等于是专属于自己的,不好吗?"
激烈打斗、变身这类有动态的镜头建议不用首尾帧; 人物/场景一致性强需求才用参考图。
Q:怎么让金属/瓷砖/光线更真实?
让 AI 帮你写材质描述。例:
"瓷砖的纹理光滑度、抛光处理还是磨砂处理、岩石的冰冷感..." "你可以直接让 AI 告诉你瓷砖表面质感的提示词。"
也可以用 Flux 模型单独过一遍图,专门强化金属反光、划痕、光散射等物理细节。
Q:分辨率要做多高?
"我的视频基本都是 720p。"
发国内平台 720p 足够,平台会再压缩一次。不上电影院没必要做 4K。
镜头与构图
Q:运镜怎么写?
"运镜其实我基本上都是用文案控制。"
脑子里得先有画面。然后翻译成:
- 景别(中景 / 特写 / 全景)
- 角度(仰拍 / 俯拍 / 平视)
- 运动(前推 / 环绕 / 跟随 / 固定机位)
- 节奏(极缓 / 匀速 / 0.1 秒微颤)
详见 方法论 - 段 4 · 运镜规则。
Q:构图怎么描述?
"你可以描述构图,然后要知道什么是中心线、九宫格三分线。"
例:
模特背影占据画面中心线左侧位置,右手手肘叉腰形成框景,
框住视觉主体的机器人。机器人面对镜头,模特背对镜头,
机器人为近景,模特为前景,吧台为中景,背景为环境背景。
按景层(前景 / 中景 / 背景)分别交代,比直接说"X 站在 Y 旁边"清晰得多。
Q:要不要画手绘分镜稿?
看个人。Mx-Shell 几乎没用过分镜图。只在最后那个长镜头(飞船特写后拉至全景)用了一次。
手绘稿的好处是节省 AI 算力,让它把更多算力用在动作上; 坏处是 AI 可能把参考图里手绘风格的"黑白线条"带进生成结果(出现局部画风崩坏)。
可以丢张图给豆包/GPT 让它"转为黑白手稿用作分镜参考",一句话的事。
时长 / 长视频 / 剪辑
Q:一次生成多少秒合适?
看场景需要多少秒。Mx-Shell 习惯:
- 开场/变身:15 秒
- 一般镜头:5-10 秒
- 短动作(眨眼、看一眼):4-5 秒
Q:怎么做长视频(超过 15 秒)?
小云雀网页端的「生成视频后续」功能。打斗这类动作戏要靠它接。
打斗段提示词不会写?
"打斗的提示词自己写,我不喜欢做打斗的我懒得写,可以让豆包帮你写了以后自己细化一下。"
Q:两个片段怎么衔接?
靠运动方向接。
"机器人丢了一个炸弹,炸飞了后面的尸潮,自己被推出画面一侧 —— 下个镜头就要从那一侧接进来。"
视觉上才会觉得是同一个运动延续。
Q:剪辑用什么?
剪映。没用复杂工具。
Q:后期要不要调色?
有些要。但 AI 出的视频文件色彩比特率很低,调色空间小。
"你调得太过,画面会脏、断层、乱码。不像现实中的相机拍出来可以调得很离谱。"
最佳策略:在场景图阶段就把色调定准,视频生成时尽量沿用,后期只做微调过渡。
字数 / 抽卡 / 复刻
Q:提示词超字数了?
- 手机端做不了 → 切电脑网页版
- 还是超 → 自己删减
Q:用同样的提示词为什么做不出和你一样的?
"我自己用同样的提示词生成出来的两个视频都会有很大区别。"
AI 生成本身有随机性。把同一段提示词当作抽卡的入场券,不是一锤定音。
Mx-Shell 单镜头抽卡数:
- 多的可能 20 次
- 少的两三次
- 整个《丧尸清道夫》生成了400 张图片 + 200+ 个视频镜头
Q:《火焰恶魔》那个运镜怎么复刻?
"那个运镜属于意外惊喜,提示词就是这个版本,属于 AI 没有依照我的指令的接过,瞎猫碰上死耗子,我也无法复刻出来。"
接受随机性,挑卡比磨提示词更重要。
音乐 / 音效
Q:音乐是你做的吗?
不是。音乐是有版权的现成音乐,来自 Artlist.io。
Q:音效呢?
"音效是 Seedance 沉浸式短片自带的。"
它生成视频时会自动配同期声、玻璃碎裂、开枪等环境音。 特殊音效要在提示词里写明,比如:
机器人面部表情切换带有科幻感音效
Q:配音怎么搞?
"全剧只有一句配音。"
如果只有一两句台词,没必要追求声音一致性,让小云雀自己选音色就行。 小云雀近期上线了声音参考功能,需要统一音色可以用那个。
灵感 / 学习
Q:故事灵感哪来的?
"我的故事创意灵感来自机器人总动员。"
观影、生活、小说、电视剧都行 ——
"你得有生活,才能有创造力。"
Q:写到一半没思路了?
"我做这部片子之前都没有完整的剧本。我都是跟朋友聊了一下,简单的拍做了两个镜头看到这个质感好像还 OK,才开始想要以什么开场。我边做边想边改。"
先做两个镜头试质感,再边做边写。比闭门写完整剧本再开干更适合 AI 创作。
Q:怎么入门 AI 短片?
Mx-Shell 自己是从 2026 年 1 月开始接触,自学摸索:
"我这里讲的东西可能很潦草,是因为我也是自学,没系统学习过。"
Q:要不要学剪辑?
要。原因:
"AI 生成的视频不一定是完美的,可能某些片段你截一下,靠转场和特效拼起来,可以弥补 —— 同时也节约你的钱包。"
成本 / 周期
实测数据(Mx-Shell 自述)
| 项目 | 数据 |
|---|---|
| 总周期 | 10 天 |
| 总花费 | 网传 ~3000 RMB,但本人直播改口称几万 / 两万多块 |
| 图片生成数 | 约 400 张 |
| 视频镜头数 | 约 200+ 个 |
| 提示词手写比例 | 95%(只有打斗戏让豆包写的) |
| 有没有完整剧本 | 没有,边做边想 |
"3000 美金怎么可能?3000 人民币。" "几万块了吧?是按 G2 两万多块钱了吧?" "怎么去的 3000 美金啊?3000 块钱人民币。"
⚠️ 关于成本的实际情况:Mx-Shell 在同一段直播里对成本的说法前后不一致 —— 先确认是"3000 RMB",然后又改口为"几万 / 两万多 RMB"。 合理解释是:作品本身消耗的 token / 算力价值约 3000 RMB(这是他对外宣传的口径),但实际购买额度算上抽卡损耗可能达 2 万 +。 真正花费比"10 天 3000 元"传播口径要高。但即便按 2 万 RMB 算,也仍然远低于真人拍摄的 3 分钟短片成本。
杂项
Q:基础服装怎么定?
建议贴合战斗风格。
"哪有人穿着高跟鞋去打架的,添加的基础服装最好是贴合战斗风格的,沉浸感才会更强。"
Q:你的提示词里有错别字?
对。
"我的提示词好像有些错别字,大家拿到手可以自己检查一下。"
Q:你是什么专业的?
中专。摄影是他的副业兼爱好。
Q:会出新提示词吗?
看心情。
"博主还有正式工作和其他兴趣爱好,我也很享受原有的生活方式。"