← 提示词库 在 GitHub 查看源文件 ↗
EN

实战 FAQ

整合自 Mx-Shell 03.15 文档里的 17 条问题解决方案 + 两段直播 Q&A。 同一个话题如果两处都提到了,以更详细的那段为准。 引用 Mx-Shell 原话用 > 标出。


工具与模型

Q:用什么平台做视频?

小云雀(Xiaoyunque) 里的 Seedance 2.0「沉浸式短片」功能。

"用 Seedance 2.0 的模型,不要用 Seedance 2.0 Fast。Fast 处理速度快,但是细节把控差点意思。其他乱七八糟的模型就别用了。"

Q:图用什么模型做?

《丧尸清道夫》80% 的图是 GPT Image 出的。其次是 Midjourney,再次是 Krea,最后 Flux Max 用来精修材质。

通常工作流:MJ 或 Seedream 出图 → Flux 优化材质/真实感 → Nanobanana 出三视图

某一步出的图够用就跳过后面。

Q:平台/会员怎么选?

"其实平台只根据每个人实际的情况来定义,每个平台的价格其实都是有出入的。" "新用户一次就是 30 块两杯奶茶钱,可以自己买一下玩一玩。"

不建议被冲昏头脑,先按预算挑。

Q:电脑配置有要求吗?

没有。Seedance 是云端算力,能办公的电脑都能用。


人脸 / 版权 / 违规

Q:上传人脸照片被拦截怎么办?

(注:审核越来越严,下面方法不一定每次都灵。)

  1. 多换几张照片试试
  2. 忽略系统提示直接生成(可能不像本人)
  3. 接受失真:把照片丢给豆包,让它生成"写实风格的彩色素描画"再用
  4. 用商业人像描述法(详见下条)

Q:商业人像描述模板

把照片+下面这段丢给豆包:

帮我生成图片:图片风格为「人像摄影」,参考上传图片,
生成 22-25 岁年轻东亚男性的超写实商业人像摄影,近景,
五官、脸型与参考照片保持 100% 一致;保留轻微面部瑕疵;
带有少量自然碎发以营造慵懒松弛的氛围;无任何配饰;
服装深黑色 T 恤;背景设定为浅白色的模糊渐变质感背景,
光线采用柔和的侧光,以此突出面部的立体感,
皮肤呈现暖调健康肤色并带有自然细腻的光泽感,
细节增强度调至 100%,关闭过度磨皮功能,
色彩风格设定为高级柔和的暖色调,
最终输出具有细腻质感的商业级精修人像画质,
Canon EF85mm f/1.2。比例「3:4」

Q:避免人脸审核的另一种思路

"不是任何的故事非要有人脸才能创作。我近两期的作品就是这样。"

戴头盔、面具、机器人、背影、戴大眼镜的假人模特 —— 没有人脸照样能拍。

Q:版权词被拦怎么办?

"Seedance 模型的版权纠纷问题闹得沸沸扬扬,限制比较严重。"

Q:提示生成失败怎么办?

直接重新生成。这是常态。


画质 / 质感 / 真实感

Q:为什么我做出来很五毛特效感?

两个核心原因

  1. 照片美颜过度。 > "尽量使用面部清晰的大头照,不要过度美颜的那种。有自信的兄弟直接用素颜照(你看哪部电影是有美颜的)。过于完美,就假。"
  1. 垫图垫错了。 > "尽量不要给 AI 参考图(除非你的参考图本身画质就很高,贴近真实,细节拉满,或者是 3D 建模渲染的)。"

Q:垫图 vs 纯文案,哪个好?

"我所有假面骑士的战衣造型都是靠描述让 AI 自由发挥的。" "现在百花齐放,每个人的假面战衣都不一样,等于是专属于自己的,不好吗?"

激烈打斗、变身这类有动态的镜头建议不用首尾帧; 人物/场景一致性强需求才用参考图。

Q:怎么让金属/瓷砖/光线更真实?

让 AI 帮你写材质描述。例:

"瓷砖的纹理光滑度、抛光处理还是磨砂处理、岩石的冰冷感..." "你可以直接让 AI 告诉你瓷砖表面质感的提示词。"

也可以用 Flux 模型单独过一遍图,专门强化金属反光、划痕、光散射等物理细节。

Q:分辨率要做多高?

"我的视频基本都是 720p。"

发国内平台 720p 足够,平台会再压缩一次。不上电影院没必要做 4K。


镜头与构图

Q:运镜怎么写?

"运镜其实我基本上都是用文案控制。"

脑子里得先有画面。然后翻译成:

详见 方法论 - 段 4 · 运镜规则

Q:构图怎么描述?

"你可以描述构图,然后要知道什么是中心线、九宫格三分线。"

例:

模特背影占据画面中心线左侧位置,右手手肘叉腰形成框景,
框住视觉主体的机器人。机器人面对镜头,模特背对镜头,
机器人为近景,模特为前景,吧台为中景,背景为环境背景。

按景层(前景 / 中景 / 背景)分别交代,比直接说"X 站在 Y 旁边"清晰得多。

Q:要不要画手绘分镜稿?

看个人。Mx-Shell 几乎没用过分镜图。只在最后那个长镜头(飞船特写后拉至全景)用了一次。

手绘稿的好处是节省 AI 算力,让它把更多算力用在动作上; 坏处是 AI 可能把参考图里手绘风格的"黑白线条"带进生成结果(出现局部画风崩坏)。

可以丢张图给豆包/GPT 让它"转为黑白手稿用作分镜参考",一句话的事。


时长 / 长视频 / 剪辑

Q:一次生成多少秒合适?

看场景需要多少秒。Mx-Shell 习惯:

Q:怎么做长视频(超过 15 秒)?

小云雀网页端的「生成视频后续」功能。打斗这类动作戏要靠它接。

打斗段提示词不会写?

"打斗的提示词自己写,我不喜欢做打斗的我懒得写,可以让豆包帮你写了以后自己细化一下。"

Q:两个片段怎么衔接?

运动方向接。

"机器人丢了一个炸弹,炸飞了后面的尸潮,自己被推出画面一侧 —— 下个镜头就要从那一侧接进来。"

视觉上才会觉得是同一个运动延续。

Q:剪辑用什么?

剪映。没用复杂工具。

Q:后期要不要调色?

有些要。但 AI 出的视频文件色彩比特率很低,调色空间小。

"你调得太过,画面会脏、断层、乱码。不像现实中的相机拍出来可以调得很离谱。"

最佳策略:在场景图阶段就把色调定准,视频生成时尽量沿用,后期只做微调过渡。


字数 / 抽卡 / 复刻

Q:提示词超字数了?

Q:用同样的提示词为什么做不出和你一样的?

"我自己用同样的提示词生成出来的两个视频都会有很大区别。"

AI 生成本身有随机性。把同一段提示词当作抽卡的入场券,不是一锤定音。

Mx-Shell 单镜头抽卡数:

Q:《火焰恶魔》那个运镜怎么复刻?

"那个运镜属于意外惊喜,提示词就是这个版本,属于 AI 没有依照我的指令的接过,瞎猫碰上死耗子,我也无法复刻出来。"

接受随机性,挑卡比磨提示词更重要。


音乐 / 音效

Q:音乐是你做的吗?

不是。音乐是有版权的现成音乐,来自 Artlist.io

Q:音效呢?

"音效是 Seedance 沉浸式短片自带的。"

它生成视频时会自动配同期声、玻璃碎裂、开枪等环境音。 特殊音效要在提示词里写明,比如:

机器人面部表情切换带有科幻感音效

Q:配音怎么搞?

"全剧只有一句配音。"

如果只有一两句台词,没必要追求声音一致性,让小云雀自己选音色就行。 小云雀近期上线了声音参考功能,需要统一音色可以用那个。


灵感 / 学习

Q:故事灵感哪来的?

"我的故事创意灵感来自机器人总动员。"

观影、生活、小说、电视剧都行 ——

"你得有生活,才能有创造力。"

Q:写到一半没思路了?

"我做这部片子之前都没有完整的剧本。我都是跟朋友聊了一下,简单的拍做了两个镜头看到这个质感好像还 OK,才开始想要以什么开场。我边做边想边改。"

先做两个镜头试质感,再边做边写。比闭门写完整剧本再开干更适合 AI 创作。

Q:怎么入门 AI 短片?

Mx-Shell 自己是从 2026 年 1 月开始接触,自学摸索:

"我这里讲的东西可能很潦草,是因为我也是自学,没系统学习过。"

Q:要不要学剪辑?

。原因:

"AI 生成的视频不一定是完美的,可能某些片段你截一下,靠转场和特效拼起来,可以弥补 —— 同时也节约你的钱包。"


成本 / 周期

实测数据(Mx-Shell 自述)

项目数据
总周期10 天
总花费网传 ~3000 RMB,但本人直播改口称几万 / 两万多块
图片生成数约 400 张
视频镜头数约 200+ 个
提示词手写比例95%(只有打斗戏让豆包写的)
有没有完整剧本没有,边做边想

"3000 美金怎么可能?3000 人民币。" "几万块了吧?是按 G2 两万多块钱了吧?" "怎么去的 3000 美金啊?3000 块钱人民币。"

⚠️ 关于成本的实际情况:Mx-Shell 在同一段直播里对成本的说法前后不一致 —— 先确认是"3000 RMB",然后又改口为"几万 / 两万多 RMB"。 合理解释是:作品本身消耗的 token / 算力价值约 3000 RMB(这是他对外宣传的口径),但实际购买额度算上抽卡损耗可能达 2 万 +。 真正花费比"10 天 3000 元"传播口径要高。但即便按 2 万 RMB 算,也仍然远低于真人拍摄的 3 分钟短片成本。


杂项

Q:基础服装怎么定?

建议贴合战斗风格。

"哪有人穿着高跟鞋去打架的,添加的基础服装最好是贴合战斗风格的,沉浸感才会更强。"

Q:你的提示词里有错别字?

对。

"我的提示词好像有些错别字,大家拿到手可以自己检查一下。"

Q:你是什么专业的?

中专。摄影是他的副业兼爱好。

Q:会出新提示词吗?

看心情。

"博主还有正式工作和其他兴趣爱好,我也很享受原有的生活方式。"