1. 视频下载

推荐工具:Neat Download Manager (https://www.neatdownloadmanager.com/index.php/en/)(免费)、Internet Download Manager (IDM) (https://www.internetdownloadmanager.com/)(付费)或 FreeTube (https://freetubeapp.io/#download)(免费,开源)。不同视频可能需要不同工具。FreeTube 最通用但需要分别下载音视频;IDM 最便捷,建议购买正版(约100元);可先尝试免费的 Neat Download Manager。

2. 音视频转文字

使用阿里通义平台 (https://tongyi.aliyun.com/qianwen/) 的效率模块 (https://tongyi.aliyun.com/efficiency/home)。上传视频后转写自动生成字幕,下载 SRT 格式字幕文件。通义转写的字幕质量通常优于 YouTube 自动生成的字幕。

1. 选择 AI 模型

推荐使用最新、最强大的大语言模型,如 Claude 3.5 和 GPT-4。国产模型可能难以处理长篇复杂提示词,谨慎使用。

2. 翻译流程

将英文字幕和相关背景资料复制到 AI 对话工具中,使用文末的提示词模板进行翻译。仔细检查翻译结果,确保时间轴与字幕内容匹配。非顶级 AI 模型可能产生各种错误,影响翻译质量。

## 三、配音制作

1. 导入字幕到剪映等视频编辑软件。

2. 选择 TTS(文字转语音)引擎,可使用剪映内置功能或其他第三方 TTS 工具。

注:本指南假定用户具备基本的视频编辑和 AI 工具使用经验。如需更详细说明,请告知。

## 四、提示词实例

<prompt>

<task>

我将英语视频的转写文本<"文本文件" />发给你,

<文本文件>

1

00:00:00,010 --> 00:00:03,510

you ask for it,it hits here, flux in Forge

2

00:00:03,530 --> 00:00:06,200

So you can see up here we have this UI selection

3

00:00:06,260 --> 00:00:11,080

We have selected Flux here we have the Flux dev Bnb and F 4 checkpoint

4

00:00:11,090 --> 00:00:15,610

and we have a prompter regenerated cyberpunk sign that reads Flux in Forge

5

00:00:15,620 --> 00:00:16,940

And if I generate this again

6

00:00:16,990 --> 00:00:18,540

it's going to take about 12 seconds

7

00:00:18,550 --> 00:00:22,590

And then we're going to have a new flux image in Forge

……

【这里省略中间内容,就是个示例】

252

00:09:40,150 --> 00:09:40,940

thanks for watching

253

00:09:41,320 --> 00:09:41,690

see

</文本文件>

请将其翻译成中文,具体要求如下:

<TranslationRequirements>

- 原始文本可能有转写错误,请根据<Reference target="专有名词"/>、<Reference target="背景资料"/>等,确保翻译准确表达视频的内容。 

- 最终输出的结果应该用中文呈现,是非常的口语化,没有带一点翻译腔调,完全是本地化的中文表达方式,可以适度地创新,让字幕很有活力,因为我是一个可爱的女生,要根据字幕配音。

- 确保翻译成中文后与视频画面和音频的同步,总时长一致。

- 请严格按照srt字幕文件的格式要求输出结果:

<srt_format>

- 每个字幕片段以序号开始,后接换行符; 

- 序号后是字幕的起始和结束时间戳,格式为"小时:分钟:秒,毫秒",起始和结束时间戳之间用" --> "分隔,后接换行符;

- 时间戳后是字幕文本,可以单行也可以多行,多行之间用换行符隔开;

- 每个字幕片段之间用一个空行分隔。

- 请用Claude的artifacts特性再右边单独展示这个文档。

</srt_format>

</TranslationRequirements>

</task>

<专有名词>

专有名词保持英文:

- ancestral SD

- AuraFlow

- AnimateDiff

- automatic 1111

- batch size

- BrushNet

- Civic

- CivitAI

- CFG scale

- checkpoint

- Chibi

- ComfyUI

- conditioning

- ControlNet

- controlnet_aux

- ControlNet Union ProMax

- cosXL

- DDIM

- Differential Diffusion

- DenseDiffusion

- deis

- denoise

- Dream Shaper

- DPM adaptive

- DPM++ 2M

- DPM++ 2M Karras

- DPM++ 2MS

- DPM++ 3MS

- DPMPP_3M_SDE_GPU

- embeddings

- Euler

- Euler_cfg_pp

- Flux

- exponential

- exponential SGM

- GroundingDINO

- hugging phase

- Hugging Face

- HelloWorld XL

- insightface

- IP Adapter

- IP-Adapter

- IPAdapter

- Ic

- IDM VTON

- Inspyrenet-Rembg

- Karass

- latent space

- loader

- LoRA

- lanczons

- LexicatDat

- model page

- normal

- noise parameter

- noise strategy

- Nerdy Rodent:youtube channel of AI Tutorials

- pipeline

- Pixart Sigma

- Pixart Sigma 900M

- PowerPaint

- prompt

- proteus v0.4

- PhotoMaker

- Rybu

- SDXL

- seed

- segment anything

- softedge

- Stable Diffusion

- steps

- SUPIR

- tensor shape debug

- text prompt

- textual inversion

- time stepping

- token

- tokens

- tile

- UNI_PC

- UNET

- upscaled latents

- VAE

- word weighting

- WD14 tagger

专有名词翻译为特定中文:

- average: 平均

- base noise: 基础噪声

- batch: 批处理

- channels: 通道

- clip: 文本编码器

- conditioning average: 条件平均

- conditioning combine: 条件合并

- conditioning concat:条件拼接

- conditioning timestep:条件插入时间

- conditioning: 条件设定

- decode: 解码

- denoise:去噪

- dimensional size: 尺寸

- embeddings: 嵌入

- encode: 编码

- guidance scale: 引导比例

- inpaint: 局部重绘

- KSampler:K采样器

- latent: 潜在空间

- mask: 遮罩

- noise: 噪声

- outpaint: 扩图

- prompt: 提示词

- perturbed attention guidence:扰动注意力引导

- Queue Prompt:生成

- resolution: 分辨率

- sampler: 采样器

- scheduler: 调度器

- steps: 步骤

- strength: 强度

- tensor: 张量

- textual inversion: 文本反转

- variance: 方差

- word weighting: 词权重

</专有名词>

<背景资料>

【这部分就是给一些视频的背景资料,项目的主要说明,介绍等,不需要太长】

</背景资料>

</prompt>