通过全新的“预览音频”和“暂停”功能,体验更强的掌控力
Jan 12, 2025

要制作出高质量的视频内容,往往取决于一些微小的细节,比如一个单词的发音,或者戏剧性停顿的时机。我们很高兴推出两项新功能:预览音频和暂停,让您在生成完整视频之前,能够更加精准、灵活地进行操作。
为什么需要预览音频?
预览音频对于任何想要在使用积分创建视频之前,确保其文本转语音(TTS)旁白听起来完美无缺的人来说,都是一个变革性的功能。过去,您可能会直接从输入脚本跳到生成最终产品。虽然这种工作流程很方便,但没有太多微调的空间。而且,如果您发现了一个小错误,您可能已经花费了积分。有了预览音频,您可以:
- 验证发音和语调
聆听根据您的文本生成的完整音轨,确保其符合您期望的风格。 - 节省积分
在渲染视频之前发现音频中的错误,有助于您避免不必要的花费。 - 避免流式传输伪影
当音频在与视频同步时即时生成(“流式传输管道”),一些人工智能语音在开头和结尾可能会出现轻微的音量不一致。通过先使用预览音频,您可以避免这些伪影,制作出更精致的最终结果。
常见陷阱和文本注意事项:虽然TTS技术已经取得了长足的进步,但某些复杂情况仍然可能带来挑战。请特别留意:
- 专业或技术术语:医学、法律或科学术语可能需要额外的标点符号或拼写调整。
- 缩写词:确保TTS正确展开或发音。
- 货币和数字:叙述者可能会以意想不到的格式说出数字,或者忽略货币符号。
- 大量标点符号:句号、逗号和冒号会影响TTS处理语调和平缓节奏。
当您发现任何问题时,只需修改您的文本,再次运行预览音频,并在点击“生成会说话的视频”之前确认其完美无缺。
引入暂停功能
有时候,您可能希望放慢节奏以达到戏剧性效果、强调某个短语,或者精确处理棘手的单词。我们全新的 暂停 选项(通过“⏱ +0.5”图标访问),让您可以在脚本的任何位置插入短暂停顿。如果您需要更长的停顿,只需在文本中包含多个暂停图标即可。这种手动暂停可以:
- 提高清晰度:将冗长的句子分开,让听众清楚理解每个部分。
- 增强强调效果:在关键陈述或喜剧笑点之前营造悬念。
- 覆盖默认的TTS停顿:如果文本转语音引擎没有在您希望的位置停顿,或者添加了意外的停顿,手动添加停顿可确保最终的旁白按照您的设想流畅进行。
重要提示
预览音频使用基于字符的配额,该配额会根据您的订阅等级每月重置。一般来说,1分钟的语音大约是1000个字符:
- 免费版:500个字符(约0.5分钟音频)
- 基础版:1000个字符(约1分钟音频)
- 专业版:10000个字符(约10分钟音频)
- 高级版:50000个字符(约50分钟音频)
- 至尊版:100000个字符(约100分钟音频)
秒表功能提示:
- 使用秒表功能时,每个秒表代表0.5秒的停顿,您可以连续使用它们来创建更长的停顿,最长可达3秒。
- 提醒:避免在单个文本段中使用超过两个连续的停顿,因为这可能会导致人工智能产生意外的声音或伪影。
用例和实际好处
- 营销与广告
营销人员喜欢用简短而有力的台词激发好奇心,通常随后会跟上恰到好处的停顿。现在,您可以完善品牌信息,并在不浪费积分的情况下预览不同的台词表达方式。 - 在线学习与教学视频
教育内容中经常会出现复杂的术语或首字母缩写词。快速预览它们的发音方式,插入合适的停顿,确保学习者能够轻松跟上进度。 - 讲故事与旁白
富有戏剧性的旁白依赖于精确的节奏。恰到好处的停顿可以传达悬念或情感细微差别,而这是TTS自动生成的节奏并不总能完美实现的。 - 专业演示文稿
当您需要阐述某个观点时,比如在财务报告或公司推销中,发音错误的名称或数字可能会损害可信度。预览并添加停顿有助于确保语音轨道流畅、专业。