视频播客功能介绍

Feb 19, 2025

动态视频播客创建过程

您是否正在寻找一种快速、引人入胜的方式,将您的音频播客转化为充满活力的视觉体验?来看看全新的 视频播客 功能吧!现在,您可以将任何两人的音频对话转化为沉浸式视频播客,具备人工智能驱动的场景生成、可定制角色、智能镜头选择等功能。以下是它的详细工作原理:

1. 上传或获取音频

首先,上传音频文件(如.mp3、.wav),或者粘贴来自YouTube、TikTok和其他支持平台的链接。一旦您的文件进入系统,您就可以在我们直观的界面中预览并剪辑,聚焦于对话的精彩部分。

为视频播客上传音频文件

2. 选择场景和角色

接下来,选择一个场景作为您播客的背景,这可以是从温馨的演播室到虚拟新闻台的任何场景。然后,挑选两个 发言角色,这些角色可以来自您之前上传的图片库,也可以全新添加。

为播客选择场景和角色

3. 人工智能生成的故事板

一旦您上传了音频并选择了角色,人工智能就会接手进行智能分段和自动镜头分配:

  • 音频分段: 系统会分析对话流程,检测每个发言者说话的时间。
  • 自动镜头选择: 每个音频片段都会匹配合适的镜头类型:
    • 单人特写,聚焦发言者的表情
    • 单人中景,平衡展示主持人
    • 两人镜头,用于两人互动时

这些故事板无需人工干预即可创建,非常适合那些想要获得专业效果但又没有专业编辑技能的人。

播客的人工智能生成故事板

4. 微调场景和声音

在故事板编辑器中,您可以根据自己的喜好细化每个镜头:

  • 切换镜头类型: 从特写切换到中景,或者为两位主持人使用两人镜头。
  • 为每位主持人选择不同的人工智能语音,如果您更喜欢不同的语气或风格。
  • 交换角色: 即时交换每个片段中展示的人物,以获得最佳视觉效果。
微调播客中的场景和声音

5. 一键切换宽高比

是否在为多个平台创建内容?没问题。轻松在16:9的标准横屏视图和9:16的竖屏格式之间切换。场景、角色和镜头都会自动适应新的宽高比,确保您的视频在各个平台上都看起来很专业。

播客的宽高比切换

6. 生成最终视频

对故事板和设置满意吗?只需点击 生成,即可制作出完整的视频播客。快速渲染引擎会将所有元素整合在一起,包括您的背景场景、角色、音频和镜头转换。只需片刻,您沉浸式的、由人工智能驱动的视频播客就准备好吸引您的观众了!

准备播客音频及关键使用提示

1. 获取音频

  • 没有现成的播客文件? 您可以使用像 谷歌的NotebookLM 这样的工具从文本生成语音音频。
  • VisionStory很快也会提供类似服务, 让您可以在我们的平台上完全从文本创建播客。

2. 发言者分离限制

  • 我们的系统目前无法完美分离重叠的声音。 如果两位主持人同时发言,语音转换功能可能无法准确工作。
  • 为获得最佳效果, 使用每次只有一人发言的清晰音频。

3. 订阅要求

虽然每个人都可以上传播客音频,以生成由人工智能驱动的发言者、场景和镜头的故事板,但最终的播客视频生成功能仅对 专业版及以上订阅者 可用。如果您还不是会员,考虑订阅以解锁此功能。

4. 视频长度和积分

  • 目前,生成的视频长度限制为10分钟,所有订阅级别均相同。
  • 根据您的计划留意积分消耗;更复杂或更长的视频将使用额外积分。

为什么选择这个视频播客功能?

1. 用途广泛

  • 内容创作者: 轻松为您的访谈或联合主持节目添加视觉元素。
  • 营销团队: 在社交媒体上推广产品或主持引人入胜的讨论。
  • 教育工作者和培训师: 以更亲切的风格创建引人入胜的课程总结或远程网络研讨会。

2. 人工智能驱动的编辑

节省数小时的手动剪辑和镜头选择时间。 算法为您处理技术方面的繁重工作。

3. 高度可定制

从选择背景到细化语音和场景宽高比, 您始终可以控制最终的外观和感觉。

4. 专业品质,轻松实现

无需高级编辑技能或完整的视频团队,即可获得精致、动态的视频内容。

只需几个简单步骤,即可将两人对话转化为沉浸式视频播客。得益于人工智能驱动的技术,制作专业、视觉上引人入胜的播客剧集从未如此简单!