视频播客功能介绍
Feb 19, 2025

您是否正在寻找一种快速、引人入胜的方式,将您的音频播客转化为充满活力的视觉体验?来看看全新的 视频播客 功能吧!现在,您可以将任何两人的音频对话转化为沉浸式视频播客,具备人工智能驱动的场景生成、可定制角色、智能镜头选择等功能。以下是它的详细工作原理:
1. 上传或获取音频
首先,上传音频文件(如.mp3、.wav),或者粘贴来自YouTube、TikTok和其他支持平台的链接。一旦您的文件进入系统,您就可以在我们直观的界面中预览并剪辑,聚焦于对话的精彩部分。

2. 选择场景和角色
接下来,选择一个场景作为您播客的背景,这可以是从温馨的演播室到虚拟新闻台的任何场景。然后,挑选两个 发言角色,这些角色可以来自您之前上传的图片库,也可以全新添加。

3. 人工智能生成的故事板
一旦您上传了音频并选择了角色,人工智能就会接手进行智能分段和自动镜头分配:
- 音频分段: 系统会分析对话流程,检测每个发言者说话的时间。
- 自动镜头选择: 每个音频片段都会匹配合适的镜头类型:
- 单人特写,聚焦发言者的表情
- 单人中景,平衡展示主持人
- 两人镜头,用于两人互动时
这些故事板无需人工干预即可创建,非常适合那些想要获得专业效果但又没有专业编辑技能的人。

4. 微调场景和声音
在故事板编辑器中,您可以根据自己的喜好细化每个镜头:
- 切换镜头类型: 从特写切换到中景,或者为两位主持人使用两人镜头。
- 为每位主持人选择不同的人工智能语音,如果您更喜欢不同的语气或风格。
- 交换角色: 即时交换每个片段中展示的人物,以获得最佳视觉效果。

5. 一键切换宽高比
是否在为多个平台创建内容?没问题。轻松在16:9的标准横屏视图和9:16的竖屏格式之间切换。场景、角色和镜头都会自动适应新的宽高比,确保您的视频在各个平台上都看起来很专业。

6. 生成最终视频
对故事板和设置满意吗?只需点击 生成,即可制作出完整的视频播客。快速渲染引擎会将所有元素整合在一起,包括您的背景场景、角色、音频和镜头转换。只需片刻,您沉浸式的、由人工智能驱动的视频播客就准备好吸引您的观众了!
准备播客音频及关键使用提示
1. 获取音频
- 没有现成的播客文件? 您可以使用像 谷歌的NotebookLM 这样的工具从文本生成语音音频。
- VisionStory很快也会提供类似服务, 让您可以在我们的平台上完全从文本创建播客。
2. 发言者分离限制
- 我们的系统目前无法完美分离重叠的声音。 如果两位主持人同时发言,语音转换功能可能无法准确工作。
- 为获得最佳效果, 使用每次只有一人发言的清晰音频。
3. 订阅要求
虽然每个人都可以上传播客音频,以生成由人工智能驱动的发言者、场景和镜头的故事板,但最终的播客视频生成功能仅对 专业版及以上订阅者 可用。如果您还不是会员,考虑订阅以解锁此功能。
4. 视频长度和积分
- 目前,生成的视频长度限制为10分钟,所有订阅级别均相同。
- 根据您的计划留意积分消耗;更复杂或更长的视频将使用额外积分。
为什么选择这个视频播客功能?
1. 用途广泛
- 内容创作者: 轻松为您的访谈或联合主持节目添加视觉元素。
- 营销团队: 在社交媒体上推广产品或主持引人入胜的讨论。
- 教育工作者和培训师: 以更亲切的风格创建引人入胜的课程总结或远程网络研讨会。
2. 人工智能驱动的编辑
节省数小时的手动剪辑和镜头选择时间。 算法为您处理技术方面的繁重工作。
3. 高度可定制
从选择背景到细化语音和场景宽高比, 您始终可以控制最终的外观和感觉。
4. 专业品质,轻松实现
无需高级编辑技能或完整的视频团队,即可获得精致、动态的视频内容。
只需几个简单步骤,即可将两人对话转化为沉浸式视频播客。得益于人工智能驱动的技术,制作专业、视觉上引人入胜的播客剧集从未如此简单!